AIで「普通のおじさん」を生成したフェイク新聞の作り方。そこから考える「普通」への疑い

テクノロジー AI
kogu

ゲームとWebのフリーランス開発者。3DCGからゲーム開発の世界に入り20年。今は生成AIの変化を追いかけて日々実験しています。

特集

生成AIの出力画像を元にCGで作った新聞っぽいフェイク画像をXに投稿したところ、想像以上の反響がありました。気軽な実験のつもりで説明も雑過ぎたため、伝わりにくかったり誤解されたりした部分もあるようです。どのように、なぜ作ったのか補足します。

どのように作ったか

今回のフェイク新聞、作り方はかなり手抜きです。こうした制作に慣れている方なら30分もかからないでしょう。今はまだ多少専門性を求められますが、1年もすると「頑張れば誰にでも」程度になっているかもしれません。

実験としては、ぱっと見新聞だと感じてもらえなければ成立しません。しかしフェイクを作るのではなく、フェイクが作れる可能性の提示が目的です。画像が単体で流れていく可能性を考えると何かしら対策が必要で、強固な透かしを入れるか、不可欠な割合で虚偽性を組み込むかなど考えられます。今回は気軽な実験のつもりだったので、よく見ればフェイクと気付ける間違いやズレを使うことにしました。

写真風画像の生成

まず、写真風の画像を画像生成AIとして有名なStable Diffusionで生成しました。これは自分のパソコンで動作する画像生成AIであり、昨年から続く生成AIの火付け役のひとつです。

Stable Diffusionにはいくつかのバージョンがあり、今回の画像は公開されている最新のStable Diffusion XL(SDXL)で生成したものです。現在の画像生成AIは全く万能ではなく、意図した画像を生成するのに手間がかかり、対象によって品質も大きく変わります。

Stable Diffusionが公開された当初から、個人的に「どこにでもいそうなおじさん」の生成を試してきましたが、非常に難しい状況が続いていました。ありふれた日本人的な容貌の人物が、学習元であるデータセット内で相対的に少ないことや、そもそもの表現が美しさを考慮することなどからです。

SDXLによってそうしたおじさんの出力もかなり改善したのですが、最近開発されたDeep Shrinkの効果もあって高解像度でも破綻しにくい生成が可能に。少なくとも私のワークフローでは、かなり安定して最低限求めていた品質で生成できるようになりました。

これは公園にいるおじさんを生成した数十枚のひとつで、他にも無数のおじさんが日夜生成されています。

まだまだ不完全さも残るし、どんなおじさんも自由自在とはいきません。けれど技術の進展によって、かなり自由なシチュエーションで、ありふれたおじさんたちが描けるようになっています。

Photoshopでの加工

生成しただけの状態は新聞らしくなさすぎるので、コントラストをやや浅くしたり、リサンプルで引き伸ばしてからカラーハーフトーンフィルタで網点風に。印刷機にかけるのではなく3DCGとしてレンダリングするため、こうした事前加工を行います。

Stable Diffusionの生成した生物は、眼球を見ると露骨にくずれている場合があります。虹彩が歪んでいたり、ハイライトがありえない形をしていたり。これもフェイクと分かる程度に編集します。最後に収まり良いよう6:4でトリムして加工は完了。

もしより本物の新聞に近づけるなら、スクリーンの形状や線数を合わせたり、再生紙に乗った色味の再現を考慮するでしょう。

文章の生成と作成

文章も全てAIだと受け取った方が多かったのですが、実は下部の記事本文は全て人力です。言及しておくべきでした。死ぬまで公園で過ごしたい膝谷さんに「こんな恐ろしい人物がAIの産物で良かった」といった反応いただいたのですが、すみません、人の産物です。不謹慎な人物像も私の好みから出たものです。年齢設定は容貌より若いかなと思いましたが、仕事でままならず逃避した公園でも厄介者な59歳ならこんなのものかとそのままに。

フェイク新聞には2つの文章があり、上部の見切れているものはChatGPTで生成しました。「地方紙のユニークなニュースを」などと入力したもので、文字数や細かい表現の調整をしましたが、8割方生成された結果が残っています。謎の「​市民バフンドル」は語感が気に入ったので残しました。カピバラの市長選はどうなったんでしょうか?

内容はフェイクと分かるよう、読み進めれば新聞としてありえないものにしました。ChatGPTでは応答をかなり重ねないとそうした意図の確実な反映は難しく、また字数は原理的に厳密な扱いができません(ChatGPTと日本語であそぶ – 技術の手帖)。気軽な実験や字数などの要件が強い場合には、まだまだ書いた方が圧倒的に早そうです。

しかしそうした妙な要求がなければ、字数以外はかなりカバーできるでしょう。特に実際の新聞にありそうな小綺麗な話は得意で、すでに量産も可能だと思います。実際の記事のテキストを例として十分にコンテキストに詰め込めば、その媒体の個性も反映できるかもしれません。

たとえば以下の文章は、もっとまともな新聞風でChatGPTで生成しました。AIの出力のまま無編集です。

オフィスビルの間で、独自の音楽スタイルを追求する佐藤美紀さん。彼女は、街中の公園で穏やかな音楽演奏を行い、都市の喧騒から一時の安らぎを提供している。佐藤さんの活動は、公園を都市生活のオアシスに変える試みから始まった。彼女は、音楽を通じて人々の心に平和をもたらし、日常のストレスから解放することを目指している。

佐藤さんは、公園での演奏を通じて、訪れる人々に新たな音楽体験を提供する。彼女の音楽は、特にストレスを感じているオフィスワーカーに人気がある。佐藤さんは、「公園での音楽演奏は、都市の生活に新しい色を加えることができる」と語る。

地域住民やオフィスワーカーからは、佐藤さんの活動が高く評価されている。多くの人々が、彼女の音楽によって心が癒され、公園が都市生活の中で特別な場所になったと感じている。記者として、佐藤さんのこのような創造的な活動が、地域コミュニティに新しい風を吹き込んでいることを見るのは非常に感動的である。

自動車が行き交う街中で、裸足の生活を実践する田中一郎さん。彼は、地元の公園で裸足歩行を推奨し、自然とのつながりを深める活動をしている。田中さんの取り組みは、都市生活における健康と自然との調和を模索することから始まった。彼は、裸足での歩行がもたらす心身の利益を広め、都市の喧騒の中での心の平穏を提案している。

公園における裸足歩行は、田中さんの手によって新たな動きとして注目され始めた。彼は特に、足の感覚を通じて自然を感じることの重要性を訴えている。田中さんは、「裸足で歩くことで、人々は地球とのつながりを再発見できる」と語る。

地域住民からは、田中さんの活動が好奇心を呼んでいる。多くの人々が、彼の提案する裸足歩行に興味を示し、公園での体験を通じて新たな発見をしている。記者として、田中さんのこのようなユニークな活動が、地域コミュニティに新しい視点をもたらしていることを見るのは興味深いことである。

公園でクリケットに情熱を注ぐ伊藤健太郎さん。彼は、地元の公園でクリケットの普及活動とともに、健康的な弁当の提供を行っている。伊藤さんの取り組みは、スポーツと健康な食生活の組み合わせを通じて、地域コミュニティの活性化を目指すものだ。彼は、クリケットの楽しさを伝えると同時に、バランスの取れた食事の重要性にも注目を集めている。

伊藤さんは、特にクリケットの試合中や練習後に、手作りの弁当を参加者に提供することで知られている。彼の弁当は、栄養価の高い食材と独自のレシピで作られ、プレイヤーたちにエネルギーを供給する。伊藤さんは、「クリケットとともに健康な食生活を楽しむことで、より豊かな生活が実現できる」と語る。

地域住民からは、伊藤さんの活動が高く評価されている。彼の提供する弁当は、公園でのクリケットの魅力をさらに高めており、多くの人々が健康的なライフスタイルに興味を持つようになった。記者として、伊藤さんのこのような斬新なアプローチが、地域コミュニティにプラスの影響を与えていることを見るのは心強いことである。

これらはいずれもChatGPTの次のセッションで生成しました。どのような要求をしているかすべてそのまま見られます。

https://chat.openai.com/share/0621bc87-9c67-4e00-b33a-83d9867b5b6f

ChatGPTっぽさやワンパターン感はつきまといますが、5分で作った入力ならこんなものでしょう。より出力に広がりをもたせるには、オリジナルのファンタジー世界事典を生成AIで作る – 技術の手帖で試みたような、背景となる世界の呼び水をもっと増やすのは必要でしょう。特徴のよく出ている過去の記事を抜粋して事例として与えるのも効果ありそうです。そうして得た出力を、パターンごとに翻案させる専用の別セッションを用意するのも良さそうです。

重要なのは5分でこうした出力が得られることでなく、5分で出力の仕組みが用意できることです。10倍かけての50分かけてもっとそれらしい品質の高い生成が可能になるなら、2~3日で埋め草記事などもすべて生成する土台ができてしまいます。

笑えたりゾッとしたり、読み終えればフェイクと分かるなんて注文さえなければ、もう新聞記事風の文章を量産できる環境は、誰でも使えるものになってしまっています。

Illustratorで新聞風に

こちらも一見本物のようで、よく見ればフェイクとわかる程度にしました。よく見ればこれ紙面のどこ?となるような雑なレイアウトでも、切り抜かれると気付きにくいのだと実感します。書体は新聞本文では見かけないリュウミン、文字種制限もなし、禁則はデフォルトからさらに弱めました。平体は弱めで行間はやや広く、小さい画面でも読みやすい程度にしました。

ちなみにこの手の人物紹介コーナーとして朝日新聞の「ひと」が有名ですが、いろんな新聞で似たようなものがあるのを初めて知りました。そのまま真似ても良かったのですが、フェイクになるよう適当にほわほわした「つなぐ」としました。優しい温かい雰囲気が共通だったので、それっぽいぼかしの色を置いて飾りに。

人名はこの段階で決めましたが、確実に同姓同名を避けられて、ありえなくもない程度のものを考えるのは結構面倒です。記者の名前は雑になりすぎました。実在しない可能性が十分に高い人名のジェネレーターが欲しいです。

こうして作った画像を書き出し、もう一度Photoshopでぼかしたノイズを乗せたりして、質感を新聞紙に似せます。本気のフェイクを目指すならまずこの段階で新聞紙をテクスチャ化して、凹凸用の画像なども作るでしょう。私は本格的な新聞の組版経験はありませんが、そこを合わせたり校正・校閲の支援ツールなどを使えば、残る違和感も消せそうです。

Cinema 4Dでのレンダリング

作成した新聞風の画像は、3DCGのツールを使って実物らしく描きます。気軽な実験なので、なるべく手をかけずに済む方法を採りました。

新聞自体は単なる平面な形状に貼り付け、折り目で曲げます。更に細分化し、周波数の異なるノイズで頂点単位の凹凸を付け手抜きを誤魔化します。また細かな表面処理の凹凸でもノイズを乗せて紙質が出るようにします。

新聞を置いた机はCC0ライセンスのテクスチャをambientCGからもらってきて適当に。ほとんど写りませんが、やはりリアリティは向上します。

ライティングはいかにもスナップ写真として室内で撮られた風に、補助の面光源と、低い角度からのスポットライトひとつ。上下で不均質な明るさにして雑な撮影っぽく。構図も不自然なサイズを誤魔化せるよう見切れさせます。あとは柔らかい光と陰影用の計算を有効にしてレンダリングします。

最後にもう一度Photoshopで、ノイズ、かすかな手ブレ用の移動ボケをかけ、全体をやや色味浅くハイコントラストに調整して完成です。

単なる板ポリでなく、紙の切断部分面の毛羽立ちをアルファで与えたり、新聞紙らしいシェーダーを選んだりすれば、より新聞らしくなるでしょうか。ライトに画像を使いつつインクの荒い光沢感が出ればさらに寄与するかもしれません。

なぜ作ったか

このように作った画像ですが、生成AIを使ったいろいろな実験をいつもしていて、今回もその一環でした。そのため全体的に言葉足らずで、実験の意図がきちんと説明できないままに広まっています。「この画像のプロンプト教えてください」とか「新聞を殺す気か」という誤解した問い合わせもあり、何を意図したのか説明します。

なぜおじさんを生成するのか

画像生成AIが手元で動かせるようになって以来、私はずっと特別でないおじさんを生成し続けています。新しい画像生成サービスやモデルが出るたびに繰り返しているので、もしかすると凡庸なおじさんを世界一生成しているかもしれません。

私の画像生成の用途は、ゲームや教育などへの実用と未来を考えるきっかけとしてがひとつ。自分に刺さる視覚表現を掘るのがひとつ。そしておじさんと、おじさんが象徴するものがひとつです。

なぜありふれたおじさんを生成するのか。もちろんモチーフとして好みだとか、自分自身がおじさんだから気安いとかの理由はあります。しかしもう少し掘り下げると、日常を描く性能の基準としての興味からです。

画像生成AIは大量の既存の画像を学習して、はじめてまともな出力が可能です。その大量な画像がゴミだらけでは、生成される画像もゴミだらけになります。十分に高品質な画像をデータセットとする必要があります。

高品質な画像とは、相対的に被写体や構図その他の表現が美しいものでしょう。美しくないものを生成したいという需要は、それほど高くないはずです。そうした高品質な画像の中で、人物の描写として最も不足しそうなものを括るとすれば、それはきっと、ありふれたおじさんではないでしょうか。

是非はともかく、美しいと評される人物像の多くは女性です。「美しい」で分かりにくければ素敵と言い換えてもいいかもしれません。素敵な人物像ならば、若さ、可愛さ、優しさ、強さなどなど挙げられます。中年男性でも、若々しい爽やかだったり、渋くて重みある場合は素敵です。しかし、ありふれたおじさんそのものを素敵と評価する可能性は、人物の画像を分類する際、最も低くなるでしょう。

学習量が少なくなるであろう、どこにでもいる、特別でない、素敵とは言い難いおじさんを自由に描けるとしたら、その画像生成AIはかなりの人物描写力を獲得していると考えられます。

なぜ新聞なのか

ニュースの主流がテレビ、ネットと移っていっても、一次情報源として新聞が持つ仕組みへの信頼性は、イメージとしてまだまだ強いでしょう。新聞をほとんど手に取ったことのない世代でも、そこにある事実性に暗黙の前提を置いているのではないでしょうか。

相対的にデマの割合が少ないと期待される新聞を題材にすることで、生成によるフェイクの危なさが表現できると面白いだろう、というのが選んだ理由でした。新聞が今後は信頼ならないといった話ではなく、むしろ新聞が比較的信頼されているからこそ、良い題材たりえたのだと思います。

もちろん新聞がフェイクに手軽だったのも大きいです。今回の画像は生成時間を入れても1時間以内で出来上がりましたが、これがテレビや雑誌だったらもっとかかっていたでしょう。新聞っぽさの浸透が私を含め大多数に深く行き渡っているからこそ再現のコストが低いのでしょう。

これまでだって、適当な人物の写真を編集し、全国紙風の偽記事を作ることは出来ました。AIの力を借りたといってもほぼ写真風の画像部分だけですし、3DCGや手描きでだって同等の描写は可能でしょう。つまり何かまったく新しいことが提示されたのではありません。それでも大きな反響があったのは、漠然としたAIの脅威と可能性、新聞というメディアの揺らぎと安定、そして身近そうなニュースが嘘だったらという現実感からかもしれません。

今までだって十分できたフェイクに生成AIが加わるまずさは、圧倒的に手軽な出力コストにあります。練習と機材は必要だが十分可能だったピッキングによる鍵開けが、コンビニで買える道具で小学生でも可能になるのに近い。コストという障壁が無くなることで毀損される社会の仕組みは多く、その臨界が近いと感じています。コストが高いことで棚上げできていた「すべてのニュースをフェイクとして疑う」というコストを、各人が払う未来がありえます。

生成される「普通」

ところで本当に試したかったのは、将来の新聞の信頼性ではありません。フェイクの可能性提示は重要ですし、新聞という様式を選ぶだけで強い影響があったという発見も大きいです。たくさんの誤解にも触れられました。しかし根本には、もうちょっと広く、普通そのものへの疑いというリスクについての検討があります。

今の生成AIはそれなりにコストがかかる道具です。目まぐるしく発展しているとは言え、たとえば手元のスマートフォンで写真を撮るような手軽さはありません。しかしいずれ写真と同等か、あるいはもっと生成に溢れた社会がやってくると考えています。

その時には今回人力で行った作業も全てAI任せに出来ているかもしれません。「うらぶれた中年男性が地元の公園に救いを見出し執着して周囲と衝突するという内容の、地方新聞の『つなぐ』というコーナーの切り抜き写真を」と頼むだけで、冒頭の画像が生成できるようになる。そんな未来まで、どれぐらいの猶予があるでしょうか。少なくとも今現在、被写体は選びますが画像単体はかなりの所まできています。写真も動画も音声も文章も、いつかすべてが違和感ない状態で生成できるとしたら。

それでもまだ、メディアは信頼性を担保する仕組み作りの動きがあり、通信の証明書のように検証可能な提示はできなくありません。プラットフォームによって、メディア由来の情報には自動で検証データが表示されるようになるでしょう。一定の権威性を求められる情報は、全て改竄や生成の混入ないことを証明していくしかないでしょう。ではそうした構造の無い、もっと気軽な身近で日常的なフェイクが溢れたら?

詐欺やデマ、フェイクニュースのように何かしら目的があって行われるフェイクは、その目的自体がヒントとなり疑う機会も増えます。ところが個人やそれに近い規模で行われるフェイクには、社会的推測の難しい動機が無数に存在します。

個人的フェイク

自撮りの”補正”はすでに普及し尽くしています。同じぐらい気軽に、旅行や食事やイベントの写真も存在から疑わざる得なくなったら。承認欲求や宣伝程度なら害は少ないかもしれませんが、これまでの情報のあり方からすれば途方もないノイズ混入の始まりです。

遠方に暮らす家族が、いつも元気な日常の写真や動画を送ってくれていたのに、それが心配させまいと悲惨な生活を隠すフェイクだったら。本人は現実としか感じていない、架空の人物やお店について量産して流し続けられたら。オンラインで長年対話してきた相手が、全く実像とかけ離れていたら。気軽すぎる「普通」の生成は、個人の抱え持つ歪みを、本人的正しさとして具現化します。

親しい相手から届く日常すら信頼に値しなくなり、自分の撮った写真すら、いつ生成して理想を投影したのか分からなくなる。文章も画像も動画も声も。ついでに、発信ベースのビッグデータは極端に価値を落とす。

そうした日の到来に今のままの社会では耐えられず、せめて法は整備が必要だと感じています。とはいえ利便がはっきり見えすぎる技術を、法で封鎖するのは不可能でしょう。となると法にできるのは緩めの線引ぐらいで、個人や意識や教育やサービスで対応を埋め、無数に生じるフェイク込みの社会に変えていくしかない。そうした地力の弱い社会は極端に動揺するかもしれません。

架空のありふれたおじさんは、こうした「普通」の象徴であり、分かりやすい新聞という様式の力を借りて様々な確認ができたことは幸運でした。私は生成AIにどっぷり浸かり、ゲームや個人的創作への活用を模索しています。それはこの技術が普及せざるをえないと考えたからで、フェイクのような大きな問題があっても、全世界でまとめて止める術はなさそうです。だから今後も、どこにでもいそうなおじさんを生成し続け、普通の壊れる日を追いかけてみます。


この記事は、テクノコアが運営するメディア「技術の手帖」掲載の記事をテクノエッジ編集部にて編集し、転載したものです。

《kogu》

kogu

ゲームとWebのフリーランス開発者。3DCGからゲーム開発の世界に入り20年。今は生成AIの変化を追いかけて日々実験しています。

特集

BECOME A MEMBER

『テクノエッジ アルファ』会員募集中

最新テック・ガジェット情報コミュニティ『テクノエッジ アルファ』を開設しました。会員専用Discrodサーバ参加権やイベント招待、会員限定コンテンツなど特典多数です。