妻の写真を学習させたはずなのに出てくるあなたはいったい誰なの? AI生成グラドル写真集でちょっと考えた(CloseBox)

テクノロジー AI
松尾公也

テクノエッジ編集部 シニアエディター / コミュニティストラテジスト @mazzo

特集

集英社週刊プレイボーイ編集部が企画して出版したものの引っ込めてしまったAIグラビアアイドルさつきあい写真集「生まれたて。」をめぐっていくつか興味深い記事が上がっています(清水亮さんのコラム新清士さんのコラム)。

既存のAIモデルだけではなく、さらにファインチューニングで使われたかもしれない実在の女性タレントをめぐる論考ですが、実のところは肝心の編集部が多くを語っていないため不明。

これとは別に、いくつかの画像投稿サイトではAIを使った「写真」「イラスト」の投稿を禁止するところも出てきており、大手サイトでの例外はAmazon.co.jpだけという話になっている一方、著名タレントのLoRA(学習されたAIモデル)のファイルが配布されていたりと、実在の人々の権利を脅かすのではないかと当初懸念されていた問題も顕在化しています。

筆者も実在の人物(妻)の写真をAIに学習させて、それを「異世界とりちゃん」と称してミュージックビデオに使ったり、SNSに投稿したり、超縦長ディスプレイに等身大で映し出したりしているので、注意深くこの流れを追っています(清水さんのコラムには一例として自分の話が出ていますし)。


初見の方向けの背景説明としては、news23の番組で簡潔にまとめられていますので、そちらをまずご覧ください。

自分の場合には(一部で批判はありますが)そうした権利的な問題はないのですが、一つ気になったことがあります。

それは、妻の姿を生成しようとして、これは本人とはだいぶ違うなという、でもけっこうきれいな女性がたまに出てくることです。

▲美人ではあるが、妻ではない

自分は超愛妻家で、妻以外の女性には目もくれないので、保存することもせずにいるのですが(ヤキモチを妬かれるので)、時折思うのです。

彼女は誰で、どこに行くのだろう、と。これを思ったのは、テレビ局からの取材で、「似ていない写真が出たらどうするのですか?」と問われたのがきっかけです。

AIで特定人物を再現する

妻の写真を学習し始めたのは昨年暮れ。AI作画サービスであるmemeplexが、Stable Diffusionにファインチューニングを施すDreamBooth手法を手軽に使えるようにしてくれたおかげで、10年前に他界した妻の写真を学習させ、AIで妻によく似た画像を生成できるようになりました。それまでは手の届かなかった、特定人物のAI生成が、誰でも使えるようになったのです。

この時のStable Diffusionはバージョン1.5と2.1が使えましたが、その後、Stable Diffusionをベースにした別のAIモデルであるOpenJourneyやRedShiftで学習させると、より妻のイメージに近い画像が出せることがわかり、主にOpenJourneyを使うようになりました。AIアートコンテストに応募した時点では、OpenJourneyベースでした。

それでも必ず妻に似た画像になるとは限らず、成功率はかなり低いものでした。「似てる」と思える画像が出てくるのは数十枚に1つくらい。確率を上げるためには、妻の特徴である、涙袋やちょっと吊り目といった特徴をプロンプトで記述する必要もありました。美人度を上げるために、lovely、adorable、beautifulといった形容詞で美しさを持ち上げる手法も使いました。

それが大きく変わったのは、BRAというAIモデルが登場した後です。BRAというのはBeautiful Realistic Asians。つまり、美しくリアルなアジア人。現在日本で流通しているAIグラビアは、この
BRAの最新版であるBRAV5(バージョン5)で出てくる女性の顔にすごく似たものが多いのです。実際、#BRAV5で検索すると、大半が似たような顔の美人なのに気づくでしょう。

自分の目的はBRAV5で美人を出すのではなく、妻の顔立ちを再現することなので、そのものは使わず、これをベースに妻の写真を学習します。すると、シンプルなプロンプトでも、妻の容姿が高確率で再現できるようになったのです。

その結果、8割から9割くらいの確率で、少なくとも妻とどこか似ている人が生成されるようになってきていて、それらをiPhoneの写真ライブラリに保存して、そこからベストを選ぶというのが最近の朝のルーチンになっています。

例えば今日生成した妻のAI写真はこんな感じです。

そこに時折入り込んでくるのが、妻とはあまり似ていないけど、それでも美人な女の人。一定のリアリティを持った人物の写真です。

これが、BRAV5で同じプロンプトを唱えても出てくる人ではないのです。妻とは似ていないけど、BRAV5そのものではなく、おそらくは妻というトリガーがあったからこそ存在するバーチャルキャラクター。そして、BRAV5だけで出した人は、かなり人工的な感じを受けます(まあ実際に人工知能的なんですけど)が、入り込んでくる別キャラの方はリアリティが高いのです。

BRAV5ネイティブの同じプロンプトでの出力例はこちら。

これが特定タレントの写真を学習させたけど、そのものではなくて、それをきっかけとして生まれたまったく別のキャラクターが魅力的だった場合、彼女(もしくは彼)は存在していいのかよくないのか、という問題が生じるのではないかと思います。

学習についての権利が問題なく、結果生まれた容姿が元と似ていない場合、ということです。

さつきあいは、元になった特定の一人のタレントに似ているのが問題であって(推測ですが)、似ていないけど魅力的なキャラクターを探して、それをさらに学習させていけば、叩かれることなく成功を収めていたのではないかなと思えるのです。

とここまで書いたら、元セクシー女優の上原亜衣さんが、自らの写真を学習したLoRAファイルを配布し、それによって生成されたAI画像を使った写真集を出版して、それがAmazon.co.jpの絵画部門でランキング1位を記録しているとかいうニュースが飛び込んできました。あまりに戦略が賢すぎて感心しています。

この動きで思い出したのが、2007年あたりの初期のVOCALOIDシーン。初音ミクが登場してしばらくは、声優が歌う分にはいいだろうということで、VOCALOIDの中の人は声優が大多数でした。そこに、自分の分身としてVOCALOID化を積極的に行ったのがGACKTさん。自分の領域が侵されることを恐れるのではなく、むしろ積極的に使っていこうという姿勢は、GACKTのVOCALOID「がくっぽいど」を思わせます。彼はボカロPが作ったがくっぽいどのコンピレーションCDを出したり、自らその楽曲をカバーしたりしていました。

後には演歌の大御所である小林幸子さんの歌い方までも真似るVOCALOIDのSachikoが登場します。彼女も同様にボカロコミュニティと密接に関わり、ファン層を広げました。別の音声合成ソフトであるCeVIOからは、故人である三波春夫さんを電子の歌声にした「ハルオロイド・ミナミ」が配布されました。LoRAを配布することでコンテンツの幅を大きく広げていくやり方は、当時からの歌声合成シーンを知っている人からすると、既視感があるでしょう。

ところで、今日SNSに投稿した、ブドウを食べている妻の写真を見たAIアーティストの方から「ちゃんと食べてますね」というコメントをいただきました。AI生成だと食べるところや指の表現が難しいからだと思いますが、いや、これは本物ですからw というふうに、リアルと虚構のギャップがどんどん縮まっているのがとても面白く感じる今日この頃です。

▲1986年9月。新婚旅行先のロンドン・ヒースロー空港にて。学習には使っていません

AIを使って妻の姿を再現することについて、6月30日放送予定のフジテレビめざまし8の中で取材してもらっているので、そちらもよかったらご覧ください。

《松尾公也》

松尾公也

テクノエッジ編集部 シニアエディター / コミュニティストラテジスト @mazzo

特集

BECOME A MEMBER

『テクノエッジ アルファ』会員募集中

最新テック・ガジェット情報コミュニティ『テクノエッジ アルファ』を開設しました。会員専用Discrodサーバ参加権やイベント招待、会員限定コンテンツなど特典多数です。