人工知能研究団体Open AIが、テキストから画像を生成する人工知能「DALL・E 2」に新機能”Outpainting”を追加しました。すでにある絵や写真の、フレームの外側をAIによって描き足す機能です。
リリースに添付された画像はフェルメールの「真珠の耳飾りの少女」ですが、AIがフェルメールの画風に合わせて、追加された独自のオブジェクトの描画においても陰影やハイライトの付け方を模倣して、誰も知らない額縁の外側の様子を描いています。
この画像を生成したアーティスト、オーディスト・カンプ氏は、AIが生成した絵のパーツを選定し、望ましくないものについては生成しなおして絵画を拡張していきました。つまり、この画像はAIが一発で描き足したのではなく、テキストから画像を生成するのと同様に、人が望むようなビジュアルを示しつつ、拡張されたということです。
DALL・E 2はこれまで、ユーザーが入力したテキストの内容に従って1024 x 1024pxの正方形の画像を9枚出力する(またはアップロードした画像を入力したテキストで編集する)だけでした。"Inpainting"と呼ばれる機能を使って、出力された画像に修正を施すことはできたものの、大きな画像を作るには個別の画像編集ソフトを用いなければなりませんでした。
Outpainting機能を使えば、ユーザーが持つクレジットに応じて自由に画像を拡張することができます(ユーザーは最初の月は50枚、その後は毎月15枚分の画像生成クレジットを無料で使えます。それ以降は15ドルで115クレジットを追加購入可能)。Outpaintingを使用する場合、最初の画像生成に1クレジット、その後に描き足す部分も区画ごとに1クレジットがかかります。
Outpaintingを使用すると、DALL・E 2は4つの描き足し案を提案します。ユーザーはそれを選んで追加していく格好になります。ただAIが適当に生成するのではなく、「影、反射、テクスチャなど、画像の既存の視覚的要素を考慮に入れ」、「画像のコンテキストを維持」して絵柄を提案してくるため、まったく最初から1枚の絵だったかのように既存の区画とつなぎ合わせられます。
MidjourneyやStable Diffusionなど、いまやテキストから画像を生成するAIツールはいくつか種類があり、それらを使用したユーザーはこぞってSNSでその出来映えを自画自賛しています(厳密には"自画"ではない気もしますが)。そんななか、DALL・E 2のOutpaintingは他のテキスト描画AIとの差別化の点でも興味深い機能追加と言えそうです。
ちなみに、Outpainting機能を試したい場合はまずDALL・E 2の登録ユーザーになる必要があります。DALL・E 2はいまだユーザー数を限定しており、新規にユーザーになるには順番待ちに並ぶ必要があります。