OpenAIが、AI画像生成ツールの新バージョン「DALL・E 3」を発表しました。DALL・E 3は、入力したテキスト文を従来より忠実に、生成するアートへ反映することが可能になっています。
テキストの文章をAIによって解釈し、それを元に画像を生成するDALL・Eは、第2世代のDALL・E 2でも、いくつか言葉をスルーしてしまうことが多いという問題がありました。OpenAIの研究者らは、最新バージョンではそうした不具合を改善し、コンテキストをはるかに理解できるようになったと述べています。
DALL・E 3の大きな変更点としては、ChatGPTとの統合が挙げられます。これにより、DALL・E 3に入力するプロンプトをChatGPTとの対話で生成し、そのまま流し込むことが可能になりました。詳細なプロンプトを自分で考える必要はなく、ChatGPTが作ってくれるので、いままで効果的な生成用の文章を書けなかった人にとっては非常に便利になったと言えそうです。
また従来と同じプロンプトで生成しても、画像のクオリティが旧バージョンより向上しているとOpenAIは主張しています。
なお、OpenAIは、DALL・Eの安全性を向上させ、アルゴリズムのバイアスを削減するための新しい取り組みも行っています。たとえば、著名なアーティストのスタイルを模倣するような画像のリクエストは拒否するようになっていたり、アーティストが将来的なOpenAIの画像生成モデルのトレーニングに自分の画像を使用しないようオプトアウトが可能になっています。
DALL・E 3はChatGPT PlusおよびEnterpriseの顧客を対象に、10月より提供開始予定。またこの秋の後半ごろには、LabsとAPIのユーザーにも提供される予定です。