OpenAIは9月25日、ChatGPTのバージョンアップを発表しました。PlusプランとEnterpriseプランのユーザー向けに今後2週間でロールアウトを予定。
iOSとAndroidアプリではChatGPTと音声と画像を含む会話が可能になり、その他のプラットフォームでは、画像を含んだ会話ができるようになります。自転車のサドルの高さを変える方法をChatGPTに聞いて、この場所でいいかと写真で提示すると、それは違うと返答。使う道具はこれでいいかとツールボックスの写真を見せると、その中からアーレンキーを使えという指示が飛んでくるといった具合です。
モバイルアプリでの画像を含む会話がどのようなインタフェースであるかは、下記のX(Twitter)動画で見ることができます。
OpenAIはこの機能を課金ユーザー以外にも順次開放していくと述べており、開発者も利用可能にする計画なのでAPIでの提供もいずれスタートすることでしょう。
同社はさらに、自分の話し声を本人の声のまま別の言語に置き換えることも可能にしていて、同じく9月25日、Spotifyにポッドキャスト通訳機能を提供していることを明らかにしています。本人音声通訳は、一部の著名ポッドキャストの部分的なエピソードで、まずは英語からスペイン語でスタートし、フランス語、ドイツ語が続く予定です。現時点で日本語への言及はありません。