OpenAIが12日間、新機能を発表する「12 Days of OpenAI」、6日目はChatGPTのAdvanced Voice Mode(高度な音声)の新機能について。
モバイルアプリのカメラや画面を共有しながら音声エージェントと会話することが可能になりました。
(▲高度な音声で、カメラや画面の共有しながらの会話が可能に)
また、音声エージェントにサンタクロースが加わり、会話をすることもできます。
(▲高度な音声キャラにサンタが加わった)
高度な会話モードの右上に雪印のアイコンが表示されているので、それをクリックすると、サンタモードに突入します。さっそく会話をしてみました。
途中で不具合もありましたが、対話の様子を収録して、それをこのように共有することもできます。
ビデオ会話の方は、ボイスモードに入ったときに左下にビデオカメラのアイコンが出てきて、スマートフォンのカメラを使って画面をChatGPTと共有して会話を続けられるというもの。
これはローリングアウトすることになっていますが、筆者のところ(Proモードですが)ではまだ利用可能になっていません。
追記:自分のiPhoneアプリにビデオカメラのアイコンが表示され、ビデオモードが利用できるようになりました。最初の会話は英語のままで、日本語に切り替えてくれませんでしたが、OpenAIのYouTubeビデオを見ながらサンタと話ができました。
(▲画面の左下にカメラアイコンが表示され、クリックするとビデオモードに入る)
OpenAIの発表ビデオには何人映っているかサンタに聞いたところ、4人と回答。そこにトナカイがいるのでは?と聞くと、あれは鹿の角をつけた人間だと答えました。
自分の画面をChatGPTと共有しながら対話もできます。
これもやってみました。XのタイムラインをChatGPTと共有しながら音声で対話を続けるのは非常に楽しいものでした。自分は流しているだけでも、ChatGPT側で流れている話題を拾ったりしてくれます。
画面共有には、画面下部の「……」をクリックしてScreen Shareを選択して実行すると、iPhoneの画面が共有されます。チャットの間は音声会話ができるので、アプリを切り替えながらでも対話を続けることが可能。
この辺りは、昨日Googleが発表し、Google AI StudioのStream Realtimeで実現していることなので驚きはないですが、モバイルアプリですぐにできるのはメリットです。