OpenAIが12日間にわたってライブストリーミングで新技術の発表を行うという「12 Days of OpenAI」、その初日であるDay 1では、GPTの最新モデルとしてo1(フルバージョン)を披露し、月額200ドルの新しいサブスクリプションプラン「Pro」追加を発表しました。
YouTubeのライブストリーミングにはOpenAIの共同創業者であるサム・アルトマン氏がo1の開発担当者たちとともに登場。フルバージョンのo1が、これまでの最新モデルであったo1-previewからどの程度改善されたかを説明しました。
■o1(完全版)
数学コンペティション、コーディングコンペティションではo1 previewから大幅に正確性が高まっています。修士レベルの科学問題ではわずかに上がっているだけのようですが、o1フルバージョンではマルチモーダルになった点は大きな改善です。
宇宙空間におけるデータセンター構築に関する手描きのラフスケッチをo1に見せて、その問題点の解決策を聞くデモを行いました。
冷却のために必要な施設の規模を計算するところまで回答しています。
Proサブスクリプションで使えるo1 Proでは、さらに大きな計算資源を使うことで、より高度で正確な回答が得られるとしています。
■Proサブスクリプション
本日から追加されたPro有料プランは月額200ドル。PlusやTeamと同じく年間支払いコースはありません。
Plusでできることに加え、
GPT-4oとo1への無制限アクセス
高度な音声(Advanced Voice Mode)への無制限アクセス
より多くの計算処理を使用するp1-proへのアクセス
が可能です。
Plusプランの記述も変わり、o1とo1-miniへの制限付きアクセスの記述が追加されており、すでに利用できます。
科学、コーディング利用者以外のメリットとしては、高度な音声モードの利用時間が無制限になる点は大きいかもしれません。Plusユーザーでも現在、1日の使用時間は数十分に限定されているので。
12 Days of OpenAIの間に、Proプランで機能追加が出てくるとアルトマン氏は述べているので、残りの11日も目が離せません。
なお、今回のYouTubeの内容をGoogle Geminiに読み込ませて概要を出させてみました。
このビデオは、OpenAI の「12 日間の OpenAI」シリーズの初日を紹介しています。このシリーズでは、同社は 12 営業日の間毎日、新しい AI モデルや機能をリリースまたはデモします。
最初の日に発表された主なものは 2 つあります。
O1 モデルのフルバージョン: これは、以前のプレビューバージョンよりも高速でスマートで、マルチモーダル入力(画像とテキストの両方)を処理できます。数学、コーディング、一般的な質問への回答において、GPT-40 よりも大幅に優れたパフォーマンスを示します。
ChatGPT Pro: 月額 200 ドルのこの新しいサブスクリプション層では、O1、GPT-40、高度な音声モードなどの OpenAI の最高のモデルに無制限にアクセスできます。また、最も難しい問題に対してさらに多くの計算能力を使用する「O1 Pro モード」も含まれています。
ビデオでは、O1 の速度、精度、マルチモーダル機能を示すデモが行われています。また、O1 Pro モードが難しい化学の問題をどのように解決できるかも示されています。
OpenAI は、ChatGPT Pro にさらに多くの機能を追加し、O1 を API で利用できるようにすることを計画しています。開発者向けの新しい機能には、構造化出力、関数呼び出し、開発者メッセージ、API 画像理解などが含まれます。
要約すると、このビデオは OpenAI の最新の AI の進歩、特に O1 モデルと ChatGPT Pro サブスクリプション層に焦点を当てています。これらの進歩は、AI の機能を向上させ、より幅広いアプリケーションに利用できるようにすることを目的としています。
■200ドル支払ってProプランにしてo1 pro modeを試してみた
200ドル(実際にはPlusとの差額)を支払って、Proプランにスイッチしてみました。
o1 pro modeでどのようなことが可能なのか、サンプルをいくつか出してもらいました。
■高度な音声との対話が保存可能に
今回の発表にはありませんでしたが、iPhone版ChatGPTアプリの高度な音声(Advanced Voice Mode)と音声会話をしていると、右上に共有アイコンがあることに気づきました。
「Share Clip」という、ChatGPTとの音声対話を保存できる機能です。これまで、iPhoneやMacの画面収録機能ではChatGPTの音声を保存できなかったのですが、Share Clipを使うと、高度な音声とのセッションを、自分の音声も含めて画面でエクスポートすることが可能です。