OpenAI が、AIチャットサービスChatGPT にウェブや外部サービスとの連携機能を追加するChatGPT plugin を発表しました。
ChatGPT がウェブ検索や外部データベースから最新の情報を得て答えたり、ウェブサービスを通じて買い物や予約などを実行したり、サードパーティーのアプリと直接連携したり、自分の書いたコードを実行して複雑な計算を正確に実行する、ファイルの入出力などが可能になり、ChatGPTの実用性・有用性が劇的に向上します。
2022年末の公開以来、ChatGPTはまるで人間のように自然な文章で何にでも答えてくれる会話AIとして、またお喋り以外にも指示に応じてさまざまなタスクをこなせるAIサービスとして大きな注目を集めてきました。
しかし一方で、内部で使われる大規模言語モデル(LLM)の仕組みから、「トレーニングが完了した2021年までの情報しか知らない」「論理的な理解は苦手」「一定の計算能力はあっても、複雑になったり単に桁が増えると怪しくなる」「テキストしか出力できない」といった制約があることも、さまざまな使われ方やユーザーによる実験で広く知られるようになりました。
新たに発表された ChatGPT Plugin は、プラグインを介して外部のサービスと連携させることで、テキスト対話AIサービスとしての ChatGPT だけでは不可能だったさまざまなことができるようになります。
OpenAI が発表した純正プラグインは「ウェブブラウザ」「コードインタプリタ」。
およびサードパーティープラグインの第一陣として、旅行計画やフライト・ホテル・レンタカー予約の Expedia、KAYAK、買い物や価格比較の Instacart、Klarna Shopping、Shop、レストラン予約の OpenTable、学術計算やナレッジベースのWolfram、アプリ間連携サービスのZapierなど10種以上が公開されました。
OpenAI自身がホスティングするウェブブラウザプラグインでは、ChatGPTがウェブ検索してリアルタイムの情報や、トレーニングに含まれない情報を得て回答できるようになります。
コードインタプリタは、ChatGPTが会話中に使えるサンドボックス実行のPythonインタプリタ。ChatGPTはプログラミング言語の膨大なサンプルをトレーニングに用いているため、ある程度の範囲で実際に実行可能なコードを書くことができますが、従来は書かせたコードを人間がコピペして実行環境に持ってゆく必要がありました。
コードインタプリタプラグインを使えば、ChatGPTに自然言語で指示してプログラムを書かせ、自分で実行させ、結果を返させることができます。ファイルのアップロード・ダウンロードにも対応するため、ファイルを与えて指示して、テキスト以外のデータを出力させることや、ファイルの変換等も可能です。
そのほか OpenAI は、開発者が各自のデータにアクセスするプラグインを書くための基盤として、「Retrieval」プラグインをオープンソース公開しています。こちらはユーザーが個人や組織のデータを ChatGPT で使えるよう、外部のデータベースやドキュメント、メール等にアクセスするためのテンプレート的なもの。
こちらを元に自前のプラグインを書けば、ウェブブラウザ経由ではなく直接自前のデータを ChatGPTで使えるようになります。
ChatGPTプラグインはアルファテスト段階として、ユーザーおよび開発者に段階的に提供予定。公式ページの待ちリストに登録することで、まずは少数のプラグイン開発者および ChatGPT Plusユーザーから開放します。
アルファ期間の終了後はAPI経由のユーザーにも開放し、サードパーティーのアプリやサービス自体に組込みを可能にする計画です。
段階的に提供する理由は、フィードバックを得て安全性や有用性を確保するため。
ChatGPT、あるいは大規模言語モデルには、ユーザーが予測できない挙動をすることや、トレーニングに含まれない誤った情報をみずから作り出して確信してしまうハルシネーション現象といった課題があり、またプロンプトインジェクションなど悪意あるユーザーからの操作にも影響を受けてしまいます。
従来はせいぜい不適切なテキストを吐き出してネットの晒し者になる程度でしたが、ChatGPTがユーザーからの指示でみずから外部サービスに、つまり実世界に干渉できるようになると、さらに大きな悪影響や被害につながる可能性もあります。
OpenAIではこうした懸念に対処するため、サンドボックスやファイアウォール実行、ウェブブラウザでは Bing の検索APIで不適切コンテンツのフィルタリングなど、さまざまな予防的手段を講じています。加えて、AIがサービスやアプリを使い実世界に影響を与える際のガイドラインやポリシー、規制はこれから技術的・社会的な議論や合意が必要になるとして、そのための準備段階となる資料や取り組みについても公表しています。
実際に ChatGPT でプラグインを使うには、ChatGPT Plus に登録した上で招待待ちが必要ですが、プラグインを作るための仕様ドキュメンテーションはすでに一般公開中です。
ChatGPTを含むAIテクノロジーの社会的影響についての論評には、大変だシンギュラリティだ人間超えだ!とかなり盛り気味に驚いてみせるものもあれば、大規模言語モデルは「本質的に」これができないから大したことはないと断じてみせるものもありますが、本質的に計算が苦手な生き物である人間がコンピュータを使うように、ChatGPTが苦手なことの少なくとも一部は、プラグインという道具を使うことであっさりと乗り越えられそうです。
GPT-4とウェブ検索と多数の独自手法を組み合わせて正確に答えるはずの Bing チャットがすぐ適当なことを言うように、プラグインがあってもハルシネーションや論理的な理解といった難問は残りますが、あの手この手のハックで無理やりテキストチャット以外のタスクをさせる苦労は大幅に軽減することになります。