OpenAI が会話生成AI 『ChatGPT』 と音声テキスト化モデル『Whisper』のAPIを開発者向けに提供しました。
さまざまなアプリやサービスに、自然な会話でユーザーの質問に答えたり、指示したタスクをこなす機能を導入できるようになります。
今回OpenAI が外部の開発者向けに提供したのは、なんでも答えてくれるAIとして話題になったChatGPTの現行バージョンでも使われている gpt-3.5-turbo モデル。
昨年末から大幅な効率化に成功したことで、価格は従来のGPT-3.5モデルの10分の1にあたる 1000トークン / 0.002ドルに低下しました。1000トークンは英文で750語程度。
また多くのユーザーを抱えるアプリへの組込みなど、大量のリクエストが見込まれるユーザーには、Azure上に専用インスタンスを用意するサービスも提供します。
ChatGPT / gpt-3.0-turbo モデルと同時に、音声を聞き取る Speech-to-text モデルの Whisper もAPIを提供します。Whisper は2022年9月にオープンソース化されていますが、API経由では0.006ドル/分の低コストかつ高速に利用できます。
このほか、AIモデルのAPIをより広く開発者向けに提供するにあたり、
API経由で入力されたデータは、デフォルトでトレーニングに使用しないように変更。ChatGPTに個人情報や機密性の高い情報を話して外で漏洩するリスクをなくします。従来はオプトアウト式でしたが、新たにトレーニングに使っても良い場合のみオプトインに。
ロンチ前レビューが不要に。自動モニタリングを強化したため。
ドキュメンテーションの整備
デフォルトで30日間のデータリテンション。オプションで変更可能。
ChatGPTやWhisperを組み込んだアプリとしては、Snapchatが会話相手になったりアイデアの元になるカスタマイズ可能なチャットボット My AI をSnapchat+ユーザー向けに提供済み。
そのほか学習アプリや英会話アプリ、ショッピングアプリ等々で、個々のユーザーのニーズにあわせた提案をする機能として導入が進んでいます。
なお、マイクロソフトが 「新しいBing」やWindows 11タスクバーの検索に組み込んだのは、ChatGPT 3.5をベースに検索用にカスタマイズしたモデルと、マイクロソフト独自の手法を組み合わせた技術。OpenAIに数十億ドル規模の投資をするマイクロソフトだけに、一般向けAPIよりも進んだモデルや技術を使っています。