米カリフォルニア州、メンローパークにあるキャンパスには見覚えがある。昔、サンマイクロシステムズが入っていたビルだからだ。ワークステーションとJavaで一斉を風靡したサンは、その後、オラクルに買収された。そのキャンパスを引き継いだのがMeta(Facebook)だったのは知っていたが、ビジネス向けソリューションを提供していた彼らとは異なり、Metaの本業はSNSをはじめとする"ひととひととがつながること"で生まれるモメンタムを大切にすることである。
と、小難しいことを思いついたのは、Metaの本社キャンパスで開催された「Meta Connect」という開発者向けイベントに参加したからである。
なぜQuestシリーズに力を入れるのか、なぜAI技術に投資を行うのか。その答えの先には、常にSNSの存在がある。生成 AIが生み出す文章や質問に対する答え、あるいはイラストなども"驚き"ではあるが、Metaにとっての生成AIとはコミュニケーションを円滑に行うための道具なのだ。
それはリアル空間とバーチャル空間を結びつけるQuest 3などにも通じるMetaのDNAなのだろう。
Meta製LLMの長所を生かした AIアシスタント
今回の取材前、ソフトウェア開発者たちから聞いていたのは、Metaがオープンソース化したLlama 2という大規模言語モデル(LLM)の性能がとても良いということだ。
Llama 2にはパラメータ規模が異なる4種類が公開されているが、彼らがもっとも評価していたのは、事前学習と強化学習のバランスを取ることが容易なことだと話していた。もちろん、オープンソースでその振る舞いを把握しやすいということもあるのだろう。
たとえばChatGPTでは数字に弱い面があり、想定外の推論に迷い込んだときに予想外の回答をすることがあるため、安全策のため答えさせないといった対策を施すそうだが、Llama 2では事前学習も活用はするものの、強化学習で学ばせた内容をきちんと答えさせることができるという。
用途にもよるが、専門的な内容に限ったカスタムLLMを作る際などに、より個性的で専門性の高い回答を自信を持って答えさせるといった作り方をしやすい。たったひとつの万能AIを作ることは難しくとも、用途を限定しての使い方ならばLlama 2の方が性能を出しやすく、また自社サーバで運用もできるなど柔軟性が高いことが魅力だという。
いきなりMetaの話からズレているようだが、今回、Metaが披露した新しいAIは、そんなLlama 2の特徴を引き継ぎつつも新たに発展させた技術も盛り込み、その上でEmuという画像生成 AIを組み合わせている。
Llama 2の開発は実に実直なもので、上記のように業務用途でも好まれているが、Meta自身はこれをSNSを通じたコミュニケーションをより楽しく、深みのあるものにしようとしている点が興味深い。
後述するように「Meta AI(ChatGPTのようなもの)」を利用し、Meta Quest 3のようなVR/MRデバイスやRay-ban Meta Smart glassといったデバイスを通じて、あるいはスマートフォンのアプリなどを通じてAIアシスタントを利用できる。
このMeta AIは画像生成のEmuも組み合わせ、具体的な画像で答えてくれるようだが、さらに興味深いのは、個性を持たせたカスタムLLMを多数用意して個性的なアシスタントを選べることだ。
28種類のカスタムAIアシスタント
Llama 2の特徴を言い換えれば、個性的で専門性のあるカスタムLLMを作りやすいということなのだが、これをMeta自身は"キャラを立たせる"という面で使いこなしていることが面白い。
単に質問に答えるだけのAIではなく、より個性的で、質問者の意見や興味に関心を持ち、逆に質問をすることもあるという。Meta AIの中だけではなく、Instagram、Messenger、WhatsAppを通じて、これらのAIとでメッセージのやり取りを行えるという。しかもグループメッセージも可能だ。
ちなみにキャラクターのモデルとなっているのは米国で著名な人たちで、そのものズバリの名前ではないものの、学習モデルの元になっている人物は明らかになっている。日本で知られている人物には大坂なおみがいる。彼女はアニメに夢中で修行中のセーラー戦士というキャラ設定のTamika役の学習モデルだ。他にも料理のコツを教えてくれるシェフがいたり、スヌープドッグが演じる"ダンジョンマスター"もいる。
なお、今の所、事前学習モデルとして共有されている知識は2023年よりも前(2022年末まで)だが、今後はマイクロソフトBingの検索結果を反映した会話を行う改良を追加する見込みだそうだ。
コミュニケーションにアクセントを加え、起伏ある楽しい会話を演出しようというのは、やはりSNSを主業務とするMetaらしいと言えるだろう。
彼ら自身、Llama 2をオープンソースで開発していることに関して「開発速度を大幅に上げることに寄与している」と話し、メリットしか感じていないとのことだが、それもそのはずで、LLMをビジネス領域で活用するという方向には向いていない。また、Llama 2が個性的に仕上げやすいLLMになっている理由や背景も、こうして彼らが実装している様子を見る限り納得できるだろう。
ただしMetaはすでにその先を見ている。
"個性的AIの構築"をサポートするツールを提供
事前にキャラクター設定された AIモデルを用意すると同時に、Metaは「AI Studio」というパーソナリティを持つ カスタムLLMを構築するツール、プラットフォームを開発、提供する予定だという。
このツールを使うとFacebook MessengerやWhatsAppを通じて、個性的な応答ができる AIキャラクターを構築できるようになる。このツールは数週間以内にリリースされる見込みだが、さらに来年を目処に企業が自社ブランドについて詳細を語れるカスタムLLMを構築できるようにする。
将来的には多様なメッセージング、チャットサービスを通じて、そうしたキャラクターの色付けをした AIメッセージングサービスが容易に構築できるようになる。その先にはエンドユーザー自身が、個性的な AIを構築するための"サンドボックス(安全な他人には影響を与えない遊び場のようなイメージ)"を提供し、メタバースの中に新しい個性として配置できる、といったビジョンを持っているようだ。
Metaの構築するメタバースに、自分が作ったキャラクターがNPCとして配置され、メタバースに自分自身がいない時には、そのキャラクターが応答するといったSFのような世界観の入り口に我々は立っているのかもしれない。
画像生成AIも"Meta的"に
Metaの発表したEmuは極めて軽量で、5秒以内に画像を生成できる画像生成AIだが、これを用いてMetaは順次、Facebook Messenger、Instagram、WhatsAppのステッカー(日本でいうところのスタンプ)を生成可能にしていくという。(順次開放されるため利用できるタイミングは不明)
「ニコニコ笑っているお寿司」といった寿司を擬人化したものや「楽しそうにアライグマがバイクに乗ってるところ」といったプロンプト(実際には英語で入力する必要がある)で独創的なスタンプを作れる。
またInstagramでは"restyle"と"backdrop"という二つのAIツールが導入される。
前者は髪型や服装、あるいはペットの毛並みなど、被写体のスタイルをAIで独創的に変えるもので、テキストのプロンプトで画像を独創的なものにできる。「60年代風のパンクでサイケなファッションにして」と指定して自分の姿を変えてみたり、芝生に寝そべった写真の背景に「たくさんの子犬に囲まれている」と入れると子犬たちと昼寝する自分の写真が出来上がったりするといった具合だ。
実際には事前学習されたイラストなどのデータに画風が依存する可能性が高いかもしれないが、まずは少しでも早く試してみたいものだ。
AIキャラクターと同じく、この機能も順次、公開されていく。手軽に画像生成AIでコミュニケーションを豊かにという発想は、他のどの企業とも異なる発想で、やはりMetaならではのものと言えるかもしれない。