サンフランシスコのスタートアップHumaneが開発した手のひら投影型AIデバイス「Ai Pin」に注目が集まっています。
私が暮らす米国では4月から出荷が始まり、前回の記事ではHumane Ai Pinを手にした第一印象についてレポートしました。
今回はその後のアップデートについて書いていきます。
🔳周りからの反応
Ai Pinを胸に取り付けていると、「最近ネットでそのデバイスよく見かけるんだけど一体何なの?」と声をかけられることが増えました。YouTubeのレビュー動画が話題になったためAi Pinの存在は知られたようですが、そもそも何のためのデバイスかわからないという人が多いようです。
先日、部屋の修理作業に来た人からも同じ質問を受けました。日本語から英語への音声翻訳のデモを見せると彼の目が輝きました。シリコンバレーには英語が母国語でない人がとても多く、作業時に英語が通じずトラブルになることがあるので音声翻訳はぜひ使いたいとのこと。またスマホを手に持たなくていいのは作業時には好都合らしい。確かにこうしたニーズにはピッタリだと思いました。
🔳すぐに始まった品質改善
前回の記事では、現段階のAi Pinはリリースされたばかりでまだまだ多くの改善や機能追加が必要だと書きましたが、Humaneの改善への取り組みは予想以上に早く始まりました。4月23日には改善すべき優先項目としてバッテリー寿命と熱管理、応答待ち時間の短縮、よりスムーズな体験のため、精度調整の3点に取り組んでいること、そしてAi Pinの最新ファームウェア1.1.3を近日中にリリースすることがアナウンスされました。
最新ファームウェアへのアップデートはOTA(Over The Air)で行われます。夜寝る前にWiFiに接続した状態で充電パッドにAi Pinを置いておけば自動的にアップデートが始まり、翌朝には最新バージョンになっているという仕組みです。実際に4月29日から全てのAi Pinに対する1.1.3へのOTAが始まりました。
またHumane公式のDiscordコミュニティでは新機能のβプログラムへの参加者募集が始まっていて、次のリリースに向けた新機能の開発が進んでいることが伺えます。
🔳話題のGPT-4oへも即座に対応
5月13日にOpenAIがChatGPTの新バージョンGPT-4oをリリースし話題となりましたが、その2日後にHumaneはAI PinでGPT-4oが使えるようになったとアナウンスしました。これはHumaneのクラウド側での変更のみのため、ユーザーはAi Pinのファームウェアのアップデートや設定変更を行う必要がありません。
OpenAIがデモで使っていた表情豊かな音声に変わるのかも?と思ったのですが、音声はこれまでのAi Pinで使われているもののままでした。ユーザーが気づくことなく最新のAIエンジンが使えるようにしていくということなのでしょう。
私が使った限りでは音声翻訳時の回答が早くなった気がしますが、ユーザー側で切り替えられないので比較はできません。GPT-4oにより何が改善されたのかHumane側から明確にして欲しいです。
(▲OpenAIの発表2日後にGPT-4oが使えるようになった)
🔳ベータ版のVision機能を試す
Ai Pinは一本の指で押さえながら質問をすると、音声入力による対話型AIサービスを利用できます。これはAi Pinの主要機能の一つでAi Micと呼ばれています。これに加えて内蔵カメラで撮影した画像を入力として問い合わせを行うことができるVision機能があります。これはまだ正式リリース前のベータ版なのですが、Humaneのポータルサイトで設定を有効にすることで利用できます。
表示された説明によるとVision機能はGoogle Geminiを利用。HumaneはOpneAIとの関係が強い印象でしたが、複数のAIサービスの中から最適なもの選んでAi Pinの各種機能を実現していくようです。
(▲HumaneのポータルサイトでVision機能を有効にした)
Vision機能を使うには「Look at what's in front of me(私の前にあるものを見て)」または「Look at what I'm holding(私が手にしているものを見て)」と音声入力する必要があります。これらのフレーズを契機にAi Pinのカメラで撮影が始まり、画像から認識した内容を音声で回答します。
実際に試してみました。次の写真のように「マルちゃんの赤いきつね」を手に持って「Look at what I am holding」と聞くと「You're holding a container of Nissin Cup Noodles(日清カップヌードルの容器を持っている)」と回答がきました。正しくは無いですが、カップ麺という点では合ってます。なかなかいい線いってると言えるでしょう。海外の旅行先で未知のものに出くわした時に使えば何らかのヒントが得られそうです。
(▲赤いきつねでVision機能を試す。Ai Pinで撮影)
🔳通話・メッセージ機能を試す
Ai PinはT-Mobileのモバイル回線と接続されているので、この回線を利用した通話及びメッセージの送受信が可能です。通話先の指定やメッセージは音声入力で行い、受けたメッセージは音声読み上げだけでなく手のひらに投射して確認することもできます。連絡先はApple、Google、Microsoftからインポートします。
実際に使ってみると、音声入力したものを自然なメッセージに自動で修正してくれるのでとても便利だと思いました。送信する前に修正したメッセージを読み上げて、これで送信するか確認してきますので、もう少しカジュアルにして欲しいとか、この件を追加してほしいと指示することも可能です。
ただしAi Pinに割り当てられる電話番号は、普段自分が使っているスマホとは異なる新規の番号です。連絡先はインポートできるもののこの新しい番号を相手に伝えない限りは、知らない番号からの着信もしくはメッセージとして無視されてしまいそうです。相手に対して自分のスマホの番号として通知できる仕組みが欲しいところです。
🔳Ai Pinのポータルサイトhumane.center
AI Pinのデバイスなどの詳細設定や、サブスクリプションの変更はHumaneが提供するhumane.centerというポータルサイトにログインして行います。ここではこれらの設定以外にも、過去にAi Micを利用した履歴などが確認できるほか、Ai Pinで撮影した画像や動画をダウンロードできるようになっています。動画についてはバージョン1.1.3からダウンロード時に手ブレ補正がかけられるようになりました。
基本的はAi Pin単体でできるようになっているものの、ディスプレイやキーボードを持たないAI Pinではできない部分をhumane.centerのポータルサイトで補完するということなのでしょう。ユーザー視点でいえば現実的なアプローチだと思いますが、スマホのない世界をビジョンに掲げていたHumaneとしては、ここにアクセスするためにスマホ(またはPC)が必要だという指摘を受けるかもしれません。手のひらに投影する小型レーザープロジェクターがカラーで高精細になっていく未来があるのでしょうか。
(▲humane.centerにログインした時の画面)
🔳Humaneのアーキテクチャ「CosmOS」へ期待
小型で胸に取り付けるだけのAi Pinは、音声入力や画像入力でAIのアシストを受けたり、手のひらにレーザーで投影しジェスチャーで操作したり、これまでにない経験を提供してくれる興味深いデバイスです。またAi Pinを使い始めてみると、何となくスマホの大きさや重さが気になるようになり、スマホを持ち歩かなくてもいい未来が実現できたら良いかもと思うようになりました。
先日Ai Pinを取り付けるのを忘れて外出してしまったのですが、すぐに気づいたものの取りには帰りませんでした。iPhoneやApple Watchであれば間違いなく取りに帰っていたことでしょう。違いは何かと考えてみると、Ai Pinがまだ自分にとって必要不可欠な存在になっていないからだと思います。無いと困ると感じさせるキラーアプリが必要なのでしょう。
ではそのようなキラーアプリって何?という問いに答えるのは難しいですが、やはりパーソナルアシスタントなのかもしれません。例えば車を運転しながら、ジムで運動しながら、キッチンで料理をしながら、仕事のメール、チャット、スケジュールなどの要約をスマホを手に取ることなく確認して、必要に応じて返事も完了できたら理想です。他にも自分に代わってニュースやSNSで起きていることを要約して対話しながら確認できたりすると、クリエイティブなことに使う時間を増やせるかもしれません。
HumaneはAi Pinを含めた彼らのアーキテクチャ全体を「CosmOS」と呼んでいます(6月に公開予定のホワイトペーパーの抜粋が閲覧可能です)。
Ai Pinという小型デバイスだけに注目するのではなく、CosmOSというAIサービスのプラットフォーム全体が進化していくと考えると様々なことが実現できるのではないかと思えてきます。Humaneの今後の展開に目が離せません。