現在アップル製品の音声アシスタントを起動するには、「Hey Siri」と呼びかける必要があります。これをアップルがもう少しシンプルにして、「Siri」だけにする変更に取り組んでいるとの噂が報じられています。
こうした言葉は「ウェイクワード」と呼ばれ、要は音声AIアシスタントを覚醒(ウェイク)させるキーワードです。アップルに有力な情報源を持っているBloombergのMark Gurman氏によれば、数カ月前から従業員を対象に「Siri」のみのウェイクワードをテストしており、必要なトレーニングデータを収集中。計画通りに行けば、2023年~2024年にロールアウトする見通しです。
アルファベットでわずか3文字の「Hey」を取り去るのは簡単そうにも思えますが、この切り替えは技術的なチャレンジでもあり、AIに相当な量のトレーニングを積ませ、根本的なエンジニアリング作業も必要。
ウェイクワードを「Siri」だけにするのがなぜ難しいのか? それは短いフレーズを、様々なアクセント(なまり)で読まれても理解できることが必須だから。「Hey Siri」という2つの単語があれば、システムが読み解くための手がかりを得やすく、正しくキャッチできる可能性も高まるという背景を説明しています。
「Hey Siri」から「Siri」への移行が上手く行けば、単に「Alexa」(またはスタートレック風に「Computer」、そして「Amazon」)というだけで済むアマゾンAlexa機器の使いやすさに追いつけるはず。かたや、いまだに「OK Google」や「Hey Google」と2語を言わせるGoogleアシスタントにも差を付けられるというわけです。
とはいえ、マイクロソフトの音声アシスタントCortanaもウェイクワードを「Hey Cortana」と「Cortana」のどちらでも起動する仕様に切り替え、それから間もなくサービス終了したことも覚えておきたいところ。
ウェイクワードを短くすると、ユーザーの声を聞き取れず無反応だったり、逆にテレビの音声などに過剰反応して暴発する可能性も高まりかねません。アップル社内では意図してないのにSiriが誤作動することを「誤トリガ」と呼んでおり、それだけに「Hey」を削ることのハードルの高さは自覚していそうです。Apple Watchを口元に寄せれば「Hey Siri」のウェイクワードなしで命令できますが、その発声タイミング習得にはなかなか難しいものがあります。
Siriの改良はウェイクワード短縮に留まらず、サードパーティ製アプリやサービスに深く統合し、ユーザーを理解して正しい行動を取る能力を底上げする狙いもあると指摘。これについてはユーザーのデータ保護やプライバシーを重視するアップルの方針が人工知能を育てる上で足かせになってるとの調査結果もありました。
Gurman氏は、複数のアップル製品がある場合、どの機器でSiriを使いたいかを音声で指定できれば「さらに良い変化となる」とも指摘しています。これが個人の単なる願望なのか、それとも何らかの情報をつかんだ上での仄めかしかは不明ですが、うっかり「ヘイSiri、○○時にタイマーセット」と言うとセットしたくないiPadまで反応する事態は1日も早く根絶を望みたいところです。