OpenAIのWhisperを採用した「ポケトーク for BUSINESS」発表、ソフトウェア化したポケトークの新戦略とは(石野純也)

テクノロジー AI
石野純也

石野純也

ケータイライター/ジャーナリスト

  • homepage
  • facebook
  • X

慶應義塾大学卒業後、新卒で出版社の宝島社に入社。独立後はケータイジャーナリスト/ライターとして幅広い媒体で執筆、コメントなどを行う。ケータイ業界が主な取材テーマ。

特集

ソースネクストから分社化したポケトークは、3月14日、「ポケトーク for BUSINESS」の新たな戦略やサービスを発表しました。

同社は、22年10月にPCで利用できる「ポケトーク同時通訳」を発売すると予告していましたが、製品投入が遅れていました。今回はこの発売にあたり、改めて「同時通訳」を紹介するとともに、新たに「カンファレンス」や「ムービー翻訳」を加えた3製品をポケトーク for BUSINESSとしてブランディングした格好です。

▲ポケトークは、ビジネスシーンに活かせる「ポケトーク for BUSINESS」を発表した。現時点では、「同時通訳」「カンファレンス」「ムービー翻訳」の3つで構成されるシリーズだ

ポケトーク for BUSINESSは、その名の通り、個人、法人のビジネスユースに特化したポケトーク。翻訳機として抜群のシェアや知名度を誇るポケトークですが、こちらはその機能をソフトウェア化したものです。同時通訳は、Zoomなどのオンライン会議に活用できるほか、PCのマイクで相手の声を聞き取ってその場で翻訳が可能。人間が行う同時通訳のように、相手の声に少し遅れて被せるように音声で翻訳した文章を読み上げてくれます。

▲PCで利用する同時通訳。音声に加え、字幕も表示される

昨年の発表時にβ版を試した際に、アップルの発表会を同時通訳で聞いてみましたが、精度はまずまず。細かな部分での間違いはありましたが、少なくとも、発表会に登壇した各キーパーソンがどんなことをしゃべっているかの概要はしっかりつかめました。このポケトーク同時通訳は、発表後に音声認識エンジンを話題のOpenAIが開発した「Whisper」に刷新。22年内と告知されていた発売が3月になったのは、OpenAIの発表後に急遽Whisperの採用を決めたからだと言います。

▲翻訳エンジンにDeepLなどを組み合わせているポケトークだが、音声認識エンジンにはいち早くOpenAIのWhisperを採用した

ポケトークのCTO、河竹一氏によると、Whisperは「ノイズ耐性が非常に強く、相手の話している声がPCでもしっかり取れる」とのこと。ZoomやYouTube上の音声を翻訳する際には、昨年のβ版と大きな違いはないかもしれませんが、対面で利用する際の性能が向上したと言えそうです。

英語でインタビューなどをする際に、PCを開いておき、アンチョコのように字幕を見るといった使い方ができそうなので、筆者としても期待している製品です。

それ以上におもしろかったのが、ポケトーク for BUSINESSの「カンファレンス」です。こちらは、個人で利用する同時通訳とは異なり、企業導入がメインになるもの。音声をかぶせてリアルタイムに通訳するという点では同時通訳と同じですが、「カンファレンス」はその使い方が異なります。「カンファレンス」を主催する会社があらかじめ設定を済ませておき、参加者は自身のスマホやタブレットでそれを利用するというスタイルを取っています。

▲発表会や講演会などでの利用を想定している「カンファレンス」

この「カンファレンス」は、Webアプリとして作られており、参加者側が何か特定のアプリを事前にインストールしておく必要はありません。iPhoneでも、Androidでも、QRコードが読み込めてブラウザさえ開ければ利用できます。参加者側からするとイヤホンを持っていかなければならないのはデメリットかもしれませんが、主催者側からすれば通訳者を雇って翻訳機を用意するより、手間やコストが大幅に削減できます。

ポケトークによると、通訳を用意した8時間、1000人参加のカンファレンスでは、最低でも200万円かかるといいます。機材代も100万円とばかになりません。また、通訳との事前打ち合わせも必須で、時間も必要になります。ポケトーク for BUSINESSの「カンファレンス」を利用すれば、このコストを1/20以下に削減できるとのこと。発売が今夏とやや先のため、細かな料金は発表されていませんが、10万円程度まで費用を圧縮できる可能性があります。

▲人や機材のコストが約1/20になるとうたう

この手の発表会に参加する頻度は人並み以上、むしろそれが仕事の筆者ですが、過去の経験上、提供される同時通訳のクオリティには波があります。完璧と舌を巻くほどの通訳もいれば、専門用語が若干怪しい通訳も。さらには、コストがかけられなかったのか、英語が話せる社員が通訳するようなケースもあります。特に最後のパターンは、通訳の専門スキルがないため、内容が大幅に圧縮された要約になってしまい、結局は英語を聞いていた方が早くて正確といったことすらあります。

精度面ではさすがに専門の通訳にはかなわないかもしれませんが、コスト的な事情で通訳をどうしても入れられない場合には、ポケトーク for BUSINESSの「カンファレンス」は役立ちそうです。参加者側はスマホとイヤホンを用意するだけという手軽さも、ユースケースが考え抜かれている印象を受けました。

実際、ポケトーク for BUSINESSの発表会場では、“模擬発表会”のような形で「カンファレンス」の機能を利用することができましたが、話されている内容がかなり正確に日本語になっていました。もちろん、事前に準備された内容のため、機械翻訳をしやすい内容や環境だった可能性はありますが、逆に言えば、ある程度原稿が用意されているような発表であれば、精度が上がるということ。外国人の登壇者を考えている企業は、導入を検討してもいいかもしれません。

▲模擬発表会で、「カンファレンス」を利用することができた。ブラウザでのアクセスになるため、アプリのインストールが不要で手軽に利用可能

もう1つの「ムービー翻訳」は、動画を丸ごと翻訳にかけ、字幕などをつけるソフトウェア。こちらは、企業のプロモーション動画などを作るユースケースを考えているようです。

いずれも、核となる機能は同時翻訳と同じ。その打ち出し方を場面、場面に最適化しているのがポケトーク for BUSINESSの戦略です。ポケトークをソフトウェア化したからこその戦い方と言えそうです。


《石野純也》
石野純也

石野純也

ケータイライター/ジャーナリスト

  • homepage
  • facebook
  • X

慶應義塾大学卒業後、新卒で出版社の宝島社に入社。独立後はケータイジャーナリスト/ライターとして幅広い媒体で執筆、コメントなどを行う。ケータイ業界が主な取材テーマ。

特集

BECOME A MEMBER

『テクノエッジ アルファ』会員募集中

最新テック・ガジェット情報コミュニティ『テクノエッジ アルファ』を開設しました。会員専用Discrodサーバ参加権やイベント招待、会員限定コンテンツなど特典多数です。