ソースネクストは、文字起こし対応のボイスレコーダー「AutoMemo」に、新サービス「AutoMemo Home」を導入します。サービス開始は8月1日を予定しており、AutoMemoユーザーは無料で利用できます。
AutoMemo Homeは、ブラウザベースの管理ツール。これまでのAutoMemoにはiPhone / Android用のアプリが必要でしたが、AutoMemo Homeを使えば、録音したファイルや文字起こしの結果を、PCやタブレットのブラウザで閲覧、編集できます。
新機能として対応するのが、話者分離。複数人で会話した際に、A、B、Cという形で、誰が話しているかを分けて表示する機能です。
例えばインタビューの際にはインタビュワーとインタビューイーがいますが、どちらが何を話しているのかが一目瞭然になります。複数人で行う会議で、誰がどの発言をしたのかを特定する際にも、話者分離が必須と言えるでしょう。文字起こし対応のサービスには、話者分離、特定が可能なものはすでにありますが、AutoMemoとしては初めての対応になります。
話者分離を行なった当初は、A、B、Cのようにアルファベットが振られていく形ですが、当然、名前に置換することは可能。例えば、Aを「石野」、Bを「ittousai」、Cを「小林」にすれば、A、B、Cがすべて名前に変わります。
また、AutoMemo Homeでは、名前だけでなく文字起こしされたテキストも直接編集できるようになります。音声認識エンジンにOpenAI社の「Whisper」を採用し、その精度を高めたAutoMemoですが、実際に使っているとまだまだ誤認識は発生します。こうしたテキストを、手動で修正することが可能になります。これまでは、アプリで表示されたテキストをいったんコピーし、テキストエディタなり、Wordなりにコピペした後修正を加える必要がありましたが、そのプロセスが大きく短縮されることになります。
これらの機能に加えて、AutoMemo Homeからダイレクトに録音、編集した後のメモを共有できるURLの発行も可能に。URLからアクセスしたユーザーには編集権は付与されず、閲覧のみになります。上記と同様、これまでは人にメモを渡す際にコピペで別のアプリを介する必要がありましたが、URLの発行で、その手順を簡略化した格好です。
ここで挙げた新機能は、あくまで8月1日のローンチ時に実装しているもの。ブラウザベースということもあり、機能は随時追加されていく予定です。ソースネクストによると、今後は、文字起こしとは別にメモを残しておける機能や、Web会議の録音機能、外部で録音した音声データの文字起こしなどの機能を検討しているとのこと。サービスを充実させることで、AutoMemoの魅力を高めていく方針を打ち出しています。
筆者も実際に使ってみましたが、手動での編集は少々面倒。どうせなら、ChatGPTのようなAIが文章の不自然な点を指摘し、自動で直してくれるといいなと思いました。同様に、長いインタビューや会議の文字起こしをすべて読んでいくのはなかなか骨が折れる作業。第3者に共有する際に、ボタン一発で要約をつけられるような機能もほしいですね。AIで文字起こしを自動化したAutoMemoなだけに、その先のプロセスも自動化できるといいような気がしました。
AutoMemoは元々、「議事録作成の手間をなくす」というミッションを掲げて開発されたハードウェア。一方で、現行のAutoMemoでは、あくまで文字起こししかできません。AIが作成したテキストの編集や共有にも、別のアプリを使う必要がありました。議事録作成でユーザーが行う作業のうちの一部しかカバーできていなかったというわけです。AutoMemo Homeは、こうした不足を補い、AutoMemoが活躍する範囲を広げるためのサービスと言えるでしょう。
文字起こし可能なボイスレコーダーとして出発したAutoMemoですが、新機種が発売されるごとに、徐々にユーザー数を増やしていきました。一方で、ソースネクストは22年8月にAutoMemoの"サービス化"を行っています。その際に、元々は専用ボイスレコーダーで録音した音声やテキストを管理するために用意されていたアプリで、録音を可能にしました。今ではハードウェアを購入していないユーザーでも、スマホさえあればすぐにAutoMemoを利用できます(アカウントの登録や課金は必要ですが)。
スマホだけで始められるよう、導入の敷居を大幅に下げたところ、ユーザー数の増加ペースは上がり、6月28日時点で、8万3000を突破したといいます。スマホ単体での利用を可能にした結果、ユーザー数は1年間で実に3.3倍まで拡大しました。ソースネクストから分社化した翻訳機の「ポケトーク」もアプリ化を行い、ユーザーの規模を拡大していますが、AutoMemoも同様の戦略でハードウェアだけでなく、ソフトウェアでも稼げるビジネスモデルに転換していることがわかります。
一方、ボイスレコーダーは、依然として専用機が家電量販店などで売られていることからもわかるように、根強い需要があります。筆者の仕事では、こうした端末が活躍している場面を目にする機会も少なくありません。録音自体はスマホで代替ができるようになったとはいえ、録音中は他のアプリが使いづらくなってしまうため、利用頻度が高い人は別のハードウェアを用意しておいた方がベター。筆者も、メインのスマホでは録音せず、レコーダーアプリに文字起こし機能を搭載したPixel 7を専用で使っています。
こうしたニーズがあることも踏まえ、"ハードウェアとしてのAutoMemo"の後継機種にも期待したいところ。クラウド処理だとややハードルは上がりますが、Pixelのようにリアルタイムで文字起こしの結果が見られるデバイスであれば、筆者も飛びついてしまいそうです。