皆さん、こんにちは。
会議の内容を録音して、自動的に文字起こし(テキスト化)してくれるサービスについて、前回記事では幾つかのサービスの音声認識性能を比較してみました。
◇前回記事「自動文字起こしサービスの音声認識比較」(2024/8/27)
その結果、私としてはソースネクストのAutoMemoというサービスが一番良いと考え、1ヶ月の有料契約に申し込んで使用してみましたので、今回はAutoMemoの使い勝手などについて紹介したいと思います。
ソースネクスト株式会社について
ソースネクストの製品としては、以前にPDFソフト「いきなりPDF Ver10 COMPLETE」を紹介しています。
◇以前のニュースレター記事「PADのOCR機能を検証してみた」(2023/10/10)
PDFファイルからOCR機能で日付を読み取るのを、MicrosoftのPower Automate for Desktopに付随したOCRエンジンで行おうとしましたがうまくいかず、ソースネクストの「いきなりPDF」を試したところ、段違いの素晴らしい読み取り性能だったという内容です。
そのときに購入した「いきなりPDF」は、いまも便利に愛用しています。
ソースネクスト株式会社は1996年に創業した日本のソフトウェア・ハードウェア開発企業で、東証プライム市場に上場、2024年3月期の売上高は113億円です。
ユニークなプロダクトを多数企画・開発していますが、中でも代表的なのは「ポケトーク」ではないでしょうか。
AIを利用した多言語翻訳機として、この分野では90%以上のシェアだそうです。
2022年にはポケトーク株式会社を分社し、スマホアプリやWeb会議向け同時通訳機能の提供など、バリエーションも増やしています。
他にも、更新料0円で人気のセキュリティソフト「ウィルスセキュリティZERO」なども有名ですね。
今回導入したAutoMemoはクラウドサービス・スマホアプリ版ですが、もともとは2020年にボイスレコーダー型のハードウェア製品として発売したものが元になっており、ポケトークの進化に似ている気がします。
国産メーカーとして注目すべき企業ではないかと思います。
AutoMemoの自動文字起こし機能で対面会議の内容を記録
前回記事でも書いたとおり、私はMicrosoft365 Business Standardを利用しているので、自分が主催するWeb会議ならTeamsを用いて、その録画・文字起こし機能を使うことができるため、AutoMemoは必要ありません。
AutoMemoを使いたくなるのは、対面での重要な会議、あるいは相手方が主催する重要なWeb会議のときだけ。
よって、そう頻繁にAutoMemoが必要な場面があるわけではないので、どうしても必要なときだけ月単位で利用しようと考えています。
今回、あるお客様を訪問して、重要な対面での会議がありましたので、月額1,480円(税込)で契約しました。
これで1ヶ月30時間までの録音・文字起こしが可能になります。
対面の会議で使う場合は、スマートフォンにアプリをダウンロードし、自分のアカウントでログインすると、すぐに使い始められます。
お客様に録音させていただくことを承諾いただいた上で、録音ボタンを押して置いておくだけです。
1時間余りの会議が終わると、録音したデータをクラウドにアップロードするのに数分、そこから文字起こしするのにはたぶん15~20分程度かかっていたかと思います。
帰宅後に文字起こしされたテキスト内容を確認し、細かな認識誤りはあるにしても、だいたいの会話内容は把握でき、ある程度満足できる精度であることを確認しました。
AutoMemoのセキュリティ
前回記事で幾つかの文字起こしサービスを比較した際、LINEWORKSのCLOVA Noteについては、セキュリティ面に関する疑念があり、利用を見送ることにしたと書きました。
ではソースネクストのAutoMemoはどうなのでしょうか?
Webサイトでの説明によると、各デバイス(パソコンやスマホ)とクラウドサーバーとの間の通信、およびクラウドサーバー内の処理は全て暗号化されている上、録音した音声データがAIのラーニングに利用されることはないとのことです。
また高い信頼性規格のデータセンターを使用し、不正アクセスや脆弱性対策も実施しているとされています。
まあ今の時代、何が起こるか分かりませんので、100%の信頼ということはあり得ませんが、一応この記載を信じて利用していこうと考えています。
ネット記事を見ていると、CLOVA Noteで文字起こししたテキストをChatGPTに読み込ませて要約し、議事メモを作成するとすごく便利です!なんていう記事を見かけますが、会議内容がChatGPTの学習に利用されてインターネット上に垂れ流しにならないよう、きちんと注意を払っているのか、とても心配です。
大切なお客様の情報を取扱うのですから、いわゆる「善良なる管理者の注意義務」を果たすよう、できる限り注意を払っていくようにすべきかと思います。
パソコンのWeb会議で相手方の声が録音できないトラブル
月30時間まで利用できますので、いろいろ試してみようと、パソコンでのTeams会議やZoom会議などについても録音・文字起こしを試してみました。
パソコンでの録音もとても簡単で、ブラウザでAutoMemoにログインしておき、Web会議開始後に、幾つかボタンを押して録音開始の操作をするだけです。
ところが、録音・文字起こしした結果を確認すると、自分の声しかなく、相手方の声が録音されていません。
TeamsやZoomなど何度か試しましたが、同じ結果のため、ソースネクストのカスタマーセンターに問合せました。
いろいろとやり取りした後、私は通常、Bluetoothヘッドセットを使ってWeb会議を行っているのですが、これをパソコンのマイク・スピーカー、もしくは有線のイヤホンマイクで試してみて欲しいと言うのです。
そんなことで改善するかな?と疑心暗鬼でしたが、試しに有線イヤホンマイクで行ってみたところ、正常に相手方の声も録音・文字起こしされたのです!
なぜ接続デバイスによって録音されたり、されなかったりするのか、原因については引き続きカスタマーセンターとやり取り中ですが、こういうこともあるんだなぁと思いました。
できれば普段使用しているBluetoothヘッドセットを使っても正常に録音・文字起こしできるよう、原因を解明したいと思います。
【追記】
その後の原因究明により、BluetoothヘッドセットをWindowsシステムのサウンド設定で「規定値に設定」にすると、相手方の声も正常に録音されることが分かりました。
文字起こし結果の修正と要約
AutoMemoの自動文字起こしは精度が高いといっても、100%正しいわけではありません。
特に固有名詞的なものは正しく文字起こしされません。
AutoMemoで文字起こしされたテキストはダウンロードできますので、Wordにでも読み込んで、置換コマンドを使って正しい言葉に修正していくことになります。
前回記事で比較検証の結果、音声認識精度があまり良くなかったNottaには、よく使う用語を登録して、認識しやすくする機能があります。
AutoMemoには現状そういう機能がまだ無いようですが、せっかくAI機能を搭載しているのですから、ぜひ改善して欲しいところです。
Wordでだいたい正しく文字起こしを修正できたら、Microsoft Copilotに議事メモや発言者ごとの要約などを自動で作らせることができます。
先ほど紹介したChatGPTを使うのと違って、私のMicrosoft365ライセンスの中だけで行い、AIの学習に利用されることはありませんので、情報漏えいの心配はありません。
Copilotで、クラウドストレージOneDrive上に格納した文字起こしファイルから要約などを生成する方法は、以前の記事を参考にして下さい。
◇以前のニュースレター記事「Copilotはまだ成長途上」(2024/8/21)
いかがでしたでしょうか。
パソコンでのWeb会議利用時に、まだ多少の疑問点も残りますが、対面での会議の際などにはとても役立つことが確認できました。
ぜひ参考にしていただければと思います。
それでは今回はこの辺で。
宜しくお願い致します。
ニュースレターの最新号をメールでお知らせします。
こちらのデジタルビズ・トップページよりぜひ配信登録をお願い致します。
Comments