AIは、創造的芸術の危機、誤情報の大きな問題、老朽化したエネルギーシステムへのさらなる要求を引き起こしたかもしれないが、間違いなく生活を大幅に楽にした分野が1つある。それは、オーディオクリップで話されている内容を解析できることだ。
インタビュー、会議、講義、音声メモなどの録音を、数時間ではなく数秒でデジタルテキストに変換できるようになりました。AIは、元の動画クリップに字幕が含まれていなくても、画面にリアルタイムで字幕を表示するライブキャプションなどのアクセシビリティ機能にも活用されています。
こうした処理には時間とリソースがかかるため、無料の選択肢はほとんどありません。しかし、ここでは無料だが制限のある5つのサービスをご紹介しますので、ニーズに合っているかどうかご確認ください。
Google レコーダー
Android版Google Recorderアプリは完全に無料でご利用いただけます。ただし、ライブ音声のみに対応しており、録音されたクリップには対応していません。また、Google Pixel端末をお持ちでないとご利用いただけません(Webインターフェースも利用可能ですが、ファイルの再生のみで、作成はできません)。
Pixelスマートフォンをお持ちで、ライブ音声のみで作業したい場合は、このアプリが最適です。必要に応じて外付けマイクを接続すると、録音中の音声とほぼ同時にテキスト文字起こしが画面に表示されます。
トランスクリプトの検索は簡単で、「笑い声」や「音楽」といった音声でも検索できます。テキストを微調整するだけで音声を編集できます。AIが生成したトランスクリプトの要約も表示されます。Samsungのスマートフォンをお持ちの場合は、ボイスレコーダーとGalaxy AIが同様に機能し、AppleはiOS 18に匹敵する機能を追加しています。
ささやき

OpenAIは、Whisper AI音声テキスト変換エンジンを誰でも無料で利用できるようにしています。ただし、 Hugging Faceのウェブアプリを使うか(便利ですが、混雑していて遅いことが多い)、ローカル版をコンピューターにインストールする必要があります(高速でプライバシーは確保できますが、コンピューターのパフォーマンスがそれなりに高くなる必要があります)。
ウェブインターフェースはこれ以上ないほど使いやすくなっています。ディスクからファイルをアップロードするか、コンピューターのマイクに直接話しかけてください。数分の処理時間の後、ウィンドウの反対側にテキストが表示されます。AIを使って音声を様々な言語に翻訳することも可能です。
キューに入れたくない場合は、お使いのコンピューターが対応していれば、Whisperをローカルにインストールできます。簡単な手順ではありませんが、もし挑戦してみたいという方は、こちらに詳しい手順が記載されていますので、ぜひご覧ください。これで、無料で好きなだけ使えるローカルAI文字起こしサービスが手に入ります。
カワウソ

Otterは、企業と個人向けのプロレベルの文字起こしサービスです。洗練されたエクスペリエンスと豊富な機能を備えており、音声をテキストに変換したり、要約や実用的な項目を作成したり、その他多くの機能を備えています。
ウェブ アプリとモバイル アプリでは、すべてが直感的にレイアウトされ、簡単に操作できます。また、多数のサードパーティ アプリとの統合から、オーディオでさまざまなスピーカーを識別する方法まで、便利な機能が随所に散りばめられています。
ご想像のとおり、この機能にはそれなりの料金がかかり、有料プランは月額16.99ドルから始まります。無料プランをご利用の場合、アップグレードするまで、文字起こしは月300分、会話1回あたり30分、音声またはファイルのアップロードは3回までに制限されます。
ハッピースクライブ

Happy ScribeはOtterと同様に、大企業だけでなく個人にも対応しています。こちらも基本的な無料プランが用意されていますが、ファイルに保存できる音声は10分までに制限されており、その他様々な制限(ファイルのエクスポートなど)があります。もしこのサービスが便利だと感じたら、月額17ドルからご利用いただけます。
Happy Scribeの最も優れた点の一つは、エレガントで洗練されたインターフェースです。多くの部分がGoogleドキュメントのページを少しアレンジしたような印象で、操作が簡単です。書き起こしには話者ラベルとタイムスタンプが付与され、レビューツールも簡単に使用できます。
生成したファイルは必要に応じてタグ付けしたり、フォルダに分類したりできます。また、便利な機能が随所に散りばめられています。例えば、組み込みの翻訳ツールや、AIが予期しない単語を追加できるカスタム辞書などです。さらに便利な機能として、希望に応じて人間による文字起こしも有料で利用できます。
ミートギーク

MeetGeekのウェブサイトをご覧ください。インタビューや会議から顧客との電話、オンライン授業まで、あらゆる音声を録音できると謳っています。この文字起こしサービスは、ほぼあらゆるニーズに対応できます。機能の多くは会議向け(名前の通り)ですが、どんな音声でも利用できます。
モダンなインターフェースから、カレンダーや過去の録音など、MeetGeekのさまざまなエリアに素早くアクセスできます。複数の人が録音に参加している場合にも便利で、例えば、数回クリックするだけで、全員にトランスクリプトのコピーをメールで送信できます。
MeetGeekを無料で始めるのは簡単です。有料プランは月額19ドルからですが、無料でも月5時間の文字起こしを処理でき、文字起こしデータは3ヶ月分、音声データは1ヶ月分保存できます。無料プランでも、アップロードやAIによる会議要約作成などの機能をご利用いただけます。