Geminiで音声文字起こしする方法【無料あり】

当サイトでは、ビジネス業務効率化のために、AI文字起こしの活用を推奨してきました。現在はGeminiでも、音声・録音・動画ファイルを直接文字起こしできるようになっていますしかも無料プランでも利用可能です。この記事ではやり方とコツを手順で解説します。

Geminiの文字起こし。どこまで無料でできる?

Geminiの無料プランでは、合計 10 分程度までの音声録音を文字起こしすることが可能です。

有料プラン(Google Workspace等)にアップグレードすると、合計 3 時間/100MBまでの音声ファイルをアップロードできます。

試しに無料プランでも試したところ、10分と少しの長さでも十分な精度で文字起こししてくれました。

音声・録音ファイルの文字起こし手順

音声ファイルの文字起こしは非常に簡単です。

  1. Geminiに音声ファイル(会議録音など)をアップロードする
  2. 「この音声を文字起こししてください」と指示する

「話者ごとに分けて」「タイムスタンプ付きで」などと頼むと議事録に使いやすいでしょう。

以下は、以前趣味で作ったアニメーション動画を文字起こししてみました。

議事録化・要約まで一気にやる

文字起こしと併せて、要約・整形を一度の指示でまとめて頼んであげることもできます。例えば、プロンプトに次のようなものを追加してみましょう。

  • 「文字起こし後、決定事項・ToDo・担当者を表にまとめて」
  • 「5行で要約してから、詳細を箇条書きにして」
  • 「敬語の議事録形式に整えて」

以下は出力例です。ここまでまとめてくれるのは、文字起こし専用ツールにはないGeminiの強みですね。

精度を上げるコツ(対応形式・言語など)

次のような点を工夫すれば、文字起こしの精度は高まります。

  • 録音はできるだけクリアな音質で(雑音・かぶり発話に注意。リモート会議は相性〇)
  • 録音のシチュエーションを教えてあげる(例:飲食店スタッフのミーティングです)
  • 専門用語や固有名詞は事前に「この単語が出ます」と伝える

日本語を含む多言語に対応していますので、外国語音声の翻訳要約も可能です。

外国語のカンファレンスやセミナーの文字起こしをするなど、情報収集面でも活用できそうですね。

他ツール(専用文字起こしAI)との違い

専用文字起こしサービスはリアルタイム性が高い一方で、込み入ったプロンプトによる漢字変換の正確化や要約、各種決定事項の抽出まではサポートをしていません。

Geminiはこれらをプロンプトで指示してあげることで、長時間の会議でも、一発で必要な議事録としてまとめてくれる強みがあります。

ビジネス利用なら有料プランがおすすめ

このように、Geminiは無料版でも高い精度で、高機能な文字起こしを提供してくれます。

趣味や学習用途であれば、無料プランでの運用もいいと思いますが、ビジネス用途であれば有料プランであるGoogle WorkSpaceの活用をお勧めします。

メリットは主に次の2点です。

  • データが学習に使われる心配のない
  • 最大3時間までの音声ファイルを扱える(無料プランは10分程度まで)

月額800円のStarterプランから利用いただけますが、個人的には月額1600円のStandardプランからNotebookLMほかGoogleサービス連携の恩恵を受けられるのでおすすめです。

いずれにせよ、これまで高精度な文字起こしを実現するためには、いくつかのサービスを契約する必要がありましたが、Geminiに一本化できるのは嬉しいことです。

今後も生成AIの機能拡張が進むことに期待と恐怖を抱きつつ、ウォッチしていきたいですね。

Similar Posts

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です