Otterの何よりの強みである、リアルタイムで行われる文字起こしと、音声認識精度の正確さを実感ください。
Otterはどのように音声データをテキストとして文字起こしするのでしょうか?
Otterはクラウドベースで、AIを100%利用しています (人間が文字起こしには関与していません) 。当社の音声テキスト変換エンジンは、英語を実際に発話する人間に依存しないリアルタイム文字起こしをサポートしており、該当個人の音声データを使って何時間も個別にトレーニング(事前学習)することなく、すぐにリアルタイム文字起こしを使用できます。この話者識別アルゴリズムは高度な機械学習を利用しており、話者の発話内容を数段落ごとにタグ付けし、クラスタリングしてそのタグ付け結果を学習します。その結果、音声とテキストが同期された、読みやすい、スピーカーラベル付きのトランスクリプトが作成されます。
Otterの音声認識はどれくらい正確ですか?
Otterは、会議やインタビュー、講演、その他の長時間の会話・スピーチでも威力を発揮し、文字起こし市場の中で最も正確なリアルタイム文字起こしを提供します。こちらのお客様のハッピーな生の声を御覧ください。
音声認識の精度を向上させる方法は?
Otterのリアルタイム文字起こしの精度を上げるには、次のベストプラクティスに従うことをおすすめします。
- コンピュータまたはデバイスの内蔵マイクではなく、外部マイクまたはヘッドセットを使用しましょう。
- マイクを発話者から1メートル以内に配置しましょう。
- バックグラウンドノイズを最小限に抑えるようにしましょう。
- 複数人の話し手が同時に話すような、発話の重複を避けましょう。
- 普通の会話のトーンとペースで、はっきりと自然に話しましょう。
- OtterのVocabularyをカスタマイズして、特定の単語、名前、頭字語、専門用語などの聞き取り品質と正確性を高めます。
Otterでは「あー」や「えー」のような、つなぎ言葉はどう扱われる?
一般的に多くの人間は、会話の流れや、言葉を考えるために、思考のポーズとして余計な「あー」または「えー」などの音声を発話する癖があります。これらのサウンドや単語は、カスタム語彙に追加される場合も含めて、プログラム中では無視されるよう処理しています。