reazonspeech-nemo-v2を使ってフォルダ内にある音声ファイルの文字起こしをしてCSVとJsonに保存する

ayousanz https://blog.hatena.ne.jp/ayousanz/ yousanのメモ https://ayousanz.hatenadiary.jp/ AI Python 初めにデモ開発環境準備文字お越し及びファイル保存エラー対応 CUDAがenabledになっていない場合 ReazonSpeech/pkg/nemo-asrのインストールが失敗する参考サイト初めに STTやTTSの学習等をする際に文字データが必要になるのですが、音声だけある場合もよくあるので文字お越しが必要になります。今回はreazon-research/reazonspeech-nemo-v2を使ってフォルダ内の音声の文字起こしを行っていきます精度及び速度はwhisperよりもいいとのことです (公式サイトより引用) デモ最終的に以下が出力されます CSVは以下のように出力… 190 <iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fayousanz.hatenadiary.jp%2Fentry%2F2024%2F02%2F24%2F144127" title="reazonspeech-nemo-v2を使ってフォルダ内にある音声ファイルの文字起こしをしてCSVとJsonに保存する - yousanのメモ" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;"></iframe> https://cdn-ak.f.st-hatena.com/images/fotolife/a/ayousanz/20240224/20240224034509.png Hatena Blog https://hatena.blog 2024-02-24 14:41:27 reazonspeech-nemo-v2を使ってフォルダ内にある音声ファイルの文字起こしをしてCSVとJsonに保存する rich https://ayousanz.hatenadiary.jp/entry/2024/02/24/144127 1.0 100%