audio-output-to-text

スピーカーやヘッドフォンから出力される話し声のオフライン文字起こしです。文字起こしされた結果はターミナルに表示されます。音声認識にはVOSKを用いています。

デモ動画

VOICEVOXから出力された音を文字起こししました。

＊480p以上でないと、文字起こしされた結果が見えにくいかもしれません。

Windows10とUbuntu18.04上での動作を確認しています。 macOSは手元に環境がないため、動作を確認できていません。

python run.py

Qiitaの方で紹介しました。

Name		Name	Last commit message	Last commit date
Latest commit History 16 Commits
model		model
README.md		README.md
run.py		run.py