143 Views
August 26, 23
スライド概要
機械学習や音声認識に関する書籍を執筆しています。
14. おわりに 14.1 音声分析ツール wavesurfer 14.2 HMM 作成ツール HTK 14.3 大語彙連続音声認識エンジン Julius 14.4 バーチャルエージェント対話ツール MMDAgent • 荒木雅弘 :『イラストで学ぶ音声認識』 (講談社, 2015年) • サポートページ
14.1 音声分析ツール wavesurfer • ダウンロードサイト https://sourceforge.net/projects/wavesurfer/ • 音声の録音・再生・分析を行うツール • 音声波形・スペクトログラム・基本周波数などを表示すること ができる • 特定区間の周波数分析結果も表示可能 • 最新版: 2020年5月公開
14.2 HMM 作成ツール HTK • ダウンロードサイト http://htk.eng.cam.ac.uk/ • 音声認識用のHMMを作成し、評価するまでの一連のツール群 • • • • • • • HSLab: 音声収録・ラベル付けツール HCopy: MFCCなどの特徴量計算 HInit: HMMを学習させる際の初期値計算 HRest: バウム・ウェルチアルゴリズムによるHMMの学習 HParse: 正規文法をネットワーク文法に変換 HVite: ビタビアルゴリズムで認識結果を求める HResult: 作成したHMMの評価コマンド • ver3.5ではDNNに対応 • 最新版: 2016年6月公開
14.3 大語彙連続音声認識エンジン Julius • ダウンロードサイト https://github.com/julius-speech/julius • フリーの音声認識用汎用デコーダ • ver4.4以降では、GMM-HMMとDNN-HMMを切り替えて使用 することが可能 • ディクテーションを行うためのキット(音響モデル・言語モデ ル込み)も配布されている • 文法を用いた認識を行うためのキット(サンプル文法込み)も 配布されている • 最新版: 2020年9月公開
14.4 バーチャルエージェント対話ツール MMDAgent • ダウンロードサイト http://mmdagent.jp/ • 音声認識・音声合成・バーチャルエージェントを組み合わせた 対話システム開発キット • FSTで対話パターンを記述する • マニュアル・講習会資料等 http://www.udialogue.org/ja/encyclopedia-ja • 最新版: 2021年10月公開 https://mmdagent-ex.dev/ja/