Kaldiツールキットを用いた 音声認識システムの構築 篠崎隆宏 東京工業大学 工学院 情報通信系 www.ts.ip.titech.ac.jp 1 2016年10月27日SP研究会 • 音声認識システムの仕組み • Kaldiツールキットの概要 • 日本語話し言葉音声認識のためのKaldi用CSJレシピ • デモ用CSJレシピを用いたチュートリアル 2 概要 音声認識システムの仕組み 3 音声認識システムの全体構成 4 A/D変換 特徴量抽出 デコーディング Hello! マイク 計算機 特徴量抽出 • 認識性能の向上 • 認識のための計算量やメモリ量の削減 5 特徴量 抽出 Time 音声信号 特徴量系列 認識に有用な特徴を認識処理に都合の良い形で抽出 音声ベクトルの切り出し 6 窓(フレーム) 幅 フレームシフト メル周波数ケプストラム(MFC) 7 Mel‐Scale Filter