Kaldiとは C++で書かれた音声認識ツールキットで、Apache Licence 2.0で公開されています。 音響モデルにDNN (Deep Neural Network) を用いているのが特長です。 http://kaldi-asr.org/ 今回はKaldiを動作させ、yesかnoの音声を判別するモデルを学習させてみます。 環境 Vagrant上のUbuntu 16.04 LTSを用いています。 $ cat /etc/lsb-release DISTRIB_ID=Ubuntu DISTRIB_RELEASE=16.04 DISTRIB_CODENAME=xenial DISTRIB_DESCRIPTION="Ubuntu 16.04.1 LTS" $ uname -a Linux vagrant 4.4.0-31-generic #50-Ubuntu SMP Wed Jul 13