pepper君の音声認識精度がいまいちなので、クラウド音声認識サービスを使って精度向上ができないか試してみました。 NAOqiのドライバでpepperのマイク信号をネットワーク経由で取得し、音声区間のみをクラウドサービスに送ることで音声認識結果を得るという方法です。 Google Speech APIではかなり良い精度で認識できました。NICTの音声認識サービスでもまずまずの精度でした。 サンプルコードをGitHubに公開していますので、お試しください。 注意点 NICTのAPIの利用は、学術研究目的に限られています。詳しくはrospeexのライセンスを参照してください。 Google Speech APIには、1日50回の呼び出し回数制限があります。 動作環境 Ubuntu 14.04.1 LTS 64bit 手元の環境では、Mac OSのVMware Fusionで動かしています RO