google chrome とかにある、google音声認識を自由にプログラムから呼び出す方法を調べたので書いてみる。 Fiddler2 でごにごにしてぐるぐるした結果、こーなった。 音声データは、 16000hz 1channel の flac形式で送信している。 で、その結果を元に調べてみると、外人で何人か解析している人がいた。 だけど、日本語のやつがなかったんで作ってみた。 基本的には、lang=ja と lang=US の違いぐらいだけど。 まず、手元に 16000hz 1channel の test.flac を作る。 ffmpeg使うと簡単に作れる。 ffmpeg -i test.wma -vn -ac 1 -ar 16000 -acodec flac test.flac あとは、HTTPS通信してデータを取得する。 chrome がやっているとおりに投げてみた。 なので、サー