少し前ですが、機械学習×プログラミング勉強会で、「音声認識の誤認識フィルタとしての機械学習」という発表してきました。 今まで、作ってきた音声認識の誤認識フィルタの内容とそこへいたる経緯をまとめたスライドになります。 持ち時間が20分だったので、後半巻き巻きでしたが、、、 結構うけていたと思いますw このスライドにも書きましたが、こーしたらもっとよくなるんじゃないかと意見がある方は、教えていただけると助かります。
![機械学習×プログラミング勉強会で「音声認識の誤認識フィルタとしての機械学習」という発表をしてきました。 - お前の血は何色だ!! 4](https://cdn-ak-scissors.b.st-hatena.com/image/square/6df07f84b908d9cbd4787ed864dac8c0e3d23f99/height=288;version=1;width=512/https%3A%2F%2Fcdn-ak.f.st-hatena.com%2Fimages%2Ffotolife%2Fr%2Frti7743%2F20120526%2F20120526015422.jpg)
MOVIDA Scholarshipに選出されました。 6月のことですが、MOVIDAというベンチャーキャピタルがやっているシードアクセラレーションプログラムで、「音声認識を利用した未来のホームコントロール」というのでプレゼンをしたところ、出資も含めて支援してくれるプランである Scholarship に選出されました。 (まだ実際に出資を受けたわけではない) 「音声認識を利用した未来のホームコントロール」っていうのは、「1月に作った未来な部屋を作ってみた」を実際に、事業化するプロジェクトです。 現在開発している未来の部屋ガジェットを部屋に設置すると、誰でも普通の部屋を音声認識で動く未来の部屋にアップグレードさせることができるようになります。 音声認識を生活の一部にします。今どき電気や水道がない家がないように、未来では音声認識がない家はないぐらいまで持って行きたいですね。 その時やったプレ
google chrome とかにある、google音声認識を自由にプログラムから呼び出す方法を調べたので書いてみる。 Fiddler2 でごにごにしてぐるぐるした結果、こーなった。 音声データは、 16000hz 1channel の flac形式で送信している。 で、その結果を元に調べてみると、外人で何人か解析している人がいた。 だけど、日本語のやつがなかったんで作ってみた。 基本的には、lang=ja と lang=US の違いぐらいだけど。 まず、手元に 16000hz 1channel の test.flac を作る。 ffmpeg使うと簡単に作れる。 ffmpeg -i test.wma -vn -ac 1 -ar 16000 -acodec flac test.flac あとは、HTTPS通信してデータを取得する。 chrome がやっているとおりに投げてみた。 なので、サー
年の瀬に引越ししたので、部屋の再構築を行った。 コンセプトは快適に引き篭もれる未来の部屋。 その紹介をしたいと思う。 図面 一部省略の図面、古い建物なのでちょっと広い。 10m2 * 2部屋ぐらい。 何度か検討を繰り返してこの形式に落ち着いた。 カーテンを100インチのディスプレイにしてみた カーテンレールに100インチのスクリーンを釣り下げてみた。 カーテンが支えられるんだから、100インチのスクリーンぐらい支えられるだろうという発想。 カーテンレールに入れるのにLANケーブル用のマーカータイを使ってみた。 束ねれば結構強固である。 スクリーンの後ろは黒塗りされているので裏写りはないと思うけど、念のための裏写り防止のためと、昼間でも投影できるように暗室を作りたかったので、暗室用のブラックカーテンを後ろに引いている。 プロジェクターはNECの NP-U310WJD 短焦点プロジェクターを使
boost勉強会/忘年会に参加してきました。 朝まで。Σ(゚Д゚) ・・・最後まで残った組みは、徹夜カラオケ。始発までwww 長い勉強会といえば、データマイニング+WEB@東京勉強会が、一番ひどい時で、懇親会込みで朝から終電だったのに対して、こちらは懇親会込みで朝までという感じでしたが、なんとか生きて帰って来れました。 そして、財布は軽くなりました。 orz (ただし、データマイニング+WEB@東京勉強会は2週連続開催という離れ業があったので単純に比較できないと言うか、最近は運営側の努力と工夫で時間が押さなくなってきているみたいなのだが、ってかそもそも何を比較しているんだ。。。) C++な人たちのカラオケは、誰も歌わないで、カラオケボックスで言語の議論をしているということだったので結構wktkだったのですが、そこそこ普通に歌っていた気がします。みんな歌上手い。 もちろん、言語仕様の話とか、
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く