[B! 音声認識] mainyaaのブックマーク

音声認識でかつてNNがHMMに敗北した状況まとめ

音声認識を長年研究されている @akinori_ito 先生が、2000年以前に起こったNNとHMMの競争の流れについてツイートしてくださいました。

mainyaa 2013/10/23

PCスペックの進化と低価格化は偉大だ

リンク

Node.js で簡単に音声認識できるモジュールを作ってみた #nodefest - 凹みTips

はじめにこの記事は東京Node学園祭2012 アドベントカレンダーの 23 日目の記事です。現在、オープンソースの大語彙連続音声認識エンジン Julius を利用して音声による家電操作を行なっているのですが、どんな言葉を認識させるかの文法をゴリゴリ書いたり、コールバックの処理を C++ でゴリゴリ書くのが大変だったので、これらを簡単に実現してくれる Node.js のモジュールをつくってみました。 WEB 関連の話題で扱われることの多い Node.js ですが、C++ でネイティブモジュールを作成することによる Node.js の可能性を感じてもらえれば、と思います。出来るようになること以下のように音声認識させる言葉を登録、その文言を Julius が解釈できる形式にコンパイルして、Julius インスタンスを生成、スタートするだけで音声認識が可能になります。 var Julius

mainyaa 2012/11/19

リンク

Start | 和歌山大学メディアインテリジェンス研究室

和歌山大学メディアインテリジェンス研究室（西村竜一研究室）† 本研究室では、音声や画像、動画、自然言語、センサなどの「メディア」を活用した認識・理解の知的技術によって、人と人、人と機械の協働を豊かなものにするための教育・研究を行います。 2019年度から活動している研究室です。本研究室の学部生は、システム工学部メディアデザインメジャーに所属しています。大学院生の所属は、システム工学研究科知的モデリングクラスタです。なお、本研究室は、西村が所属（担当）するデータ・インテリジェンス教育研究部門及び学生自主創造支援部門（クリエ）とも協働することで教育・研究活動を進めています。今後は、社会インフォマティクス学環の学生の受入も行う予定です。 ↑ お知らせ† 2023/12/9 大学院生（M2）の日田さんが国立研究開発法人情報通信研究機構（NICT）の研究員みなさまと共著で発表した『複数話者

mainyaa 2009/01/08

音声認識

リンク

http://www.linux.or.jp/JF/JFdocs/Speech-Recognition-HOWTO/software.html

mainyaa 2009/01/06

リンク

音声認識テキスト入力Javascriptライブラリ w3voiceIM.js

たった一行追加するだけで、あなたのサイトに音声認識機能を付けられます！ w3voiceIM.jsは、Webページの上のテキスト入力フォームに音声認識機能を追加するJavascriptライブラリです。手軽に音声認識を利用できることが特徴になっています。また、http://w3voice.jp/でサービスする共有型音声認識エンジンを利用するために、利用者やWeb開発者は、音声認識プログラムのインストールや設定作業を必要としません。 JavaおよびJavascriptが動作するPC及びWebブラウザからの利用をサポートしています。現在のバージョン最新のw3voiceIM.jsのバージョンは0.02です。とりあえず動くようになった開発途上バージョンです。使い方音声入力を開始するには、テキストの入力欄をマウスでダブルクリックします。音声入力パネルが出現したら、「Push here」と