音声認識を長年研究されている @akinori_ito 先生が、2000年以前に起こったNNとHMMの競争の流れについてツイートしてくださいました。
はじめに この記事は東京Node学園祭2012 アドベントカレンダーの 23 日目の記事です。 現在、オープンソースの大語彙連続音声認識エンジン Julius を利用して音声による家電操作を行なっているのですが、どんな言葉を認識させるかの文法をゴリゴリ書いたり、コールバックの処理を C++ でゴリゴリ書くのが大変だったので、これらを簡単に実現してくれる Node.js のモジュールをつくってみました。 WEB 関連の話題で扱われることの多い Node.js ですが、C++ でネイティブモジュールを作成することによる Node.js の可能性を感じてもらえれば、と思います。 出来るようになること 以下のように音声認識させる言葉を登録、その文言を Julius が解釈できる形式にコンパイルして、Julius インスタンスを生成、スタートするだけで音声認識が可能になります。 var Julius
和歌山大学メディアインテリジェンス研究室(西村竜一研究室)† 本研究室では、音声や画像、動画、自然言語、センサなどの「メディア」を活用した認識・理解の知的技術によって、人と人、人と機械の協働を豊かなものにするための教育・研究を行います。 2019年度から活動している研究室です。 本研究室の学部生は、システム工学部 メディアデザインメジャーに所属しています。大学院生の所属は、システム工学研究科 知的モデリングクラスタです。 なお、本研究室は、西村が所属(担当)するデータ・インテリジェンス教育研究部門及び学生自主創造支援部門(クリエ)とも協働することで教育・研究活動を進めています。 今後は、社会インフォマティクス学環の学生の受入も行う予定です。 ↑ お知らせ† 2023/12/9 大学院生(M2)の日田さんが国立研究開発法人情報通信研究機構(NICT)の研究員みなさまと共著で発表した『複数話者
たった一行追加するだけで、あなたのサイトに音声認識機能を付けられます! w3voiceIM.jsは、Webページの上のテキスト入力フォームに音声認識機能を追加するJavascriptライブラリです。 手軽に音声認識を利用できることが特徴になっています。 また、http://w3voice.jp/でサービスする共有型音声認識エンジンを利用するために、利用者やWeb開発者は、音声認識プログラムのインストールや設定作業を必要としません。 JavaおよびJavascriptが動作するPC及びWebブラウザからの利用をサポートしています。 現在のバージョン 最新のw3voiceIM.jsのバージョンは0.02です。 とりあえず動くようになった開発途上バージョンです。 使い方 音声入力を開始するには、テキストの入力欄をマウスでダブルクリックします。 音声入力パネルが出現したら、「Push here」と
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く