今更ながら、ケータイは携帯電話であり、電話は声で話をする道具である。しかし現在のケータイは違っている。死語かもしれないが、親指族としてケータイでメールを打ちまくる様子を揶揄していた時代があったはずが、電車内のケータイマナーとして喋ることは禁じられるようになった。 しかし、今目の前にあるドコモの「らくらくホン プレミアム」は違っていた。「今、2時38分です。会議はもう少しかかりますので、次の会議を4時半からにしてもらえますか?よろしくおねがいします」とケータイに向かって喋っているのは、アドバンスト・メディア代表取締役会長の鈴木清幸氏。AmiVoiceという音声認識システムを開発・販売している企業である。 機械が人の「言うことを聞く」世界観 お邪魔したアドバンスト・メディアのオフィス内にある会議室のテーブルの上には家庭にもありそうな電話機の子機が置いてある。鈴木氏がその受話器を耳に当て、「スラ
Statistical Language Modeling Toolkit The CMU-Cambridge Statistical Language Modeling toolkit is a suite of UNIX software tools to facilitate the construction and testing of statistical language models. Version 1 was written by Roni Rosenfeld at Carnegie Mellon University. The toolkit has now been rewritten by Philip Clarkson and Roni Rosenfeld, and now provides increased functionality and efficie
Palmkit Homepage Palmkit (Publicly Available Language Modeling Toolkit)は、n-gram言語モデルが簡単に作成できるツールキットです。 What's New 最新版は 1.0.32 です. メーリングリストを作りました.ユーザの方はお気軽に登録を. 参加方法はこちらを ごらんください. 特徴 CMU-Cambridge Statistical Language Modeling Toolkit とコマンドレベルで互換。 クラスn-gramのサポート。(単語クラスタリング機能は含まれていません) 組み合わせ言語モデルのサポート。 動作環境 Linux, FreeBSD 等UNIX互換環境 ダウンロード 最新版:version 1.0.32 (tar.gz形式) 更新履歴はこちら . ドキュメント HTML版はここ からどう
和歌山大学メディアインテリジェンス研究室(西村竜一研究室)† 本研究室では、音声や画像、動画、自然言語、センサなどの「メディア」を活用した認識・理解の知的技術によって、人と人、人と機械の協働を豊かなものにするための教育・研究を行います。 2019年度から活動している研究室です。 本研究室の学部生は、システム工学部 メディアデザインメジャーに所属しています。大学院生の所属は、システム工学研究科 知的モデリングクラスタです。 なお、本研究室は、西村が所属(担当)するデータ・インテリジェンス教育研究部門及び学生自主創造支援部門(クリエ)とも協働することで教育・研究活動を進めています。 今後は、社会インフォマティクス学環の学生の受入も行う予定です。 ↑ お知らせ† 2023/12/9 大学院生(M2)の日田さんが国立研究開発法人情報通信研究機構(NICT)の研究員みなさまと共著で発表した『複数話者
$B!JpJs=hM}3X2q!!2;@pJs=hM}8&5f2q (B $BO"B32;@ Continuous Speech Recognition Consortium (CSRC) $BO"B32;@pJs=hM}3X2q (B $B2;@pJs=hM}8&5f2q$N$b$H$G (B2000 $BG/EY$+$i (B2002 $BG/EY$^$G (B (2003 $BG/ (B9 $B7n$^$G (B) $B3hF0$r9T$C$F$-$^$7$?!# (B $B$4;?F1!&$4;Y1gD:$-$^$7$?J}!9$K$O?e$2$^$9!# (B $B%3%s%=! $B%=%U%H%&%'%"3+H/$N;X?K (B $B 2000 $BG/EYHG%=%U%H%&%'%"$N$40FFb (B 2001 $BG/EYHG%=%U%H%&%'
「音声認識」そのものは素人には敷居が高いテーマですが,肝心の「認識」の部分については マイクロソフトから音声認識用のSDKが無償で提供されていますので, 「音声認識をしてなにかするソフト」を作ること自体はそう難しいことではありません。 音声認識で動作するソフトが自作できるようになると,声で動くゲームを作ったり, ロボットに声で指令を与えたり,家電を声でコントロールしたりと,いろいろ夢が広がります。 今回はそのSDKのインストールと,サンプルプログラムのいじり方,音声認識エンジンのカスタマイズ の仕方などについて紹介したいと思います。 これを読んで得られるもの ここに書いてある内容をそのままやれば, Windowsで,マイクからの音声入力を使って何かするプログラムが作れるようになる 『ドラゴンボール』など任意の単語も認識できるようになる はずです。 実験を行った基本ソフトウェア環境 今回のコ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く