murawakiのブックマーク / 2011年1月22日

TokyoNLP #4 を開催しました - nokunoの日記

11 users
d.hatena.ne.jp/nokuno
世の中

第4回自然言語処理勉強会＠東京 : ATND N-gram Language Model for Speech Recognition by @y_shindoh さん音声認識の概要音声データ（音声特徴量MFC,PLP)→音声認識エンジン（デコーダ）→音声認識結果音響モデル＋言語モデル音声特徴量（MFC）：LPCM→スペクトル→MFC フレーミング、ハミング窓、高域強調フィルタ、FFT 絶対値→聴覚フィルタ→対数化→DCT 階層モデル：単語→モーラ→音素読みが複数ある場合は？→両方考える、確率を振ることもある音声認識のしくみ高周波を落とした場合（電話など）は？ →専用の音響モデルを作ったり、ローカルで特徴抽出したり音声認識の種類：独立単語型、記述文法型（CFG）、ディクテーション型（N-gram）音声認識では通常3-gramが用いられる。単語N-gramの高精度化と0頻

はてなブックマーク

タグ

2011年1月22日のブックマーク (1件)

TokyoNLP #4 を開催しました - nokunoの日記

お知らせ

今週のはてなブックマーク数ランキング（2024年11月第1週）

月間はてなブックマーク数ランキング（2024年10月）

今週のはてなブックマーク数ランキング（2024年10月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス