次へ: 目次 目次 確率的言語モデルによる自由発話認識に関する研究 博士(工学) 村上仁一 豊橋技術科学大学 論文要旨 確率的言語モデルによる自由発話認識に関する研究 日本文音声入力においては、音声の持つ物理的特性に着目した音声認識装置の 限界を克服するため、日本語の文法や意味を用いた自然言語処理を併用するこ との必要性が指摘されている。この場合の言語処理の方法として、多くの言語 モデルがあるが、大きく分類してルールベースの言語モデルと確率ベースの言 語モデルがある。 言語の確率ベースの研究を行なう場合、基本的には大量のテキストデー タ量が必要である。英語ではデータベースの重要性が認識されていて古くから Brown corpusやAP corpusなどがあるが、しかし日本語ではコンピュータに読 み込める形式で利用できる大量のデータベースが最近まで存在していなかった。 そのため、確率的な言語
データ作成 HTKDemoの離散HMM(状態数:3, VQcodebook:64-64-16(Linear))を参考に使い方を一通り眺めてみる. tidata/ TIMIDデータベースより10文(7文:training,3文:testing) 発音記号ファイル(tidata/*.phn) →[HLEd, (edfiles/*.led)] → ラベルファイ ル(label/bcplabs/mon/*.lab) 音声ファイル(tidata/*.adc) →[HCopy]→ 特徴量ファイル(data/*/*.mfc) ネットワークファイル monNetworkを編集 % HParse networks/monNetwork(gram) networks/monLattice(wdnet:Standard Lattice Format(SLF)) networks/monNetwork $phn
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く