次へ: 目次 目次 確率的言語モデルによる自由発話認識に関する研究 博士(工学) 村上仁一 豊橋技術科学大学 論文要旨 確率的言語モデルによる自由発話認識に関する研究 日本文音声入力においては、音声の持つ物理的特性に着目した音声認識装置の 限界を克服するため、日本語の文法や意味を用いた自然言語処理を併用するこ との必要性が指摘されている。この場合の言語処理の方法として、多くの言語 モデルがあるが、大きく分類してルールベースの言語モデルと確率ベースの言 語モデルがある。 言語の確率ベースの研究を行なう場合、基本的には大量のテキストデー タ量が必要である。英語ではデータベースの重要性が認識されていて古くから Brown corpusやAP corpusなどがあるが、しかし日本語ではコンピュータに読 み込める形式で利用できる大量のデータベースが最近まで存在していなかった。 そのため、確率的な言語
更新情報 2005/07/14 ページ公開,マルチバンド版 Julius 1.0 公開 2006/02/06 マルチバンド版 Julius 1.1 公開 2006/02/06 マルチバンド版 Julius 1.2 公開 はじめに マルチバンド版 Julius は,マルチバンド音声認識や MFT (Missing Feature Theory) に関する研究を行うために 大語彙連続音声認識システム Julius を 東京工業大学 古井研究室で改造したものです.本ページでは,マルチバンド版化のためのパッチを提供します. マルチバンド版 Julius により,音響特徴ベクトルの各次元から得られる音響尤度にユーザが定義した重みをつけて音声認識を行うことができます.雑音の影響などで特徴ベクトルのある次元の信頼度が小さくなった場合には,その次元の重みを小さくすることで音声認識の耐雑音性の向上が期待で
HMM で音声認識,動画像認識 離散HMM,半連続HMMで音素認識 離散HMM,半連続HMMでジェスチャー認識 いくつかツールが開発されているが,とりあえずHTK (HMM Tool Kit)を試す. HTKの使い方 リンク 音声認識 (Julius) http://winnie.kuis.kyoto-u.ac.jp/pub/julius/index.html 音声データベース http://www2.tk.elec.waseda.ac.jp/~koba/onsei-db/ その他のHMMツール http://www.cfar.umd.edu/~kanungo/software/software.html 参考文献 Hidden Markov Models for Speech Recognition: X.D.Huang, Y.Ariki, M.A.Jack, EDINBURGH UNI
The CMU Sphinx Group Open Source Speech Recognition Engines Speech at CMU | Sphinx at SourceForge The Sphinx Group at Carnegie Mellon University is committed to releasing the long-time, DARPA-funded Sphinx projects widely, in order to stimulate the creation of speech-using tools and applications, and to advance the state of the art both directly in speech recognition, as well as in related areas
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く