[B! 音声認識] pekeqのブックマーク

CMU Sphinx / Forums / Sphinx4 Help: Configuring S4 to work in allphone style mode

pekeq 2006/08/01

リンク

UnitTimestamps < Sphinx4 < TWiki

pekeq 2006/08/01

リンク

次へ: 目次目次確率的言語モデルによる自由発話認識に関する研究博士（工学）村上仁一豊橋技術科学大学論文要旨確率的言語モデルによる自由発話認識に関する研究日本文音声入力においては、音声の持つ物理的特性に着目した音声認識装置の限界を克服するため、日本語の文法や意味を用いた自然言語処理を併用することの必要性が指摘されている。この場合の言語処理の方法として、多くの言語モデルがあるが、大きく分類してルールベースの言語モデルと確率ベースの言語モデルがある。言語の確率ベースの研究を行なう場合、基本的には大量のテキストデータ量が必要である。英語ではデータベースの重要性が認識されていて古くから Brown corpusやAP corpusなどがあるが、しかし日本語ではコンピュータに読み込める形式で利用できる大量のデータベースが最近まで存在していなかった。そのため、確率的な言語

pekeq 2006/08/01

音声認識

リンク

マルチバンド版 Julius

更新情報 2005/07/14 ページ公開，マルチバンド版 Julius 1.0 公開 2006/02/06　マルチバンド版 Julius 1.1 公開 2006/02/06　マルチバンド版 Julius 1.2 公開はじめにマルチバンド版 Julius は，マルチバンド音声認識や MFT (Missing Feature Theory) に関する研究を行うために大語彙連続音声認識システム Julius を東京工業大学古井研究室で改造したものです．本ページでは，マルチバンド版化のためのパッチを提供します．マルチバンド版 Julius により，音響特徴ベクトルの各次元から得られる音響尤度にユーザが定義した重みをつけて音声認識を行うことができます．雑音の影響などで特徴ベクトルのある次元の信頼度が小さくなった場合には，その次元の重みを小さくすることで音声認識の耐雑音性の向上が期待で

pekeq 2006/07/07

音声認識

リンク

音声認識研究分野へのリンク集

音声認識研究分野へのリンク【お知らせ】作者の大学退学に伴い、このページの更新は今後行いません。

pekeq 2006/05/31

音声認識

リンク

JNAS CDROMからIPA音響モデルの作成法

pekeq 2006/05/25

音声認識

リンク

HMM

HMM で音声認識，動画像認識離散HMM，半連続HMMで音素認識離散HMM，半連続HMMでジェスチャー認識いくつかツールが開発されているが，とりあえずHTK (HMM Tool Kit)を試す． HTKの使い方リンク音声認識 (Julius) http://winnie.kuis.kyoto-u.ac.jp/pub/julius/index.html 音声データベース http://www2.tk.elec.waseda.ac.jp/~koba/onsei-db/ その他のHMMツール http://www.cfar.umd.edu/~kanungo/software/software.html 参考文献 Hidden Markov Models for Speech Recognition: X.D.Huang, Y.Ariki, M.A.Jack, EDINBURGH UNI

pekeq 2006/05/24

音声認識

リンク

大語彙連続音声認識システムJulius

A tag already exists with the provided branch name. Many Git commands accept both tag and branch names, so creating this branch may cause unexpected behavior. Are you sure you want to create this branch?

pekeq 2006/05/24

音声認識

リンク

Open Mind Speech - Free Speech Recognition for Linux

pekeq 2006/05/24

音声認識

リンク

CMUSphinx: The Carnegie Mellon Sphinx Project

The CMU Sphinx Group Open Source Speech Recognition Engines Speech at CMU | Sphinx at SourceForge The Sphinx Group at Carnegie Mellon University is committed to releasing the long-time, DARPA-funded Sphinx projects widely, in order to stimulate the creation of speech-using tools and applications, and to advance the state of the art both directly in speech recognition, as well as in related areas

pekeq 2006/05/24

音声認識

リンク

はてなブックマーク

タグ

関連タグで絞り込む (1)

音声認識に関するpekeqのブックマーク (11)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第3週）

今週のはてなブックマーク数ランキング（2024年7月第2週）

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス