タグ

ブックマーク / julius.osdn.jp (2)

  • 第5章 音声区間検出・入力棄却

    一般に,音声区間検出は,入力ストリームに対して短時間ごとの特徴から音声区間の開始・終了を検出し,それを元に認識単位の切り出しおよび発話単位の区切りを行う方法である.以下,Julius で用いている方法について解説する. 音声信号の振幅と零交差数に基づいて,音入力の開始と終了を検出する方法である.一定のレベルを越える振幅について零交差数が一定数を越えたとき,音声始端として認識処理を開始する.そして,値が一定以下になったときに,音声の終端としてそこで入力を区切って1発話分の認識を終了する. この方法は最も基的な方法であり,計算量が少ないという利点がある.ただし,入力の振幅は実行環境(録音ボリューム,マイクと発話者の距離等)に大きく左右され,実行環境ごとにしきい値の調整が必要である.また,SN 比が低い環境では性能が著しく悪化する. この振幅と零交差に基づく入力検知は,デフォルトではマイクロフ

    rti7743
    rti7743 2012/07/15
  • GitHub - julius-speech/julius: Open-Source Large Vocabulary Continuous Speech Recognition Engine

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session.

    GitHub - julius-speech/julius: Open-Source Large Vocabulary Continuous Speech Recognition Engine
    rti7743
    rti7743 2012/02/10
    うーん
  • 1