エントリーの編集
![loading...](https://b.st-hatena.com/bdefb8944296a0957e54cebcfefc25c4dcff9f5f/images/v4/public/common/loading@2x.gif)
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
![アプリのスクリーンショット](https://b.st-hatena.com/bdefb8944296a0957e54cebcfefc25c4dcff9f5f/images/v4/public/entry/app-screenshot.png)
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
第5章 音声区間検出・入力棄却
一般に,音声区間検出は,入力ストリームに対して短時間ごとの特徴から音声区間の開始・終了を検出し,... 一般に,音声区間検出は,入力ストリームに対して短時間ごとの特徴から音声区間の開始・終了を検出し,それを元に認識単位の切り出しおよび発話単位の区切りを行う方法である.以下,Julius で用いている方法について解説する. 音声信号の振幅と零交差数に基づいて,音入力の開始と終了を検出する方法である.一定のレベルを越える振幅について零交差数が一定数を越えたとき,音声始端として認識処理を開始する.そして,値が一定以下になったときに,音声の終端としてそこで入力を区切って1発話分の認識を終了する. この方法は最も基本的な方法であり,計算量が少ないという利点がある.ただし,入力の振幅は実行環境(録音ボリューム,マイクと発話者の距離等)に大きく左右され,実行環境ごとにしきい値の調整が必要である.また,SN 比が低い環境では性能が著しく悪化する. この振幅と零交差に基づく入力検知は,デフォルトではマイクロフ