タグ

soundに関するharu-sのブックマーク (7)

  • 第4章 フロントエンド処理・特徴量抽出

    特徴量抽出の前段階として,直流成分除去を行える.直流成分であるオフセット値の推定方法として,短時間音声区間(フレーム)ごとに行う方法(オプション-zmeanframe)と,長時間平均を用いる方法(オプション-zmean)の二とおりが用意されている.前者は,特徴抽出の直前において,切り出された短時間フレームごとにオフセット推定と除去を行う.後者は,Julius起動後,無音を含めた最初の 48,000 サンプル分の振幅平均を直流成分(オフセット)として以降の入力の直流成分除去を行う. -zmeanframe は HTK の ZMEANSOURCE と同じ処理である. オプション指定時の注意:前者の -zmeanframe は,特徴量抽出のオプションであり,音響モデルごとに指定する必要がある.特に,複数の音響モデルを使用する場合,音響モデルごとに個別に指定する必要がある.一方,後者の -zmea

  • メル周波数ケプストラム(MFCC) - Miyazawa’s Pukiwiki 公開版

    スペクトラム(spectrum)とは † 音声や地震波などの周期性のある信号は、どれだけ複雑な信号であっても、単純な波に分解できる(フーリエの定理) 単純な波...単一の周波数と振幅をもつ正弦波、余弦波 上記の定理に従って、ある信号の周波数成分と振幅の成分を抽出したものが、周波数スペクトラム(スペクトル)です*1。 スペクトラムの求め方(MATLABによる説明) 以下のような複雑な波を考えます。 MATLABで上の波を生成するには、以下のコードを実行 time = 0 : 1 / 8820 : 0.05; sinwav_1 = 1.2 * sin(2 * pi * 130 * time); coswav_1 = 0.9 * cos(2 * pi * 200 * time); sinwav_2 = 1.8 * sin(2 * pi * 260 * time); coswav_2 = 1.4

  • Microsoft PowerPoint - 信号処理工学II_No3.ppt

    Outline 信号処理工学II 第3回:音声信号処理その2~処理編~ 音声処理の必要性 音声処理の基 – フレーム化と重複加算 フーリエ変換の欠点と短時間フーリエ変換 スペクルサブトラクション(SS) 時間周波数解析 – 雑音除去の手法 電気通信大学電子工学専攻 電子知能システム学講座 長井隆行 – 課題1 音声信号処理の必要性 音声認識率の向上 音声品質の向上 – 音の伝わり方 (実際はもっと複雑No.2, p.7) 音声×伝達関数+ノイズ 壁や物体 ノイズ ˆ S ( z) N ( z) 電話などでの利用 残響 R( z) ノイズ除去 音声強調 残響除去 音源分離 直接波 S ( z) (時間遅延) 部屋(空間)の伝達関数 (room impulse response) ノイズ 音声×伝達関数+ノイズ 一般的な会議室でのインパルス応答 直接波成分 R(

    haru-s
    haru-s 2011/03/03
    信号処理工学/音声信号処理
  • Windowsのwavein/waveout系関数を使って録音再生をするプログラムを作っています. WaveFormatExで指定できる音声フォーマットとwaveInGetDevCapsで取得できるデ…

    Windowsのwavein/waveout系関数を使って録音再生をするプログラムを作っています. WaveFormatExで指定できる音声フォーマットとwaveInGetDevCapsで取得できるデバイス性能の関係がわからなくて困っています. waveInGetDevCapsが「ビットレートが16bitsの入力デバイス」と返してきたときに, WaveFormatExで8bitsのビットレートで録音する指定をしても問題なく録音できていますが, これは実際にはどちらの値で録音されているのでしょうか? 性能が16bitsなら,16bits以下である8bitsの指定が可能であるということでしょうか. 同様にビットレートでなくチャンネル数についてはどうなのでしょうか.

  • bluetooth マイクからの音声入力

  • waveOut*** 系の罠 - Code & Note

    社会人n年目に突入してしまいました。ドラムのこと、プログラムのこと、ネットワークのことなど。 雑記です。 Windows API に waveOut*** というのがある。 とあるプログラムで、この関数を利用していた。 これを使うときは、まず waveOutOpen を呼ぶ必要があるのだが、 俺はここで引数に、コールバック関数を指定していた。 そこまではよし。 そのコールバック関数の中で、グローバル変数にアクセスしていたので、 EnterCriticalSection で排他制御をかけた。 これがまずかった。 何がまずいのかというと、以下 MSDN に書かれている文章を抜粋。 関数 EnterCriticalSection、LeaveCriticalSection、midiOutLongMsg、midiOutShortMsg、OutputDebugString、PostMessage、Po

    haru-s
    haru-s 2010/10/31
    これかあああああああああ
  • 音声の入力

    入力デバイスから録音する 低レベル API を用いることで、入力デバイスから、直接バッファに音声を入力できます 開発者から見れば、「録音」というよりも、「入力」という言葉が適切でしょう 音声の入力も、出力とやり方は基的に同じです 入力デバイスは、割り当てられたバッファ分だけ音声を記録し バッファが一杯になれば、メッセージを使ってアプリケーションにバッファを返します 音声入力デバイスの代表は、マイク入力でしょう この他でも、音声入力デバイスであれば、この場は何でもかまいません 音声出力同様に、最初は waveInOpen() 関数を使います この関数は、ウェーブフォームオーディオ入力デバイスのハンドルを取得します MMRESULT waveInOpen( LPHWAVEIN phwi , UINT uDeviceID , LPWAVEFORMATEX pwfx , DWORD dwCall

    haru-s
    haru-s 2010/10/30
    いいのが見つかった
  • 1