[B! sound] haru-sのブックマーク

第4章フロントエンド処理・特徴量抽出

特徴量抽出の前段階として，直流成分除去を行える．直流成分であるオフセット値の推定方法として，短時間音声区間（フレーム）ごとに行う方法（オプション-zmeanframe）と，長時間平均を用いる方法（オプション-zmean）の二とおりが用意されている．前者は，特徴抽出の直前において，切り出された短時間フレームごとにオフセット推定と除去を行う．後者は，Julius起動後，無音を含めた最初の 48,000 サンプル分の振幅平均を直流成分（オフセット）として以降の入力の直流成分除去を行う． -zmeanframe は HTK の ZMEANSOURCE と同じ処理である．オプション指定時の注意：前者の -zmeanframe は，特徴量抽出のオプションであり，音響モデルごとに指定する必要がある．特に，複数の音響モデルを使用する場合，音響モデルごとに個別に指定する必要がある．一方，後者の -zmea

haru-s 2011/03/03

sound
研究

リンク

メル周波数ケプストラム（MFCC） - Miyazawa’s Pukiwiki 公開版

スペクトラム（spectrum）とは † 音声や地震波などの周期性のある信号は、どれだけ複雑な信号であっても、単純な波に分解できる（フーリエの定理）単純な波...単一の周波数と振幅をもつ正弦波、余弦波上記の定理に従って、ある信号の周波数成分と振幅の成分を抽出したものが、周波数スペクトラム（スペクトル）です*1。スペクトラムの求め方（MATLABによる説明）以下のような複雑な波を考えます。 MATLABで上の波を生成するには、以下のコードを実行 time = 0 : 1 / 8820 : 0.05; sinwav_1 = 1.2 * sin(2 * pi * 130 * time); coswav_1 = 0.9 * cos(2 * pi * 200 * time); sinwav_2 = 1.8 * sin(2 * pi * 260 * time); coswav_2 = 1.4

haru-s 2011/03/03

リンク

Microsoft PowerPoint - 信号処理工学II_No3.ppt

Outline 信号処理工学II 第３回：音声信号処理その２～処理編～音声処理の必要性音声処理の基本 – フレーム化と重複加算フーリエ変換の欠点と短時間フーリエ変換スペクルサブトラクション(SS) 時間周波数解析 – 雑音除去の手法電気通信大学電子工学専攻電子知能システム学講座長井隆行 – 課題１音声信号処理の必要性音声認識率の向上音声品質の向上 – 音の伝わり方（実際はもっと複雑No.2, p.7）音声×伝達関数＋ノイズ壁や物体ノイズ ˆ S ( z) N ( z) 電話などでの利用残響 R( z) ノイズ除去音声強調残響除去音源分離直接波 S ( z) （時間遅延）部屋（空間）の伝達関数（room impulse response）ノイズ音声×伝達関数＋ノイズ一般的な会議室でのインパルス応答直接波成分 R(

haru-s 2011/03/03

信号処理工学/音声信号処理

sound
研究

リンク

Windowsのwavein/waveout系関数を使って録音再生をするプログラムを作っています． WaveFormatExで指定できる音声フォーマットとwaveInGetDevCapsで取得できるデ…

Windowsのwavein/waveout系関数を使って録音再生をするプログラムを作っています． WaveFormatExで指定できる音声フォーマットとwaveInGetDevCapsで取得できるデバイス性能の関係がわからなくて困っています． waveInGetDevCapsが「ビットレートが16bitsの入力デバイス」と返してきたときに， WaveFormatExで8bitsのビットレートで録音する指定をしても問題なく録音できていますが，これは実際にはどちらの値で録音されているのでしょうか？性能が16bitsなら，16bits以下である8bitsの指定が可能であるということでしょうか．同様にビットレートでなくチャンネル数についてはどうなのでしょうか．

haru-s 2011/03/02

リンク

bluetooth マイクからの音声入力

haru-s 2010/10/31

wave

リンク

waveOut*** 系の罠 - Code & Note

社会人n年目に突入してしまいました。ドラムのこと、プログラムのこと、ネットワークのことなど。雑記です。 Windows API に waveOut*** というのがある。とあるプログラムで、この関数を利用していた。これを使うときは、まず waveOutOpen を呼ぶ必要があるのだが、俺はここで引数に、コールバック関数を指定していた。そこまではよし。そのコールバック関数の中で、グローバル変数にアクセスしていたので、 EnterCriticalSection で排他制御をかけた。これがまずかった。何がまずいのかというと、以下 MSDN に書かれている文章を抜粋。関数 EnterCriticalSection、LeaveCriticalSection、midiOutLongMsg、midiOutShortMsg、OutputDebugString、PostMessage、Po

haru-s 2010/10/31

これかあああああああああ

リンク

音声の入力

入力デバイスから録音する低レベル API を用いることで、入力デバイスから、直接バッファに音声を入力できます開発者から見れば、「録音」というよりも、「入力」という言葉が適切でしょう音声の入力も、出力とやり方は基本的に同じです入力デバイスは、割り当てられたバッファ分だけ音声を記録しバッファが一杯になれば、メッセージを使ってアプリケーションにバッファを返します音声入力デバイスの代表は、マイク入力でしょうこの他でも、音声入力デバイスであれば、この場は何でもかまいません音声出力同様に、最初は waveInOpen() 関数を使いますこの関数は、ウェーブフォームオーディオ入力デバイスのハンドルを取得します MMRESULT waveInOpen( LPHWAVEIN phwi , UINT uDeviceID , LPWAVEFORMATEX pwfx , DWORD dwCall

haru-s 2010/10/30

いいのが見つかった

リンク

はてなブックマーク

タグ

関連タグで絞り込む (6)

soundに関するharu-sのブックマーク (7)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第3週）

今週のはてなブックマーク数ランキング（2024年7月第2週）

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス