タグ

音声処理に関するhirokistのブックマーク (2)

  • NASKIT» Blog Archive » Androidで音声処理2

    Androboiceってアプリを作ったときのメモ 前回の続き。 で、Androidでどうやって録音するか。 AudioRecordクラスでは前回の音データが取得できる。以下コード。 // サンプルレート 8kHz int SAMPLE_RATE = 8000; // フラグ isRecoding = true; // プロセスの優先度を上げる android.os.Process.setThreadPriority( android.os.Process.THREAD_PRIORITY_URGENT_AUDIO); // バッファサイズを求める サンプルレート8kHz モノラル 16ビット/サンプル int audioBuf = AudioRecord.getMinBufferSize(SAMPLE_RATE, AudioFormat.CHANNEL_CONFIGURATION_MONO,

  • ケプストラム分析 - 人工知能に関する断創録

    Pythonで音声信号処理(2011/05/14)の第18回目。 今回は、音声の特徴量としてよく使われるMFCC(Mel-Frequency Cepstrum Coefficients: メル周波数ケプストラム係数)抽出に向けた第一歩としてケプストラム分析を試しました。Wikipediaでケプストラムの定義を見てみると。 ケプストラムは1963年、Bogertらの論文で定義された。ケプストラムの定義は以下の通り。 口語的定義: (信号の)ケプストラムとは、(信号の)フーリエ変換の対数(位相アンラッピングを施したもの)をフーリエ変換したものである。スペクトルのスペクトルとも呼ばれる。 数学的定義: 信号のケプストラムは FT(log(|FT(信号)|)+j2πm) である。ここで m は、複素対数関数の虚数成分または角度の位相アンラッピングを正しく行うのに必要とされる整数である。 アルゴリズ

    ケプストラム分析 - 人工知能に関する断創録
  • 1