タグ

waveに関するsotukenyouのブックマーク (9)

  • メル周波数ケプストラム係数(MFCC) - 人工知能に関する断創録

    Pythonで音声信号処理(2011/05/14)の第19回目。 今回は、音声認識の特徴量としてよく見かけるメル周波数ケプストラム係数(Mel-Frequency Cepstrum Coefficients)を求めてみました。いわゆるMFCCです。 MFCCはケプストラム(2012/2/11)と同じく声道特性を表す特徴量です。ケプストラムとMFCCの違いはMFCCが人間の音声知覚の特徴を考慮していることです。メルという言葉がそれを表しています。 MFCCの抽出手順をまとめると プリエンファシスフィルタで波形の高域成分を強調する 窓関数をかけた後にFFTして振幅スペクトルを求める 振幅スペクトルにメルフィルタバンクをかけて圧縮する 上記の圧縮した数値列を信号とみなして離散コサイン変換する 得られたケプストラムの低次成分がMFCC となります。私が参考にしたコードは振幅スペクトルを使ってたけど

    メル周波数ケプストラム係数(MFCC) - 人工知能に関する断創録
  • 短時間フーリエ変換 - Wikipedia

    この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "短時間フーリエ変換" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL(2023年1月) 短時間フーリエ変換(たんじかんフーリエへんかん、short-time Fourier transform、short-term Fourier transform、STFT)とは、関数に窓関数をずらしながら掛けて、それにフーリエ変換すること。音声など時間変化する信号の周波数と位相(の変化)を解析するためによく使われる。 理論上フーリエ係数を求めるには無限の区間に渡って積分を行わなければならないが、実験値等からフーリエ係数を求めるには範囲を区切らなければな

  • フォーマット変換画面 | SoundEngineヘルプ

    音声ファイルのWaveフォーマットを変更します。サンプリング周波数、チャンネル数、ビット数を変更することが可能です。 ヘルプカフェでの動画解説版は、「08. サンプリング周波数やビット数を変換したい!~フォーマット変換画面 (0:56) | SoundEngine #1 導入」です。 画面 編集メニューのフォーマット変換を選択すると画面が表示されます。 サンプリング周波数 サンプリング周波数を設定します。4000-192000Hzまで選択可能です。CD品質だと44100Hz、DAT/DV品質だと48000Hz、電話品質だと8000Hz、AMラジオ品質だと22050Hz、FMラジオ品質だと32000Hz、Skype品質だと16000Hzに指定して下さい。 ビット数 量子化の細かさを設定します。8、16、24bitから選択可能です。電話品質だと8bit、CD品質だと16bit、それ以上の品質の

  • http://www.mars.dti.ne.jp/~stamio/sound.htm

  • 3次元声道形状の音響管モデル化がフォルマント周波数に及ぼす影響 | CiNii Research

  • 共鳴管方式 - Wikipedia

    共鳴管方式は、スピーカーシステム(スピーカーユニットとそれを取り付けるエンクロージャーの構成など)における一方式で、パイプ状の管の気柱の固有振動を利用して低音を増強するものである。これに対し、ヘルムホルツ共鳴による共鳴箱は、オーディオ分野ではバスレフ型方式と呼んでいる。 原理[編集] 原理としては単純なものであり、楽器の笛と同じものである。長い直管(パイプ)はその長さに比例した波長の音に共鳴する。双方が開いた管は管の長さの倍の波長を、片方が開いた管は管の長さの4倍の波長を、双方が閉じた管は管の長さの8倍の波長が基底共振周波数である。またその整数倍の周波数の成分(高調波)でも共鳴する。特に奇数倍の周波数の音(奇数次高調波)でも共鳴が起き、この共鳴は音質的にはあまり好ましく無いとされ、これをどう抑えるかが鍵となる(但し、奇数次高調波を「良くない」とする見解には、異論もある)。 具体例[編集]

  • MathWorks 日本 - WAVE (.wav) サウンド ファイルの読み込み - MATLAB

  • サンプリング周波数と音質

    ※:差分データを取り出すためにはデータ数(サンプル数)を合わせる必要があり、いったんサンプリング周波数を下げてから「44.1kHz」に 再変換してあります。(従って、ファイルサイズはすべて”561kB”です) 【波形を見ながら視聴する】 FFT波形を見ながら視聴できますので、音質と上限周波数(ナイキスト周波数)の関係が確認できます。 FFT波形画像には、削られた周波数範囲を表示してあります。 ● オリジナル(基準)WAVE(44.1kHz) ------ (561kB) 再生 ● 32kHz 再生(407kB)                    削られた音(561kB) ● 22.05kHz 再生(281kB)                    削られた音(561kB) ● 16kHz 再生(204kB)                    削られた音(561kB) ● 11.0

  • PCM の基本

    サンプリングレートと音 さて、ここからしばらくはコンピュータと音の関係について深入りしたいと思います すでにご存知の通り、コンピュータに格納されているデータは全てが「情報」であり 音楽やグラフィックスなど、アートもひとつの「情報」として格納されています コンピュータにおける情報とは、数学的に一意に認識できる意味のある数列です 音楽もまた、DIB のように数字の列として表現することができるのです グラフィックスの RGB は直感的に理解しやすく 特別な数学知識などは必要なく理解し、操作することができました しかし、音声の場合は音の高さ、大きさなどを表現するために 数学的、物理学的、音楽学的知識を要するため、それなりの基礎知識が求められます ここで扱う音とは、Windows で最も一般的なマルチメディアと思われる、波形オーディオです コンピュータでは、物理的な空気振動によって発生する「音」を数

  • 1