audioに関するmoutendのブックマーク (28)

  • Real-time pitch shifting (without change of duration) | iq¹²

    After reading Lee Brimelow’s post about Adjusting audio pitch in Flash Player 10, I’ve thinked about a real pitch shifting solution (adjusting pitch without change of duration). Then I found a great algorithm here: http://www.dspdimension.com/admin/pitch-shifting-using-the-ft/ and its C# port here http://sites.google.com/site/mikescoderama/pitch-shifting I’ve ported the code to AS3 then heavily op

  • oreilly.com

    More than 5,000 companies count on our digital courses and more to guide their teams through the tools and technologies that drive business outcomes. We can help yours too. New AI policy for O’Reilly authors and talent O’Reilly president Laura Baldwin shares the company’s ethical approach to leveraging GenAI tools and ensuring O’Reilly experts are compensated for their work. See it now It’s time t

    oreilly.com
  • 位相ボコーダーを使用したピッチ シフトと時間伸長 - MATLAB & Simulink Example - MathWorks 日本

    この例では、オーディオ信号のタイム ストレッチとピッチ スケールを行う位相ボコーダーを実装する方法を示します。 はじめに位相ボコーダーは、音声を周波数領域に変換して、タイム ストレッチとピッチ スケールを実行します。位相ボコーダーの実装に必要な演算を次のブロック線図に示します。 位相ボコーダーには、オーバーラップした短時間 FFT (ST-FFT) を実行する解析セクションと、オーバーラップした逆短時間 FFT (IST-FFT) を実行する合成セクションがあります。信号をタイム ストレッチするため、位相ボコーダーは合成セクションのオーバーラップ加算演算に解析セクションより大きいホップ サイズを使用します。ここでホップ サイズは一度に処理されるサンプルの数です。この結果、周波数成分は同じでも、出力時のサンプル数が入力時よりも多くなります。これで、より高いサンプルレートでこの信号を再生するこ

    位相ボコーダーを使用したピッチ シフトと時間伸長 - MATLAB & Simulink Example - MathWorks 日本
  • 音パレット

    音パレットでは, 複数の楽器音を分析することで音色の歪みを抑えて楽器音の高さや長さを操作する ことができます[1]. ここでの音色の歪みとは, 操作された音と同じ音高・音長をもつ実楽器から発音された音との, 音色上での差異を指します. 例えばピアノの音を従来技術で1オクターブ上げた合成音と, 合成音と同じ音の高さを持つ実際のピアノから発音された音では, 1オクターブ違うと楽器内の発音機構・部位が大きく異なるので, 違う音色に聴こえます. 音の長さにおいても, 従来技術での操作ではアタック音やヴィブラートの特徴が歪められました. 従来にも音の高さや長さを変える技術はいくつか存在したのですが, 音パレットでは過去の音響心理学の知見[2]に基づき, 音色を数理モデルとして表現することで品質の高い音高・音長操作を実現してます. なお,楽器音が手元にひとつ(の高さ)しかない場合でも, 従来技術と同様

    moutend
    moutend 2015/01/05
    考案者がメタラーと知って只ならぬシンパシーを感じている
  • http://ist.ksc.kwansei.ac.jp/~katayose/lecture/4_5_sound_synthesis.pdf

  • フェーズボコーダ - Wikipedia

    フェーズボコーダ(英語: Phase vocoder)は音声信号を周波数領域の振幅と位相でモデル化するボコーダである[1][注釈 1]。 フェーズボコーダの心臓部は短時間フーリエ変換 (STFT)であり、次の段階を経る。 分析:  STFTによる時間領域表現→時間-周波数表現(英語版)変換 変更:  任意の周波数成分の振幅・位相操作 再合成: 逆STFTによる周波数領域表現→時間領域表現変換 フェーズボコーダは周波数領域での変更処理により音声信号の時間伸縮とピッチ変換などを可能にする。また再合成前にSTFT分析フレームの時間的位置を変更すれば、再合成結果の時間発展を変更でき、たとえば音の時間スケール変更を実現できる。 位相コヒーレンス問題はSTFTによる時間-周波数表現 (STFT表現) の操作で必ず解決が必要な主要問題である。これは、時間軸方向にオーバーラップした分析窓(窓関数)を使用す

  • AudioStretch – real-time audio time-stretching and pitch-shifting in ActionScript | Gerry Beauregard

  • VS4Uの内部処理と周波数表の仕組み

    UTAU向けエンジン「VS4U」の内部処理と周波数表の仕組みについて解説します。 伸縮器(resampler)とは 伸縮器(resampler)は原音・周波数表を読み込み、パラメータに従い音声ファイルを出力します。 伸縮器は主に以下の処理を行います。 フォルマントの変更(gフラグの適用) ピッチの変更(音階、tフラグ、モジュレーション、ピッチベンドの適用) タイムストレッチ(長さ、子音速度、オフセット、子音部、ブランクの適用) その他(音量、フィルタ等) ※処理内容はエンジンによって異なります。 VS4Uの内部処理は、以下の5つに分けられます。 波形の伸縮 1波長単位での再配置 1波長単位での削除、複製 フォルマント修正 音量変更、フィルタの適用 処理1:波形の伸縮 時間方向に波形を伸縮します。 波形を伸縮することで長さ(再生時間)が変化しますが、 このとき波の周期も変化するため、ピッチが

    VS4Uの内部処理と周波数表の仕組み
  • 位相ボコーダーを使用したピッチ シフトと時間伸長 - MATLAB & Simulink Example - MathWorks 日本

  • AudioParam Viewer - 音の鳴るブログ

    Web Audio API の AudioParam の値を可視化できるやつを作った。 AudioParam Viewer コードを書いて実行(eval)すると30秒分の値の遷移を記録してグラフ表示します。param というのが操作する AudioParam のインスタンスで、Ctrl+O か Ctrl+Space で操作関数を補完できます。 仕組み Web Audio API はリアルタイムでオーディオ処理をするためのAPIだと思われがちだけど、OfflineAudioContext というのを使えば静的なオーディオ処理もできます。以下は簡単な使い方。レンダリング用のインターフェースがあるだけで基的には AudioContext と同じように使えます。これを使うと30秒の処理を一瞬で行うことができるので、それを使って常に 1 を出力する AudioBufferSource とパラメータ

    AudioParam Viewer - 音の鳴るブログ
    moutend
    moutend 2014/12/29
    ハマった > OfflineAudioContext はイベントを介した操作はまずできなくて...
  • FFT (高速フーリエ・コサイン・サイン変換) の概略と設計法

    はじめに FFT とは離散フーリエ変換に関連する変換を高速に実行する一連の 計算方法のことです.ここでは,FFT の考え方とその設計方法について 具体的なプログラムを用いて示します.これは,FFT のライブラリを 作成したときのメモがもとになっています.専門的な説明は極力避けたので, エレガントでない説明になっているかもしれません.基礎知識として, 複素数の演算規則とフーリエ変換が何かということさえ知っていれば 理解できると思います.また,数学の知識がある程度あり 時間を節約したい方は, 1.2節と1.3節の要約(pdf 53KB) を一読していただければ速く理解できると思います. 目次 1 FFT 概略 1.1 離散 Fourier 変換 1.1.1 DFT の定義 1.1.2 DFT と通常の Fourier 変換 1.1.3 DFT の性質 1.2 Cooley-Tukey 型 FF

  • 新 フーリエの冒険 ~Visual編~

    「全身を真綿でくるみ、さらにホウタイでぐるぐる巻きにして、真夏でも閉めきった部屋の中で思索した」(フーリエ自伝より)。若くして「フーリエ級数」を発表したフーリエは、数学者であると同時に、エジプト文明の研究に熱中した考古学者でもありました。猛暑の中で研究すると、スムースに研究がはかどるという彼の奇人ぶりはとても徹底していたようです。 さて、そんな彼が発見した「同じ周期を持つ波はどんなに複雑なものでも単純な波の合成である」という事柄をコンピュータを用いてシミュレートしてみましょう。 非常に複雑に見える事柄でも、コンピュータを用いれば少しは簡単に見えることがあります。そんな1つのテーマとして「フーリエ級数」を選んでみました。フーリエの発見したフーリエ級数の式と展開式は というとても難しい式をしています。この式の持つ意味が短時間で理解でき、最後に身近に感じれるものとなればよいのですが。 なお、この

  • 離散フーリエ変換 その1 | Objective-Audio

    MacとかiPhoneとかあまり関係なく基礎を固めようと思っていろいろ勉強モードに入っていまして、すこしずつまとめていこうと思います。まずはフーリエ変換についてです。 あくまでプログラムで使う事を前提に書いていきますので、いろいろおかしかったりするかもしれませんがご了承ください。もし、明らかに変だったら突っ込んでいただけるとうれしいです。基的に小難しそうな数式とかはできるだけ出さずにコード重視、ビジュアル重視で書いていくつもりです。 プログラミングでフーリエ変換というと、高速フーリエ変換(FFT)を使うという事になると思うのですが、FFTについては特に詳しく書きません。プログラム化されたコードを見た場合、FFTだと高速化されたアルゴリズムだけで質的な部分がわからないので、高速化していないノーマルな離散フーリエ変換(DFT)のプログラムを見て、フーリエ変換の仕組みを調べていきます。 オー

  • Introduction to Audio Digital Signal Processing on Linux

  • Audio Signal Processing for Music Applications

    In this course you will learn about audio signal processing methodologies that are specific for music and of use in real applications. We focus on the spectral processing techniques of relevance for the description and transformation of sounds, developing the basic theoretical and practical knowledge with which to analyze, synthesize, transform and describe audio signals in the context of music ap

    Audio Signal Processing for Music Applications
    moutend
    moutend 2014/12/03
    Audio Signal Processing for Music Applications
  • 簡単なデジタルフィルタの実装 | C++でVST作り

    プログラムでデジタル楽器やエフェクターなどの作成を作成していると、必ず必要になってくるのがデジタルフィルタ(ローパスフィルタやハイパスフィルタ等)です。 しかし、「1,000Hz以下を通すローパスフィルタがほしい」等と思って、いざデジタルフィルタを実装しようとすると、フィルタ設計(フィルタ係数の算出)の部分で「Z変換」や「伝達関数」といった高度な数学での説明が始まります。 この時点でハードルが高く、デジタル楽器やエフェクターの作成をあきらめてしまう人が多いのではないでしょうか? ここではよく利用するデジタルフィルタについて、極力高度な数学を使わず簡単にフィルタ設計(フィルタ係数算出)・実装できる方法がありましたので紹介させていただきます。 今回の内容をC++のクラスとして簡単にまとめたものはこちらにあります。 → 簡単なデジタルフィルタのサンプルコード Robert Bristow-Joh

    簡単なデジタルフィルタの実装 | C++でVST作り
  • BiQuadフィルタの料理法 | g200kg Music & Softwares

    音を作る上でとっても重要なフィルタだが、デジタルフィルタという奴はあまりに自由度があってどう設計するべきか悩んでしまうのだ。 が、デジタルフィルタの中でBiQuad型という奴は割合特性をコントロールしやすく、割合自由が効くという丁度いい感じなので色々と固まったノウハウがあるのだ。 このBiQuadフィルタの係数の設計について Robert Bristow-Johnson という人が書いた有名な"Cookbook formulae for audio EQ biquad filter coefficients,"という文書があって、RBJ cookbookとか呼ばれている。 とっても役に立つので意訳気味に翻訳した。 原典はhttp://www.musicdsp.org/files/Audio-EQ-Cookbook.txtを参照してくれ。 ちなみにデジタルフィルタの基的な部分についてはht

  • eSpeakと日本語 - Ryusei’s Notes (a.k.a. M59のブログ)

    2011/08/24 追記: ここに書いてあることは多分にデタラメを含んでいるから、当にeSpeakで日語に対応させたかったら別のちゃんとした文書をあたったほうがよい。 eSpeakはオープンソースのスピーチシンセサイザー。フォルマント合成で音声合成を実現している。 英語をはじめ、ヒンディー語やスワヒリ語、中国語など数多くの言語に対応しているが、未だ日語には対応していない。 既にある言語を元に少しデータを加えれば、日語に対応させることは比較的容易に思われたので、少し試してみた。 導入 eSpeak: Speech Synthesizer バージョン1.43のソースコードと、espeakeditをダウンロードしてくる。 Ubuntuの場合は、最初から入っているespeakとインストールされるパスが重なるので、気になる場合はMakefile内のPREFIXを /usr/local に変

    eSpeakと日本語 - Ryusei’s Notes (a.k.a. M59のブログ)
  • Pitch Detector

  • Web Audio/MIDI Demo List | W3C Audio WG

    Web Audio/MIDI List A list of Web Audio API demos and applications. Contributing To add a demo to this list, send a pull request, or contact post to the W3C Web Audio mailing list.