タグ

pythonとsoundに関するlepton9のブックマーク (8)

  • 【Python】プログラムでフーリエ変換を理解しよう!【FFT, 標本化定理, ナイキスト周波数】 | Raccoon Tech Blog [株式会社ラクーンホールディングス 技術戦略部ブログ]

    株式会社ラクーンホールディングスのエンジニア/デザイナーから技術情報をはじめ、世の中のためになることや社内のことなどを発信してます。 pythonnumpyfftdftmatplotlibフーリエ変換高速フーリエ変換ナイキスト周波数標化定理 こんにちは。早く業務に慣れたい開発チーム入社1年目の髙垣です。 急ですが皆さん。ふと、音をフーリエ変換したい時ってありませんか? ありますよね。 でも、「フーリエ変換って学校で計算式で習ったけど、結局は何をしているんだ?」となることありませんか? そこで今回は計算式なんてほっといて、Pythonを使ってフーリエ変換が何をやっているのか体験してみましょう! 環境構築 下記リポジトリをクローンしてください https://github.com/takaT6/fft-tutorial クローンができたら下記のライブラリをインストールしてください↓ pip

    【Python】プログラムでフーリエ変換を理解しよう!【FFT, 標本化定理, ナイキスト周波数】 | Raccoon Tech Blog [株式会社ラクーンホールディングス 技術戦略部ブログ]
  • 「音源分離」の最新手法を解説した、中級者以上向けの実践的な技術書『Pythonで学ぶ音源分離』を8月24日に発売

    インプレスグループでIT関連メディア事業を展開する株式会社インプレス(社:東京都千代田区、代表取締役社長:小川 亨)は、「音源分離」技術の基礎から実装までを解説した書籍『Pythonで学ぶ音源分離 機械学習実践シリーズ』を2020年8月24日(月)に発売いたします。 ■身近なものにも活用される技術「音源分離」の基礎と実装を解説する一冊 近年、AIスピーカをはじめとした、人が話した音声を理解する音声認識システムがさまざまな場面で使われています。一般的に音声認識システムは、1人の声を聞き取ることを想定しており、聞きたい声以外の音が入ってきたときには、聞きたい声を正確に聞き取ることが難しくなります。「音源分離」とはこのようにさまざまな音が混ざった中から、欲しい音だけを抽出する技術です。書では、音源分離の基礎から、Pythonを用いた実装までを詳しく解説しています。 ■音源分離に必要不可欠な数

    「音源分離」の最新手法を解説した、中級者以上向けの実践的な技術書『Pythonで学ぶ音源分離』を8月24日に発売
  • ソフトシンセを作りながら学ぶPythonプログラミング

    PyCon JP 2012のハンズオンセッションで使用したスライドです。ハンズオンに参加して、その場で解説を聞きながら眺めるというようなものなので、あまり自習向けではないです。自習用の資料などは、なんらかのかたちで提供できればと考えています。

    ソフトシンセを作りながら学ぶPythonプログラミング
  • サウンドスペクトログラムに画像を埋め込む - 人工知能に関する断創録

    Pythonで音声信号処理(2011/05/14) 今回は、スペクトログラムを使って遊んでみました。サウンドスペクトログラムって何って人はこちらへ。Pythonでサウンドスペクトログラム(2011/10/1)。 なんとスペクトログラムに任意の画像を埋め込んだ音声が作れるとのこと。こんなふうに。 Aphex TwinというミュージシャンのEquationという曲に埋め込まれた画像だそうです。こんな風に画像をスペクトログラムに簡単に埋め込むツールをいくつか見つけたので遊んでみます。 Coagula Coagulaというツールで画像をスペクトログラムに埋め込んだ音声が作れます。Coagulaを起動したらキャンバスが出てくるのでそこに任意の絵を描きます。F5キーで画像をスペクトログラムに変換し、FileメニューのSave Sound As...でWAVEファイルとして音声を保存できます。WAVEフ

    サウンドスペクトログラムに画像を埋め込む - 人工知能に関する断創録
    lepton9
    lepton9 2011/11/03
    aphex twinのアレ
  • Pythonで音声信号処理 - 人工知能に関する断創録

    今年の目標(2011/1/1)の1つに音声認識技術の深耕というのを立ててます。いきなり音声認識をやるのは知識不足でかなり大変だということが分かったので、まずは音声のいろんな性質や信号処理の技術を一つ一つ試しながら習得していくことにしました。 音声信号処理ではよくMatlabが使われるようなのですが、 Matlabは高くて買えない(フリーのOctaveってのもあります) すでに使っているPython、Rと文法が似ていて混乱する というわけでMatlabはやめてPythonを使います。SciPyにフーリエ変換の機能があったのでたぶん同じようなことができるでしょう。Pythonのいろんな音声関係のライブラリなんかも紹介できればと思います。 当面の目標は、簡単な類似楽曲検索システムを作ることです。その後は、いろんなツール(HTKなど)を駆使して音声認識システムを作りたいと思ってます。 このページは

    Pythonで音声信号処理 - 人工知能に関する断創録
  • 正弦波の合成 - 人工知能に関する断創録

    Pythonで音声信号処理(2011/05/14) 今までは、既存の音声ファイルを再生したり、波形を見たりしてきましたが、今回は、音の波の基となる正弦波や正弦波を合成して作れる三角波、矩形波、ノコギリ波などを自前で作って音を鳴らしてみたいと思います。正弦波の基式は、 です。ここで、Aは振幅、f0は基周波数、tは時間です。今回は、コンピュータで音を扱うので時間を離散化します。 ここで、fsはサンプリング周波数(1秒間のサンプル数)、nはサンプルのインデックスです。これを先の正弦波の式に代入すると となって、tの式をnの式に変換できます。この式を使うと、nサンプル目の波の値が計算できます。 正弦波を作る まずは、ドレミファソラシドの各音階の正弦波を作って鳴らしてみます。正弦波はこんな形。 音だと ドは262Hz、ラは440Hzというように周波数が決められています。周波数の間には、十二平均

    正弦波の合成 - 人工知能に関する断創録
  • ディレイとリバーブ - 人工知能に関する断創録

    Pythonで音声信号処理(2011/05/14) 今回は、サウンドエフェクトのアルゴリズムであるディレイとリバーブを試してみます。私は、PC音楽を聴くとき、いつもコンサートホールのサウンドエフェクトをかけて聴いていますがそれと同じ効果を自分で実装してみたいと思います。サウンドエフェクトをかけながら音楽を聴くと原曲とはちょっと違った感じで楽しいです。 ディレイ まず、ディレイですが、これは現在の時刻の音に過去の音を重ね合わせるサウンドエフェクトです。やまびこみたいな効果ですね。ヤッホー、ヤッホー、ヤッホー(だんだん音は小さくなる)みたいなイメージ。実際に聴いてもらった方がイメージがつかみやすいのでサンプル音声を作ってみました。 こんな感じで最初の音声が遅れて(ディレイ)何度か再生されます。声の主は某動画サイトで大人気のゆっくりさんです。棒読みちゃんという音声合成ソフトで作って見ました。

    ディレイとリバーブ - 人工知能に関する断創録
  • 高速フーリエ変換(FFT) - 人工知能に関する断創録

    Pythonで音声信号処理(2011/05/14) 今回は、高速フーリエ変換(FFT)を試してみます。FFTとはFinal Fantasy Tactics Fast Fourier Transformの略でその名の通り、前回の離散フーリエ変換(DFT)を大幅に高速化したしたアルゴリズムです。一般にフーリエ変換といったらFFTが使われるようです。DFTは自分で公式に忠実に実装してみましたが、FFTはPythonのnumpyやscipyに実装があるのでそれを使ってみます。numpyの実装はnumpy.fft.fftでscipyの実装はscipy.fftpack.fftです。使い方はほとんど同じですが、この記事によるとscipyの実装の方が高速とのこと。scipy版には他にもいろいろ関数があります。おいおい使っていきたいと思います。 #coding:utf-8 import wave impor

    高速フーリエ変換(FFT) - 人工知能に関する断創録
  • 1