[B! 音声][音楽] rin51のブックマーク

rin51 id:rin51

音声と音楽に関するrin51のブックマーク (8)

MFCC（メル周波数ケプストラム係数）入門 - Qiita
MFCCとは MFCCは聴覚フィルタに基づく音響分析手法で、主に音声認識の分野で使われることが多いです。最近だとニューラルネットワークに学習させる音声特徴量としてよく使われていますね。 2019.5.29訂正 Deep Learning for Audio Signal ProcessingによるとDeep Learningにおいては必要な情報が失われるためMFCCは使わずに、最後の計算ステップである離散コサイン変換を省いたメルスペクトラム(log-mel spectrum)が使われるそうです。MFCCは従来手法である隠れマルコフモデル、混合ガウスモデル、サポートベクターマシンで使われることが多いです。今回はMFCC「メル周波数」や「ケプストラム」についても説明し、具体的なMFCCの実装方法も見ていきたいと思います。メル尺度心理学者のStanley Smith Stevensらによ
rin51 2019/12/23
音声

MFCC

機械学習

解析

分析

音楽

特徴
リンク
メル周波数ケプストラム係数（MFCC） - 人工知能に関する断創録
Pythonで音声信号処理（2011/05/14）の第19回目。今回は、音声認識の特徴量としてよく見かけるメル周波数ケプストラム係数（Mel-Frequency Cepstrum Coefficients）を求めてみました。いわゆるMFCCです。 MFCCはケプストラム（2012/2/11）と同じく声道特性を表す特徴量です。ケプストラムとMFCCの違いはMFCCが人間の音声知覚の特徴を考慮していることです。メルという言葉がそれを表しています。 MFCCの抽出手順をまとめるとプリエンファシスフィルタで波形の高域成分を強調する窓関数をかけた後にFFTして振幅スペクトルを求める振幅スペクトルにメルフィルタバンクをかけて圧縮する上記の圧縮した数値列を信号とみなして離散コサイン変換する得られたケプストラムの低次成分がMFCC となります。私が参考にしたコードは振幅スペクトルを使ってたけど
rin51 2019/12/23
音声

MFCC

機械学習

解析

分析

音楽

特徴

音声認識

音声解析

音声処理
リンク
音楽と機械学習前処理編 MFCC ~ メル周波数ケプストラム係数 - Qiita
最近音楽を機械学習で扱うことに興味があって色々と調べているのですが、せっかくなので備忘録と理解促進を兼ねて記事にしてみます。機械学習に限らず、音楽をデジタル情報として扱う際には楽譜や調、歌詞など、メタな情報を扱う方法と、オーディオデータそのものを扱う方法とに大別されますが、今回はオーディオデータそのものを扱う方法の一つとして、MFCCについてまとめます。お急ぎの方向け mp3 を wav にして MFCC して現実的に扱えそうな次元に落とす # ffmpegのインストール $ brew install ffmpeg # ffmpegで mp3 をサンプリングレート 44.1kHz wavに変換 $ ffmpeg -i hoge.mp3 -ar 44100 hoge.wav # 必要なPythonパッケージのインストール $ pip install --upgrade sklearn
rin51 2019/12/23
音声

MFCC

機械学習

解析

分析

音楽

特徴
リンク
深層学習を使って楽曲のアーティスト分類をやってみた！ - Platinum Data Blog by BrainPad
本記事は、当社オウンドメディア「Doors」に移転しました。約5秒後に自動的にリダイレクトします。深層学習を使った音声データによる楽曲分類を実施しました！楽曲の特徴を表すメル周波数スペクトログラムを用いて、その楽曲のアーティストを推定します。こんにちは、アナリティクスサービス本部の井出です。今回のブログは、音声データをテーマとして取り上げ、音声データの特徴量深層学習による楽曲のアーティスト分類についてご紹介します。ブレインパッドでは、深層学習の技術を駆使した活用事例が増えてきています。特に、画像認識の分野における活用事例は多く、当社の公開されている事例だけでも以下のようなものがあります。ブレインパッド、キユーピーの食品工場における不良品の検知をディープラーニングによる画像解析で支援八千代エンジニヤリングとブレインパッド、洪水を安全に流す役割を担う河川のコンクリート護岸の
rin51 2019/12/23
音声

MFCC

機械学習

解析

分析

音楽

特徴

python
リンク
http://abcpedia.acoustics.jp/bs13_q4.pdf
rin51 2019/12/23
音声

MFCC

機械学習

解析

分析

音楽

特徴
リンク
「音響学入門ぺディア」Q&A集の紹介 Q4:音響特徴量ってなんですか？？
「音響学入門ぺディア」Q&A集の紹介 Q4:音響特徴量ってなんですか？？森川大輔北陸先端科学技術大学院大学学生・若手フォーラム幹事会音響特徴量ってなんですか？？音の物理的な特徴や特性音響特徴量音に含まれる物理的な特徴を数値化したもの＊特徴量だけでなく、特徴そのものや、特性まで含むこともある要は・・・ (が多い) MKS単位系で表現可能 (m kg s) 物理的とは？？人が音を評価感覚量or心理量→主観音の高さ音の大きさ音色基本周波数音の周期音の強さ、音圧スペクトル分布時間パターン物理的に音を評価物理量→客観 ※今回の話しは物理量音響学入門ぺディアQ＆A集主観評価に興味がある人「主観評価がわかりません」数値で表現可能 !! いろいろな音響特徴量零交差数 RMS パワー相関係数平均分散高次統計量歪み率基本周波数継
rin51 2019/12/23
音声

MFCC

機械学習

解析

分析

音楽

特徴
リンク
Q 様々な音響特徴量それぞれの使い方や意味を教えて下さい
様々な音響特徴量それぞれの使い方や意味を教えて下さい Q. 東北大学大学院工学研究科博士後期課程２年千葉祐弥音響学入門ペディアマスタータイトルの書式設定特徴量って何に使うもの？より無駄が少なく、データの本質をあらわした表現が欲しい！ ⇒ データからなるべく良い特徴量を抽出する必要がある  収録条件、個人差、データ差などの違いが大きくて本質的な部分がわかりにくい  データ量や計算量が多くて取り扱いにくい生のデータそのものを利用するのは無理がある 2 • 統計的分析 • 機械学習、パターン認識 • 音声認識、音声インターフェースの作成 • 楽曲のジャンル推定、楽曲検索、推薦等への応用など • 人間が音を聞く仕組みを解明する（方向、高さ、大きさ、音色・・・の知覚） • データの符号化、圧縮への応用などマスタータイトルの書式設定特徴量の選び方音素の判別に有効
rin51 2019/12/23
音声

MFCC

機械学習

解析

分析

音楽

特徴
リンク
類似楽曲検索システムを作ろう - 人工知能に関する断創録
もう1年以上かけて音声信号処理の勉強をしてきました（Pythonで音声信号処理）。ここらで具体的なアプリケーションとして類似楽曲検索の実験をしてみたのでレポートをまとめておきます。言語はPythonです。前に類似画像検索システムを作ろう（2009/10/3） Visual Wordsを用いた類似画像検索（2010/2/27）という画像の類似検索に関するエントリを書きましたが、今回は画像ではなく音楽を対象に類似検索をやってみたいと思います！今回作る類似楽曲検索システムは、従来からよくあるアーティスト名や曲名などテキストで検索するシステムや購買履歴をもとにオススメする協調フィルタリングベースのシステムとは異なります。WAVEファイルやMP3ファイルなどの音楽波形そのものを入力とするのが特徴です。たとえば、「具体的なアーティストや曲名は知らないけれど、この曲とメロディや雰囲気が似た曲がほ
rin51 2012/10/14
音声

MFCC

機械学習

解析

分析

音楽

特徴

python
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx