You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
Microsoftでは、2015/5/1からProject Oxfordと呼ばれるプロジェクトの一環で、機械学習系のAPIをリリースしました。 MicrosoftのProject Oxfordから、顔、画像、音声認識APIが利用可能に 今回は、この中から音声合成・音声認識を行うSpeech APIを取り上げます。 というのも、音声合成を行ってくれるサービスは結構あるのですが、音声認識となるとAPI的に使えるものは結構限られていたりするためです。大抵はAndroid/iOSのSDKで、Webで使えるといってもブラウザ依存だったりします。 GoogleにもSpeech APIがあるのですが、なにせ公式ドキュメントがほとんど見当たらないうえ、一日50回の制限はかなり厳しいです(2015/7現在。課金すれば増えるというものでもない模様)。 Project Oxfordは、2015/7現在はPubl
様々な音響特徴量 それぞれの使い方や意味を教えて下さい Q. 東北大学 大学院 工学研究科 博士後期課程2年 千葉 祐弥 音響学入門ペディア マスター タイトルの書式設定 特徴量って何に使うもの? より無駄が少なく、データの本質をあらわした表現が欲しい! ⇒ データからなるべく良い特徴量を抽出する必要がある 収録条件、個人差、データ差などの違いが大きくて本質的な部分がわかりにくい データ量や計算量が多くて取り扱いにくい 生のデータそのものを利用するのは無理がある 2 • 統計的分析 • 機械学習、パターン認識 • 音声認識、音声インターフェースの作成 • 楽曲のジャンル推定、楽曲検索、推薦等への応用 など • 人間が音を聞く仕組みを解明する(方向、高さ、大きさ、音色・・・の知覚) • データの符号化、圧縮への応用 など マスター タイトルの書式設定 特徴量の選び方 音素の判別に有効
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く