タグ

2015年5月15日のブックマーク (4件)

  • 線形予測分析(LPC) - 人工知能に関する断創録

    Pythonで音声信号処理(2011/05/14)の第20回目。 以前、ケプストラム分析(2012/12/21)のところで声道の特性を意味するスペクトル包絡を求めた。今回は、線形予測分析(Linear Predictive Coding)という別の手法でスペクトル包絡を求めてみた。この方法で求めたスペクトル包絡は、LPCスペクトル包絡(LPC Spectral Envelope)と呼ばれるとのこと。 線形予測分析 以下の説明は、 Linear Prediction and Levinson-Durbin Algorithm (PDF) の資料を参考にしました。ここでは、詳しい導出は省いて、プログラミングできる結果だけをまとめています。 線形予測分析では、過去の信号から未来の信号を以下の式で予測する。 この式は、時刻nの信号の予測値は、過去k個の信号値に重み係数 a_i で重み付けして足し合

    線形予測分析(LPC) - 人工知能に関する断創録
    thorikawa
    thorikawa 2015/05/15
  • Player/Stage/Gazebo

    thorikawa
    thorikawa 2015/05/15
  • ソフトウェア|杉浦孔明ウェブサイト

    60QA 論文執筆を査読者からの質問に回答する作業と捉え、 60個程度の質問に回答すると論文がいつの間にかできあがる、という方式で論文執筆を仕組み化しました。 60 Questions and Answers 音声翻訳アプリの多くは、入力される言語が何語であるかをあらかじめ指定する必要があるため、ユーザにとって不便でした。さらに、相手が話している言語が分からない場合には、何語かを指定すること自体が困難でした。 1.5秒程度の短い発話から即座に言語を識別する技術を開発し、NICTの音声翻訳アプリVoiceTraに導入しました。 VoiceTraのダウンロード方法は公式ページをご覧ください。 言語識別機能は、VoiceTraを開き、言語変更をタップ→モードを「自動」に設定することで使用できます。 Solar flare is one of the causes of electromagnet

    thorikawa
    thorikawa 2015/05/15
  • ソフトとハードの交差点:アニメ声の音声合成Webサービス - livedoor Blog(ブログ)

    技術のスッパ抜きには定評のある、yonekenです。 嘘です。 先日、第31回日ロボット学会学術講演会でNICTの杉浦さんが発表された、「非モノローグ音声合成」こと、アニメ声合成Webサービスが、深く僕の心を揺さぶったので紹介します。 そこで、妄想が妄想で終わらないのがエンジニア。NICTと言えば、21言語対応の翻訳コンニャクこと音声入出力で会話ができる音声翻訳ソフトウェア“VoiceTra”と、文字入力の翻訳ソフトウェア“TexTra”を作った組織です。妄想と技術が出会ったとき、そこに新しい未来が生まれました。 そうして生み出されたのが、このアニメ声合成Webサービスです。だと思います。 使い方は、とっても簡単。http://rospeex.ucri.jgn-x.jp/nauth_json/jsServices/VoiceTraSS というURLに対して、POSTで {"method

    thorikawa
    thorikawa 2015/05/15