タグ

音声に関するbraitomのブックマーク (2)

  • Google Research、複数音から特定の発話者だけの声を聞こえるようにするDeep learningを用いた視聴覚音声分離モデル発表

    Google Research、複数音から特定の発話者だけの声を聞こえるようにするDeep learningを用いた視聴覚音声分離モデル発表 2018-04-12 Google Researchは、Deep learningを用いて、複数の音から1人の音声だけを抜き出す視聴覚音声分離モデル「Looking to Listen at the Cocktail Party」を発表しました。 論文:Looking to Listen at the Cocktail Party: A Speaker-Independent Audio-Visual Model for Speech Separation 著者:Ariel Ephrat, Inbar Mosseri, Oran Lang, Tali Dekel, Kevin Wilson, Avinatan Hassidim, William T.

    Google Research、複数音から特定の発話者だけの声を聞こえるようにするDeep learningを用いた視聴覚音声分離モデル発表
    braitom
    braitom 2018/04/13
    すごいな。“他の人の音声や背景の雑音などの混合音から単一の音声信号を分離するDeep learningを用いたモデルを提案します”
  • BONXを支える音声信号処理開発のウラガワ - bonx tech blog

    皆様はじめまして、BONXで技術顧問をやっている粟飯原と言います。BONXでは、開発領域では音声信号処理アルゴリズム開発とVoIPシステムに関するソフトウェアレベルでの音声通話品質向上だったりが主ですが、他いろいろやってます。技術顧問という肩書を頂いては居ますが、VoIPサーバをgolangで書いたり、組み込み向けの音声処理ライブラリをC++で実際に書いてます。 BONXは、御存知の通りアウトドアにかぎらず複数人で行う様々なアクティビティをより楽しくするためのコミュニケーションツールとして、ウェアラブルトランシーバとそれに付随するアプリケーションの開発を行っています。今回は、その中でもBONXを支える技術の一つである、音声信号処理アルゴリズムの開発過程をまとめさせて頂きます。 BONXと音声信号処理 BONXは、アウトドアスポーツ等を行っている間に利用するトランシーバーであるので、通常のト

    BONXを支える音声信号処理開発のウラガワ - bonx tech blog
    braitom
    braitom 2017/03/09
    BONXの音声信号処理アルゴリズムの開発過程について。扱うデータが音声であるが他のデータ分析業務とプロセスは同じ。Python + Jupyter Notebookで行っている。音声信号はどうも難しそうで手が出せない…
  • 1