[B! voice] slay-tのブックマーク

slay-t id:slay-t

voiceに関するslay-tのブックマーク (3)

音声インターフェイスについて思う7つのこと | TechCrunch Japan
We could be entering a renaissance for human spaceflight research, as a record number of private citizens head to space — and as scientists improve techniques for gathering data on…
slay-t 2018/12/10
コマンド

デザイン

voice

音声アシスタント
リンク
「複数の音が混ざった音声から特定の1人の声だけを抜き出す技術」をディープラーニングを用いてGoogleが開発
多くの人が集うパーティー会場のような、たくさんの人が談笑している中でも自分の名前や興味のある話を自然と聞き取ることができる現象は「カクテルパーティー効果」と呼ばれ、人間が持つ能力「選択的注意」の代表例とされています。Googleの研究者は、ディープラーニングを用いることでコンピューターに自動で混ざり合った音声を分離する技術を習得させて、コンピューターにカクテルパーティー効果を身に付けさせることに成功しました。 [1804.03619] Looking to Listen at the Cocktail Party: A Speaker-Independent Audio-Visual Model for Speech Separation https://arxiv.org/abs/1804.03619 Research Blog: Looking to Listen: Audio-Vis
slay-t 2018/04/13
audio

Google

技術

これはすごい

voice
リンク
ディープラーニングの力で結月ゆかりの声になってみた
目次（背景）自分の声を結月ゆかりにしたい。前回はあまりクオリティが良くなかったので、手法を変えて質を上げたい。（手法）声質変換を、低音質変換と高音質化の二段階に分けてそれぞれ学習させた。画像分野で有名なモデルを使った。（結果）性能が飛躍的に向上し、かなり聞き取れるものになった。（考察）精度はまだ改善の余地があり、多対多声質変換にすることで精度が向上すると考えられる。今回の結果を論文化したい。デモ動画背景多くの人が可愛い女の子になりたいと思っている。ＣＧ技術やモーションキャプチャ技術の向上により、姿は女の子に仮想化できるようになってきた。しかし、声に関してはまだまだ課題が多い。声質変換は「遅延」「音質」「複数話者」などの難しい課題がある。今回は、自分の声を結月ゆかりにするための、低遅延で実現可能な高音質声質変換を目指した。手法大きく分けて３つの工夫をした。画像ディープ
slay-t 2018/02/14
DeepLearning

機械学習

voice

技術
リンク
1