Nara Institute of Science and Technology Augmented Human Communication Laboratory 音声対話システム 2016/11/15 音情報処理 2016 「音声対話システム」 1 奈良先端科学技術大学院大学 助教 吉野 幸一郎 NAIST AHC Lab. • 音声対話システムの歴史と枠組み – 音声対話システムの進化と淘汰 – 音声対話システムの基本的枠組み • 対話システムの分類と機能 – タスク指向対話、雑談対話 – 言語理解、対話制御 – end-to-end • 最新の研究動向 – Dialogue State Tracking – Deep Reinforcement Learning – 自律型アンドロイド 2016/11/15 音情報処理 2016 「音声対話システム」 2 本講義の目次 NAIST A
人間同士の会話の特徴をヒントに開発 自然で心が感じられる音声対話システムの構築を支援する新技術 「自然応答技術」 - 本日より、技術の一部を利用できるライセンス提供を開始 - ヤマハ株式会社は、音声対話システムにおいて人間らしい自然な対話を可能にする自然応答技術『HEARTalk(ハートーク) ※ 』を開発しました。本日より、同技術の一部を利用できるソフトウェアとハードウェアのライセンス提供を開始します。 ◇ 機械やロボットに使われている音声対話システムは日々進化を続けており、さまざまな研究が世界中で数多くなされています。しかし、音声対話システムを搭載した機械やロボットと対話する際に、誰しもがその声を聞いただけですぐに機械の声とわかる不自然さを感じることが多いのも事実です。 通常、人間同士の会話では、呼びかける方の発話の声の強弱、長短、高低、間、抑揚などからなる「韻律」に合わせて、応答者
SPTKの使い方 (6)(2012/8/5)の続き。 今回は、SPTK(2012/7/1)を使って音声合成の実験をしてみました。ここで言う音声合成は、テキストを音声に変換するTTS(Text-to-Speech)ではなく、分析合成と呼ばれるものです。 分析合成では、人間の音声からパラメータを抽出し、ソース・フィルタモデル(Wikipedia)を用いて音声を再合成します。いわゆるヴォコーダーという技術です。ヴォコーダー(Wikipedia)を調べると 本来の意味は通信用の音声圧縮技術で、携帯電話などの多くの機器で使用されている。音声の波形を直接送るのではなくパラメータ化して送り、受信側ではそれらのパラメータから元の音声を合成する。 ヴォコーダー(Wikipedia) とあります。ん?ということは、携帯電話で聞いているのは実際の肉声ではなく、パラメータから再合成した合成音声なのですかね?これは
フランス語と日本語で歌えるバーチャルシンガー「ALYS」(アリス)が2016年3月10日に発売される。フランス語で歌える商用バーチャルシンガーは初めて。 ALYSを開発するフランスのVoxWaveは、カナダのPlogue Art et Technologieと提携し、Plogueの歌声合成プラットフォーム「Alter/Ego」を採用すると発表した。 2015年1月に発売されたレトロ音声合成ソフト「chipspeech」を現代風に進化させたものがAlter/Egoで、9月から「Daisy」という音源とともに無料公開されている。現在は「Formant Singer」を採用しているが、他の合成方式も利用できるよう進化するとしている。 Alter/EgoはCubaseをはじめ標準的なDAW(音楽制作ソフト)で使われているVST、Logic Pro XやGarageBandで使われているAudioU
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く