[B! 音声合成] dhzkのブックマーク

Deep Learning in Speech Synthesis

Deep Learning in Speech Synthesis Heiga Zen Google August 31st, 2013 Outline Background Deep Learning Deep Learning in Speech Synthesis Motivation Deep learning-based approaches DNN-based statistical parametric speech synthesis Experiments Conclusion Text-to-speech as sequence-to-sequence mapping • Automatic speech recognition (ASR) Speech (continuous time series) → Text (discrete symbol sequence)

dhzk 2015/04/14

リンク

VoiceText Web API (β版)

無料版で作成した音声データの商用利用、二次利用及び配布する行為は禁止されております。利用規約をご確認の上、本サービスをご利用ください。 ※音声データの二次利用例本WebAPIで作成した音声をYouTube等の動画投稿（共有）サイトにおいて使用・公開する行為有料版サービスを開始しました。詳しくは製品情報をご覧ください。

dhzk 2014/07/11

音声合成

リンク

Python + クラウド音声合成で高品質なアニメ声読み上げ - 超言理論

自分がTAとして担当する講義でNICTの杉浦孔明さんが人工知能/機械学習/ロボット対話などについて講演してくださって、中でも"rospeex"というのが気になったので、忘備録としてここに書いておく。タイトル通り、Pythonでクラウド音声合成エンジンを使う。というのも、このクラウド音声合成エンジンは今年の夏の第31回日本ロボット学会学術講演会で杉浦さんが発表された「非モノローグ音声合成」のことで、超高品質な音声合成（しかも、マニア？オタク？が喜びそうな感じのアニメ声）がクラウドで利用できるというもので、いわゆるクラウドロボティクスであるとか、携帯端末で動くような対話システムにはうってつけのシステムである。件の「非モノローグ音声合成」については、このサイトで実際に音声合成を試すことができる。 TTS demo どことなく初音ミクっぽい。 *1 「非モノローグ音声合成」こと"rosp

dhzk 2013/12/14

音声合成

リンク

akJ Speechtools(音声合成ソフト)

マインドマップ akJ Speechtoolsとは、いろいろな音声合成に関するツールをあわせたソフトです。非商用時なら再配布可能な音声合成に関するソフトをまとめていきたいと思います。現在の音声合成部はすべて以下ライブラリーに依存しています。 FreeTTSおよび、Mbrola GalateaTalkです。また、形態素解析にはSenを使用しています。 ■注意事項ダウンロード・バージョンアップされた場合 features/featuregtalk_1.0.1 フォルダーを削除お願いします。

dhzk 2013/11/27

音声合成

リンク

Open JTalk

What is Open JTalk? Open JTalk is a Japanese text-to-speech system. This software is released under the Modified BSD license. Getting Open JTalk Open JTalk version 1.11 (25 December, 2018) NEW! The Japanese text-to-speech system. It works in Linux machines. Documentation Source Code Dictionary for Open JTalk version 1.11 (25 December, 2018) NEW! If you cannot compile dictionary, you can use compil