タグ

音声合成に関するrin51のブックマーク (5)

  • AI技術により超高精度な歌声合成を実現

    株式会社テクノスピーチ(所在地:名古屋市千種区、代表取締役:大浦 圭一郎、以下 テクノスピーチ)と国立大学法人名古屋工業大学 国際音声言語技術研究所(所在地:名古屋市昭和区、代表:徳田 恵一、以下 名古屋工業大学)は、このたび人間の声質・癖・歌い方をこれまでになく高精度に再現できる歌声合成技術を開発いたしました。 ​ テクノスピーチと名古屋工業大学は共同で音声合成・歌声合成技術の研究・開発に取り組んでおり、これまでに業務用カラオケ機器「JOYSOUND」や音声創作ソフトウェア「CeVIO Creative Studio」等に音声合成・歌声合成技術の導入を進めてきました。研究では、特定の歌唱者の約2時間の歌声データベースに対して、深層学習等のAI技術を適用することにより、歌唱者の声質・癖・歌い方を学習しました。合成の際は、任意の歌詞付き楽譜を入力するだけで高品質な歌声を合成することができま

  • プロ声優を起用した音声合成用データ、無償公開 研究用途に期待

    声優やアニメを研究するサークルの日声優統計学会は6月26日、プロの声優を起用した音声データとテキストを含むデータベース「声優統計コーパス」をWebサイト上で公開した。音声合成ソフトの作成や言語研究などに使われるデータで、研究目的に限り無償で利用できるという。 公開したのは、プロの女性声優がさまざまな音の要素を含む文章(音素バランス文)を「通常」「喜び」「怒り」の感情別に読み上げたwavファイル。「また東寺のように五大明王と呼ばれる主要な明王の中央に配されることも多い」「カーミラ星と呼ばれている惑星から宇宙船に乗って地球に侵入した宇宙人」──などの文を読み上げている。 参加した声優は土谷麻貴さん(「喰霊-零-」「アルカナハート」など)、上村彩子さん(「エルドライブ」「惡の華」など)、藤東知夏さん(「けいおん!」「グッド・ドクター~禁断のカルテ~」など)。長さは計2時間、総ファイルサイズは7

    プロ声優を起用した音声合成用データ、無償公開 研究用途に期待
  • ボカロじゃない音声合成ソフト「CeVIO」ってなんぞ!? (1/4)

    ここ5年で大きく知名度を上げたジャンルのひとつに「ボーカロイド」がある。ちょうど初代iPhoneが北米のみで発売された2007年、初音ミクも日でリリースされてニコニコ動画で火が付き、その後、さまざまな会社から多くの歌声ライブラリーが発売されてきた。今となってはボーカロイドが好きな人でも、すべてを挙げろと言われてすぐに思いつかないぐらいの声質が選べるようになっている。 日、そうしたボーカロイドとは別の流れから音声合成ソフト「CeVIO Creative Studio」(チェビオ クリエイティブ スタジオ)の無償版提供が始まった。現状は会話のみで、テキストを入力し、声の大きさや速さなどを調整して、再生すると女性の声でしゃべってくれる。6月には歌唱に対応したバージョンが、9月頃には音声ライブラリを3人に増やした有償版がリリースされる予定だ。 このCeVIOは、単にソフトが出るだけでなく、プロ

    ボカロじゃない音声合成ソフト「CeVIO」ってなんぞ!? (1/4)
  • 音声合成・歌声合成の新星「CeVIO」、その謎が解けた!

    等身大の3Dキャラクターが感情表現豊かに客と会話するデジタルサイネージが東京のアニメイト秋葉原で稼働している。キャラクターの名前は「さとうささら」。「CeVIO Vision」というシステムを使っている。 4月26日午後6時には無償の音声合成・歌声合成アプリケーション「CeVIO Creative Studio FREE」も公開された。このCeVIOというプロジェクト、素性がただものではないことは分かるのだが、どこが主体でやっているのかは不明だった。ようやくその実体が判明した。 稼働しているシステムをアニメイト秋葉原まで見に行ってみたが、MMDAgentを使った双方向音声デジタルサイネージである名古屋工業大学のバーチャル案内嬢「メイちゃん」と構成が似ている。真相を問い合わせみたが、もうちょっと待ってくれと言われて3カ月。ようやく取材が実現したのがつい先日のことだ。 話をうかがったのは、名古

    音声合成・歌声合成の新星「CeVIO」、その謎が解けた!
  • Androidで音声入力した内容を認識し,そのまま音声合成。「おうむ返し」アプリのソースコード - 主に言語とシステム開発に関して

    AndroidプログラミングのTOPへ 音声入力した内容を,そのまま音声出力してみよう。 というAndroidアプリのサンプルコード。 RecognizerIntentを使う場合と,SpeechRecognizerを使う場合の2通り掲載。 前置き サンプルコード インプット:音声認識または音声入力(ASR, Auto Speech Recognition) アウトプット音声合成,読み上げ(TTS, Text To Speech) 補足:Google音声入力について 補足2:処理対象となる言語をプログラムから指定 補足3:専用の画面を表示しない場合 前置き Google音声入力は,とても便利だ。 いちいち手動で文字を打たなくても,端末が音声を聞き取って自動認識し,文字を入力してくれる。 アプリ開発者としても,自然言語処理を気軽にAPI経由で行なえる。 人間と自然に対話する高度なUIを実装し

    Androidで音声入力した内容を認識し,そのまま音声合成。「おうむ返し」アプリのソースコード - 主に言語とシステム開発に関して
  • 1