歌声合成ソフトの代表といえば初音ミクを代表とするVOCALOIDでしょう。でも、そのほかにもフリーウェアとして広く使われているUTAU、また以前Digital Audio Laboratoryでも取材させてもらったフリーウェアのAquesToneなどいくつかのものがあります。 そうした中、最近、ニコニコ動画やYouTubeなどでも作品が次々とアップロードされて話題になっているのが、名古屋工業大学の徳田恵一先生の研究室で開発したSinsy(しぃんしぃ:Singing Voice Synthesis System)というシステムです。これも誰でも無料で使えるシステムとなっているので、どんなものなのか試してみました。 私がこのSinsyを初めて知ったのは、昨年夏の音楽情報研究会での研究発表会。その後、AV Watchの記事を書く際に少し使ってみて、その声の質の良さにも驚きました。ただ、それ以降、
雑記 | 03:46 | 私がここ数年で知ったもののなかで、最も革新的だと思ったのが、ボーカロイド(VOCALOID)。念のため説明しておくと、ボーカロイドとは、メロディーと歌詞を入力すると、サンプリングされた人の声を元にした歌声を合成することができる、ヤマハが開発した技術及びソフトのこと。有名なのは、クリプトン・フューチャー・メディアの発売する、声優・藤田 咲さんの声をもとに作られたソフトウエア『初音ミク』。初音ミクはバーチャル・シンガーとして、声だけではなく、外見と年齢、身長、体重など簡単なキャラクターが設定されており、ユーザーが初音ミクを用いて作った動画が動画投稿サイトに次々と投稿され、人気をよんだ。最近では初音ミクを使った曲がヒットチャートに入ることも多く、昨年発売された「Vocalogenesis」はオリコン週間1位を獲得した。 ボーカロイドをはじめて聞いたとき、最近の技術の
今回、オープンソースとWindows版バイナリパッケージが公開されたため、自由に対話システムを構築し、さらなる拡張を行うことも可能。ソースコード、ドキュメンテーション、32bit Windowsのバイナリパッケージ、サンプルコンテンツは、専用サイトで公開されている。 ほかのプラットフォーム、特にMac、iPhone、Androidについて移植の計画と、そもそも可能かどうかについて名古屋工業大学の徳田恵一教授に質問したところ、李晃伸准教授、大浦圭一郎特任助教を含む開発チームからの回答をいただいた。 デバイス依存の部分は少ないので移植性は高いと思います。Macは実現しやすいのではないでしょうか。モバイル機器については、音声認識・音声合成を一つのデバイスで動かすのがリソース的に大変ですが、それぞれの音声モジュールは個別にモバイル機器に移植された実績もあるので、実現可能な規模や描画クオリティの調整
Mac、iPhone、iPod、歌声合成、DTM、楽器、各種ガジェット、メディアなどの情報・雑感などなど 昨日のエントリーの続き。 朝起きたらこんな記事がCNETにあがっていました。 ・Tomorrow's Miley Cyrus? A hologram live in concert! Technically Incorrectという連載で、著者はChris Matyszczykという、CNET Blog Networkのメンバー。つまり、ブロガーなわけだが、ついにCNETまで取り上げたというのは感慨深い。しかしこのタイトルは……悪い予感が……。 マイリー・サイラスというのはディズニーチャンネルの「シークレット・アイドル ハンナ・モンタナ」で主演していた女の子で、いまや本物のトップアイドル。チケットが手に入りにくいことで知られている。そこで、初音ミクのホログラムライブに目をつけたのだろう
彼女の歌と踊りが終わると、会場の空気が変わった。「すごい……」。観客は目を丸くし、ため息をつく。 美少女ロボット「HRP-4C未夢(ミーム)」が披露した歌と踊りは、想像を超えていた。「デジタルコンテンツEXPO 2010」(東京・科学未来館など、10月14~17日)会場で目の当たりにした人からも、Ustreamでライブ映像を見た人からも、驚嘆の声が上がった。 歌声はVOCALOIDで再現し、ダンスは、専門知識がなくても振り付けできる新開発のソフトで実現。ロボットの可能性を広げたいというクリエイターたちの思いが、見事なパフォーマンスを実現させた。 HRP-4C未夢は、産業技術総合研究所が開発した日本人女性型ロボットで、身長は158センチ・体重は43キロ。体型は日本人青年女性の平均値を参考に作られており、人間に極めて近い動作が可能だ(関連記事)。これまでファッションショーに出演したり、豊かな表
ニコニコ動画で初音ミクなどのMMD(MikuMikuDance)キャラクターと音声で対話できるシステム「MMDAgent」を発表した名古屋工業大学が、CEATEC会場でデモを行っている。開発を担当した名古屋工業大学国際音声技術研究所の徳田恵一教授、李晃伸准教授、大浦圭一郎特任助教に話を聞いた。 MMDAgentはこう記述する ITmedia デモを見せてもらいましたが、最初の質問の回答が出る前に別の質問をしてもうまく対応できるんですね。 徳田教授 音声対話システムでは割り込みができず、命令が終わるまでじっと待っていなければならないものが多いのですが、MMDAgentは音声認識エンジンも自分たちで開発している(李准教授のJulius)ので、システム全体を密結合して割り込みをかけたりということも自在にできます。 ITmedia 対話のシステムはどのように構築するのですか。 李准教授 スクリプト
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く