ヤマハは2月25日、歌声合成ソフト「VOCALOID(ヴォーカロイド)」の合成エンジンソフトを進化させ、歌うだけでなくしゃべることも可能にしたと発表した。「VOCALOID- flex(ヴォーカロイド フレックス)」という名称で提供する。 VOCALOIDは、歌詞とメロディーを入力することで楽曲のボーカルパートが制作できるソフト。クリプトン・フューチャー・メディアの「初音ミク」やインターネットの「がくっぽいど」などで採用されている。 VOCALOID-flexでは、歌声に比べて音の細かな変化が要求されるしゃべり声を実現するため、新たに音素などの音の構成や長さ、音の高さや強さを細かく編集できるようにした。これにより、人間に近い発話ができ、細かいニュアンスや方言などのアクセント、イントネーションもつけられるという。 なお、VOCALOID-flexでは音声ライブラリに新しい音素材を追加する必要
ヤマハは4月7日、音声合成ソフト「VOCALOID」をオンラインで操作できるようにする「NetVOCALOID」を開発し、携帯電話向けサービスプロバイダ向けに提供を始めたと発表した。サーバ上のVOCALOIDをユーザー端末から操作して歌わせることが可能で、クリプトン・フューチャー・メディアとインターネットが9日から新サービスを始める。 VOCALOIDはヤマハが2003年に開発した音声合成ソフト。ライセンスを受けて「初音ミク」(クリプトン・フューチャー・メディア)や「がくっぽいど」(インターネット)が発売され、合計で10万本超を販売する人気になった。 VOCALOIDソフトはPCにインストールして利用する形だが、「もっと手軽にVOCALOIDを楽しみたい」といった一般ユーザーのニーズや、「ネット上の自社コンテンツと組み合わせて提供したい」といったサービスプロバイダの要望があったという。 N
NECは4月6日、文章のテキストデータから筆者の気持ちを推定し、その時の気持ちに合わせて音声合成による読み上げをしたり、多様な文字飾りつけたりする、コンテンツ自動生成技術を開発したと発表した。 開発されたのは、テキストデータを解析し、各文章に込められた筆者の気持ちがポジティブかネガティブかを推定する「マインド判定技術」と、解析した気持ちに合わせて、合成音声の特性(トーン)を多様に変更できる「可変トーン音声合成技術」だ。 マインド判定技術は、「高い」「小さい」のような文章中の評価表現の評価対象を特定できる評判抽出技術を応用したもの。評価表現を含む文に込められた筆者の気持ちがポジティブかネガティブかを判定するという。「楽しい」「悔しい」など直接感情を表す語句からだけでなく、評価表現と評価対象をもとに筆者の気持ちを推定するとのことだ。 可変トーン音声合成技術は、読み上げの速さや声の高さ、太さ、明
沖電気工業(OKI)は7月24日、自分の声から音声を合成し、入力したテキストを読み上げられる音声合成ソフト「Polluxstar」(ポルックスター)を発売した。あらかじめ録音しておいた自分の声のデータベースを元に音声を合成する仕組みだ。 病気などで声を失った人に、自分の声の代わりとして使ってもらうといった用途を想定している。価格は音声データベース製作費用を含めて105万円。 「カスタム原稿」でイントネーションや方言も再現 あらかじめ録音しておいた声を「音素」と呼ばれる細かい単位に分解してデータベースを作成。PC上で入力したテキスト通りの音素を抜き出して組み合わせ、音声を再生する。 データベースを作る作業は、ユーザーの声の録音から始まる。同社が用意した自然文の原稿をユーザーに朗読してもらい、その声を録音。原稿の長さは1000文ほどで、読み上げると60分くらい。収録には2~3時間かかるという。
VOCALOID2 HATSUNE MIKU 出版社/メーカー: クリプトン・フューチャー・メディア発売日: 2007/08/31メディア: CD-ROM購入: 30人 クリック: 4,650回この商品を含むブログ (480件) を見る 最近、「ニコニコ動画」にハマっている。一昨年秋ごろ、「YouTube」を初めて知ったとき以来の衝撃だ。各自がアップした映像を軽量なFLVファイルに自動変換して、こそこそファイル交換するんじゃなく、公開して皆で観れるようにした初めてのサービスが「YouTube」。そのアイデアを絶賛し、週刊誌の記事で「世界でいま一番観られているテレビ」と紹介したほど、「YouTube」を完成されたコミュニケーション・システムと評価していた私だが、まだまだ次があったとは! ひろゆき氏というか、この技術の土台を考えたプログラマーはすごいね。さすが2ちゃんねるを考えた人たちらしいと
セルシスと、富士通発のベンチャー企業アニモは5月1日、音声合成技術を活用し、アニメのせりふやナレーションを制作するソフトの開発で提携したと発表した。7月までに第1弾となる製品をリリースする計画だ。 アニモの音声合成技術「Fine Speech」をベースに、PC上でアニメのせりふやナレーション素材を制作できるソフトを開発する。アニモは同技術をベースに新しい音声合成エンジンを開発し、アニメ制作ソフト「RETAS!」などのノウハウをもとにセルシスが製品化する。 アニメやゲームにナレーションをつけるには、ナレーターやスタジオを手配して収録、編集するなどの手間がかかっていた。映像や音楽の制作をPC化することで効率を向上させてきたように、PC上でのせりふやナレーションを制作する環境を提供し、クリエイターを支援していくとしている。
規則音声合成エンジン AquesTalkシリーズ 組み込み用に開発された小型軽量のエンジンで、テキスト情報(音声記号列)をリアルタイムに音声に変換して出力します。 これまで数百万台の機器に実装されています。現在、AquesTalk10/AquesTalk pico/AquesTalk2/AquesTalk1の4種類のエンジンがあります。 それぞれ音声生成アルゴリズムが違うため、声質が異なります。声質や動作に必要なリソース量を考慮してエンジンを選択します。 エンジン種類 AquesTalk pico シリーズ中、最小サイズのエンジンです。RAM500byte、ROM30Kbyte、8bit CPUという比類ない極小リソースでリアルタイムの音声合成ができます。リソース制約の厳しい小型の組み込み機器に適しています。 このエンジンを1チップマイコンに組み込んだ音声合成LSI AquesTalk p
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く