(2021/9/17)本記事は「日本語の文字列をオーディオデータに変換するOpen JTalkの概要とインストール」へ移動した。
ここ5年で大きく知名度を上げたジャンルのひとつに「ボーカロイド」がある。ちょうど初代iPhoneが北米のみで発売された2007年、初音ミクも日本でリリースされてニコニコ動画で火が付き、その後、さまざまな会社から多くの歌声ライブラリーが発売されてきた。今となってはボーカロイドが好きな人でも、すべてを挙げろと言われてすぐに思いつかないぐらいの声質が選べるようになっている。 本日、そうしたボーカロイドとは別の流れから音声合成ソフト「CeVIO Creative Studio」(チェビオ クリエイティブ スタジオ)の無償版提供が始まった。現状は会話のみで、テキストを入力し、声の大きさや速さなどを調整して、再生すると女性の声でしゃべってくれる。6月には歌唱に対応したバージョンが、9月頃には音声ライブラリを3人に増やした有償版がリリースされる予定だ。 このCeVIOは、単にソフトが出るだけでなく、プロ
MMDAgentのシナリオのみで計算機を作成したいと思い立ちました。 目標としては、四則演算が出来るようになることです。 恐らく計算の仕組み自体は難しくないと思いますが、 シナリオの作成は面倒になると予測しています。 ゆっくり作成して行きたいと思います。 ちなみに、Rilプラグインを使用するとあっという間に出来上がります。
ニコ生「テストと聞いて」コミュ主のブログ http://com.nicovideo.jp/community/co106496→コミュリンク MMDAgentの音声認識はJuliusというシステムが行なっています。 Juliusの音声認識の仕方は、認識した音声波形と辞書に登録された単語の読みを比較し、 一番近い単語を認識結果としているようです。 つまり、その辞書に登録されていない単語が認識されることはありません。 従って、認識されない単語は辞書に登録すれば良いということになります。 辞書は公式サンプルに含まれている「MMDAgent_Example.dic」です。 まず、この名前を「MMDAgent.dic」と変更し、MMDAgent.exeと同じフォルダに入れます。 (既に同じ操作をしている場合は新たに行う必要はありません) 「MMDAgent.dic」をメモ帳等で開くと、既にいくつかの
喉が痛いのでなるべくしゃべらないようにしたい。 1. say Macのsayを使う。 Lionから[システム環境設定]->[スピーチ]->[テキスト読み上げ]で「システムの声」にKyokoを指定すると日本語が読める。 たまに読みを間違えるが良い声だと思う。英語も読めるが、発音が日本人っぽくなる。 2. saykana Mac用のゆっくり声。 http://www.a-quest.com/quickware/saykana/ インストールすると /usr/local/bin/saykana が使えるようになる。 漢字が読めない。ローマ字は「えーびーしー」のように発音する。 3. Google翻訳の声 前にしゃおさんにGoogle翻訳の声を取ってくる方法を教わった。 さすがGoogle、ほぼ漢字も読み間違えない。ただ声がちょっと怖い。 gsayというコマンドを作った Mac用 Ubuntu用
おそらく、誰もがやる深夜のWebサーフィンは、究極のところ時間の無駄ではないのかもしれない。 それは、Webで夢をみているのにほかならないのだ。(T.B=リー「Webの創成」より) Created at: 2012-05-14 | Tags: mmdagent 2012年1月にネット上で引越ししたので未来なお部屋を作ってみた。という記事が話題になったのをご存知でしょうか。 この記事の中で一際注目すべきは、音声認識により学習リモコンのiRemoconを制御し、家電を操作可能にしていることです。 ただし音声認識とiRemoconの制御はC#(?)でプログラミングされており、初心者にはなかなか真似できるものではありません。また、iRemoconも実売価格が\24,900と高価です。 そこで、ここではフリーの対話型エージェントソフトであるMMDAgentとBUFFALOのPC用学習リモコンPC-O
MMDAgentのNAIP(Navigation Artificial Intelligence Program)化を目指すブログです。 【MMDAgentで顔認識】 また、新しいMMDAgent用の拡張プラグインを作ってみたので公開しておきます。 OpenCVを利用した顔認識ができるようになります。 詳しい利用方法などは同梱のreadme.txtやwiki(http://cube370.wiki.fc2.com/wiki/)の方を参考にしてください。 OpenCVプラグイン Ver. 0.1.1.0 : ダウンロード で、開発している間の裏話。 まず、開発しようとした理由はユーザーの有無を確認する方法が欲しかったからです。 前回?メールアラート機能を実装してみたものの、メール受信時にユーザーがいなくてもお知らせしてしまうのであまりアラートの意味がなかったからです。 受信時にユーザーがいな
名古屋工業大学国際音声技術研究所は8月3日、音声インタラクションシステム構築ツールキット「MMDAgent」の最新バージョンである1.1を公開した。Macなどのマルチプラットフォーム対応を改良したのがポイントだ。 名古屋工業大学国際音声技術研究所の徳田恵一教授、李晃伸准教授、大浦圭一郎特任助教ほかからなるプロジェクトチームは、昨年9月のCEATECでMMDAgentのプロトタイプを披露。MMDを使った初音ミクの3D映像で、人の話し言葉にリアルタイムで受け答えしてみせた。このコードは昨年末にβ版がオープンソース化。MMDAgentを使ったシステムは名古屋工業大学で等身大受付嬢として実稼働している。 これまでのMMDAgentはWindowsに依存した部分が多かったために、Mac OS X、Linuxなどの他プラットフォームへの移植が難しかった。MMDAI(しまぴょん氏が開発)というフォークプ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く