サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
デスク環境を整える
akira-izumi.cocolog-nifty.com
Perlスクリプトは実行環境としてのハードルが高いようなので、なんとか自分でExe化を試みてみましたので、備忘録+情報共有としてここに貼ります。 まずは、"perl exe" で検索してトップに来た記事を参照しました。 [PAR] perlをexe化 http://hamachiya.com/junk/memo_PAR.html いや・・・自分の環境はActivePerl 5.8.8 だし、バージョンを落とすのも面倒くさいなあと思いつつ、なんか解決案がないかとこの手順通りにやってみました。 C:\> ppm-shell ppm> rep add bribes http://www.bribes.org/perl/ppm まず、www.bribes.org をレポジトリに追加、ここにしか存在しないPPMパッケージがあるようです。続いてPARに必要なパッケージを次々とインストールします。 pp
VocalSIMulator –ボーカル歌唱のシミュレーション手法の提案 1、目的: VocalSimulator(以下 VocaSim)は、ヤマハのVOCALOIDシリーズのVSQファイルを入力として、音量や音高を自動調整して滑舌処理・オーバーシュートやビブラート及び微細変動処理を加えたVSQファイルを出力するものです。 VocaSim004.pl の実行結果 「星の界」 http://piapro.jp/content/bgxqrywgfuhums4s 2、従来技術との比較 従来のVocaloid2 Editorは全てマウスで描画しており、オーバーシュートなどの細かな調整には膨大な工数が必要でした。唯一ビブラートのみは自動化されています。 VocaListerner, MikuMikuVoice のアプローチは、肉声から音量と音高を抽出して、VSQファイルに反映させるというものです。肉
「ぼかりすでない何か」のプログラムを作成中ですので、とりあえず現状の出来をアップロードします。 http://piapro.jp/content/ybx241dfo4hrpiwv ミクがアカペラで「七つの子」を歌うというなんともベタなデモソングですが、使用前・使用後のVSQファイルでも見ていただければと思います。 ソフトウエアは、VocaSim と命名します。内部仕様ドキュメントを充実させ、音声のレベルアップを図ってアップロードする予定です。もちろんフリーソフトです。
浜崎あゆみの「Dearest」が入手できたので、歌声りっぷ 2.0 で浜崎あゆみボーカルを抜き出し、Ripples 0.0.8 で解析しました。Ripples を作成された zhuo さんに感謝いたします。解析結果は、いままでの推定が覆る意外な結果となりました。 1、音高(PIT)パラメータの解析 浜崎あゆみボーカルと「ぼかんないんです><」のVSQファイルの「全て」の「て」のビブラート部分を抜き出し、PIT(音高)パラメータを縦軸に、横軸に時間として描画しました。 浜崎あゆみボーカルのPIT(音高)パラメータは美しい正弦波を描いております。この正弦波は人間の生音声によるものではなく、機械イフェクトで加工されているのだと推定します。また、驚くべきことは「ぼかんないんです><」技法によるVSQファイルのPIT(音高)パラメータは、浜崎あゆみボーカルと振幅および位相がぴったりと一致しています。
zhuoさんが作成されたツール "Ripples 0.0.8" を使って、人間の歌声、特にビブラートがどのようなグラフを描くかを見てみました。ここに、Ripples を作成された zhuoさんに感謝いたします。 本当は浜崎あゆみの生ボーカルが分析できるとよかったのですが、CDからボーカルをきれいに抽出できなかったので、やむをえず自分で(笑)歌ってみたものを分析しました。歌詞「すべて」の「て」の部分にビブラートが聞こえているので、人間の歌唱のビブラートの実験サンプルとしては使えると思います。 分析した歌声に対応する歌詞は「すべて」で、3つの発音要素を含み、音量(DYN)と音程(PIT)に対応する部分があります。全体として音量(DYN)と音程(PIT)が極めて高い相関を示す事、発音要素の区切りごとに音量(DYN)の谷間がある事などもわかります。これらは400P=yuukiss氏の調教法の特徴で
初音ミクみくの記事「出た!VocaListenerの秘密の一端解明か?謎の調教師が置き土産!」を見て、さっそく問題のVSQファイルを解析してみました。これにより、更に初音ミクの楽曲が高度なものとなれば幸いです。 謎の調教師を仮に「400氏」と呼びます。400は初出のレス番号から由来するものです。 「400氏」は噂の「ぼかりす」と匹敵するような高品質な初音ミクの歌声を作成してアップロードされ、歌声の元となるVSQファイルもアップロードされました。「400氏」のVSQファイルはこちらです。 http://www.42ch.net/UploaderSmall/source/1209596322.zip pass=miku (1)デフォルト歌唱スタイル デフォルト歌唱スタイルですが、何も初期設定から変わっていません。 VEL(ベロシティ)/DYN(ダイナミックス)/PIT(ピッチベンド)のパラメー
久しぶりに心踊るような技術が出てきました。まあ聞いてみてください。藤田咲さんが生で歌っているよと言われたら信じてしまいそうな出来ですが、これは「初音ミク」なんですよね。 さて、この「ぼかりす」ですが、2008年5月28日(水)に開催される「第75回音楽情報科学研究会」で研究成果として発表されるVocaListenerという技術だそうです。以下に表題と発表者を引用します。 (9) VocaListener: ユーザ歌唱を真似る歌声合成パラメータを自動推定するシステムの提案 中野倫靖,後藤真孝(産総研) VocaListerner が何をやっているかは現時点では不明です。よって、さっそく後藤真孝さんの素性を調べてみました。とりあえず特許検索ということで、後藤さんの音関係の特許出願及び登録特許を列挙します。リンクを叩くとPDFが開きます。 特開2001-125562 音高推定方法及び装置 (57
初音ミク用VSQファイル自動生成ソフトウエア MIKU_TALK Ver. 0.1.8 をWEBアプリケーション化いたしました。SP-LANDの「和泉聡のソフトウエア実験室」に設置してあります。 和泉聡のソフトウエア実験室 http://akiraizumi.sv1.sp-land.net/index.html 初音ミクは、極めて自然な高品質の歌唱音声を合成します。しかし、文章を喋ることは主目的ではないため、自然に喋らせるのは初音ミク単体ではかなり困難です。MIKU_TALK は自然文を初音ミクに喋らせるための前処理をおこない、初音ミクに喋らせることを容易とするソフトウエアです。 MIKU_TALK Ver. 0.1.8 はWEBアプリケーションですので、FLASH PLAYER 9 がインストールされているWindows環境ならば動作します。よって、複雑な ActivePerl / Me
miku_talk を、バージョンアップしてみました。年末ですから他のフリーソフト作者や職人の方々に遊んでいただこうという趣旨です。 今回の主なバージョンアップ機能は、任意のテキストを入力とできるようにしたことです。 「miku_talk012_1.zip」をダウンロード 以下、Readme.txt からの抜粋です。ちょっとだけインストールについて親切に記載してみました。 miku_talkとは: miku_talk は、自然文をもとに「VOCALOID2 初音ミク」の入出力ファイルを生成するソフトウエアです。 miku_talk はフリーソフトウェアです.GPL(the GNU General Public License), LGPL(Lesser GNU General Public License), または BSD ライセンスに従って 本ソフトウェアを使用,再配布することができ
Perl で漢字仮名混じり文から、VSQファイルを自動生成させてみました。形態素解析にはMecabを使用しています。Mecabは、自然文の読みまでを出力してくれるので、音声合成に楽に適用できます。 ここで、Mecab の設計者およびプログラマの方々に感謝いたします。 ミクに喋らせる文章は、特許法1条 「この法律は、発明の保護及び利用を図ることにより、発明を奨励し、もつて産業の発達に寄与することを目的とする。」 です。 「test_miku011.mp3」をダウンロード 「test_miku011.vsq」をダウンロード 今回は、アクセントっぽいのも入れてあります。あくまでテスト用の仮コーディングであり、標準語のアクセントではありません。 ソースコードはこちらです、UTF8の文字コードでセーブしてください。 #!/Perl ##################################
初音ミクと著作権について書かれているサイトをご紹介します。 (1)初音ミク 著作権を根底から脅かす恐ろしい娘 (2)初音ミク」と著作権法 (3)ピリ辛著作権相談室:バーチャルアイドルに自作の歌を歌わせたいのですが これらの意見を見て色々と考えさせられました。 ニコニコ動画にアップロードされている「初音ミクが歌うXXXXX」とは、果たして実演の固定物なのか。実演だとしたらその主体は誰なのか。実演家の権利は発生しているのか。初音ミクが既成曲を歌った場合には、誰の権利を侵害することになるのか、侵害の主体は誰なのか。 これらを法的に検討してみます。 ◆初音ミクによる楽曲は実演の固定物なのか? まず(1)と(2)のサイトで触れられている「歌唱権」ですが、著作権法には法定されておらず、産業界にて暗黙のうちに運用されている用語のようです。著作権法上、歌唱は2条1項3号「実演」で定義されている行為に包含さ
初音ミクのキャラクターソングとして有名な「おしえて! だぁりん 」の歌詞をふと思い出し、同一技術に措ける他社特許との比較をおこなってみました。 公開特許公報 特開平10-49192「歌唱音合成装置」 などによると、初音ミクに用いられている技術は、「フォルマント合成」というものです。詳しくはフォルマントシンギング音源講座 」をご覧ください。 Wikipedia のフォルマント には以下記載されています。 言葉を発している人の音声のスペクトルを観察すると、複数のピークが時間的に移動していることが分かる。このピークをフォルマント、またはホルマントと言う(英語表記はformant)。 周波数の低い順に第一フォルマント、第二フォルマント…という様に数字を当てて呼び、それぞれF1, F2とも表記する(第0フォルマント、F0を数える場合もある)。フォルマントの周波数は声道の形状と関係し,個体差や性差も
「初音ミク」に用いられている音声合成技術は、ヤマハが開発したものです。よって、ヤマハの音声合成に係る特許出願を調査することで、開発の推移を調べてみました。 以下に、ヤマハが出願人となっている特許のうち、音声合成に係る特許の出願数の推移のグラフを表示します。 1998年以前は、音声合成とはいっても、カラオケで歌う歌声を加工して、あたかも原歌手が歌っているかのようにリアルタイムに音声加工する発明ばかりです。 特開平5-204397「音声分析合成装置」 特開平8-194495「カラオケ装置」 1998年に、特開平10-49192「歌唱音合成装置」 が出願されます。この時点でヤマハのエンジニアは、予め取り込んだ歌声から新たな歌唱を再構成することに価値が有ることに気付いたようです。すなわち、これがVOCALOIDの基礎出願と思われます。 【課題】 歌詞データに対応して高品質の歌唱音を合成する。 【解
Pen-Pineapple-Apple-Penと言えば、いまやブームの動画です。これを海外の子供たちが見て「フルーツの匂いのするペンの広告?」とか言ってたんですが、確かに広告にぴったり。 文具メーカに、りんごの匂いのするペンを企画、制作していただきたく。 自分としては、特に広告に充ててもらいたいです。
このページを最初にブックマークしてみませんか?
『akira-izumi.cocolog-nifty.com』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く