サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
アメリカ大統領選
amanokei.hatenablog.com
最近、Diff-SVCというのが海外でが流行り始めました。 AI音声合成だとも、AIボイチェンだとも、色んな言説が流布しておりますが一体「Diff-SVC」というのは何者でしょうか? それでは早速ざっくり見てみましょう! こんな風にDiff-SVCは「とある歌声」を「とある声質」へと高品質に変換できる技術です。 「Diff-SVC」とは? Diff-SVCのやり方 ①準備 ②モデルの学習 Preparation Step 1: Install Diff-SVC(インストール) Step 2: Decompress dataset(データの解凍) Step 2-A: Decompress training data(学習データの解凍) Step 3: Edit training parameters(学習パラメータの編集) Step 4: Pre-processing Step 5-0 Te
【12/19追記】 思った以上に広まっていますが、意図が分かりやすいようにで先に主題を書いといちゃいます。 ①初音ミクNTの仕組みの考察 ②初音ミクNTとV4xとでは方向性が違うことの考察(V4xの方が完成度が高いが、NTは段々と品質が改善していく可能性があるということ) ③クリプトンが初音ミクNTを開発した意図の考察 ※全部考察ですのでご注意ください 初音ミクNTってぶっちゃけ微妙ですよね。 ピッチを自由に描けるという自由度を除けばVOCALOID4の方がまだ音質が良いと呼ばれる始末です。 さて、今回は「初音ミクNT」が内部的にどうなっているのか、そしてクリプトンはどうして初音ミクNTを作ったのかということに付いて書いていきましょう。 出音から考えてみる 出音といっても、音声を聞いているだけでは解決できないと思うので基本的には色々な操作を加えた波形とスペクトログラムを見ていくことにします
注意 読み上げソフトはめっちゃ多いので調べてないものもあります、無いものがあったらコメントでこっそり教えて下さい、こっそり追加します。 一応、利用についてや規約に関しては細心の注意を払っていますが、間違ってる場合もあるので各サービス利用する場合は規約を自分で読み、各自で判断して下さい。 ※なにかしらトラブルがあったとしても、この記事を根拠にしないで下さい。 あと、各サービスのデモとしてウェブに体験版が置かれている場合も多いのですが、サービスによっては出力した音声の二次利用を禁止しているので、規約を読んで各自で判断して下さい。 注意 Aquest Talk(ゆっくりボイス,Softalk) VOICEROID(ガイノイドTalk・ギャラ子Talk・音街ウナTalk Ex) CeVIO/CeVIO AI A.I.VOICE Megpoid Talk(FineSpeech) SHABERU 唄詠
1パラメータ編 NT Parameters Note Gain Consonant Rate Attack Speed Dynamics Breathiness Super Formant Shifter Voice Voltage Pitch Control Voice Drive 2UI編 新しい描画ツール ピッチカーブを編集 バックグラウンドレンダリング オートエンベロープ 3挙動編 まさかの単音階音源!? 歌詞の表示方式 発音記号 無声化? 子音単体ノート 発音記号の編集 4おまけ VOCALOIDトラック 感想 1パラメータ編 NT Parameters NTにて新規実装されたパラメータです。 Note Gain ノートごとのゲイン(≒音量)を増減できるパラメータです。 0%にした場合、前後の音のフェードイン/アウトはそのままで、該当する音の音量が限りなく0に近くなります (語頭
歌声合成界隈に革命を起こしたAIベースの歌声合成ソフト「NEUTRINO」 特に、東北きりたん(CV:茜屋日海夏)のリアルな歌声を合成できることが非常に大きな話題を呼びました でも、どうして急に東北きりたんの歌唱AIがリリースされたのでしょうか? というわけで、今回は「東北きりたん歌唱データベース」を制作した明治大学の准教授、森勢将雅先生にお話を伺ってみました。 本日はよろしくお願いします。 早速ですが、森勢先生はNEUTRINOの開発者ですか? 森勢:いいえ。開発者ではありませんが、これがきっかけで新しいソフトウェアの開発が進んだり、オペレーションや調音(調声,調教...etc)の必要性を再認識して頂ければ嬉しいです。 それに関連して、私の方で研究・開発しているエディタはNEUTRINOや関連する技術で作られた歌声を出発点として、調音作業の手間を削減することを目的にしています。 「誰でも
いや~ついに出ましたね、一般ユーザーでも使えるDNN歌声合成ソフト とはいえ、エディターとか無いのでどうやって簡単に歌声を合成するか解説したいと思います 準備するもの やり方 下ごしらえ 本番 手っ取り早い方法 ある程度掛かるけど打ち込みデータの微調整などができる方法 NEUTRINO側の作業 準備するもの ①何かしら打ち込み済みのデータ(VSQx,UST,CCS,VPR,MIDIなど) ②UTAU 歌声合成ツールUTAU ダウンロードページ ③UtaFormatix ④このUTAUプラグイン ※アップローダーがaxfcなので、場合によってはアンチウィルスソフトなどでブロックされます。別のブラウザを使ったり、一時的にオフにすればダウンロードできる可能性があります ⑤こちらのソフト やり方 下ごしらえ ①もし、打ち込み済みのデータがUSTではない場合はUTAFormatixを利用してUSTに
そいえば各種の歌声合成についての説明は色々あるけど、全体的に評価したものは無い感じがしたので、主に以下の項目で勝手にランク付けしてみました ベタ打ち性能 エディタの操作性 声質パラメータの豊富さ パラメータの編集方法 DAWとの提携 重さ 音源の豊富さ 有志による内部拡張性 導入コスト なるべくは私情は入れないようにしていまが、独断と偏見が大いに含まれている可能性があるのでご了承ください 正直DTMer寄りか微妙な部分もあります 評価ランク付け一覧 VOCALOID4 VOCALOID5 VOCALOID4.5 (for Cubase) Piapro Studio Piapro Studio NT UTAU UTAU-Synth(上記UTAUのMac版) CeVIO CeVIO AI CeVIO Pro DeepVocal(Sharpkey) SynthV(+AI) NEUTRINO 結論
このページを最初にブックマークしてみませんか?
『アマノケイのまったり技術解説』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く