並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 136件

新着順 人気順

声質 種類の検索結果1 - 40 件 / 136件

  • 誰の声でも100人の声に変えられる声変換システム - Dwango Media Village(ドワンゴメディアヴィレッジ,dmv)

    著者の声を録画・録音して声を変換し元の映像と組み合わせてみた映像です。 このときの変換元の音声は撮影用のスマートフォンで録音しており、部屋の残響が含まれるなど声が少し不鮮明になる収録環境ですが、それでもしっかり声変換できていることがわかると思います。 概要 Dwango Media Villageの廣芝です。 誰の声でも狙った複数の人の声に変えることができる声変換システムを開発し、実際に声を変えることができるデモページを公開しました。 (2022年5月 SeirenVoiceシリーズの製品化に伴いデモページは終了しました。) この記事では、声変換技術を研究開発する際に取り組んだ課題について紹介します。 声の変換技術には、リアルタイム性と品質のトレードオフがあります。 既存の声変換システムはリアルタイム性を重視する傾向がある一方、品質を重視したものはあまり見かけません。 品質を優先した声変換

      誰の声でも100人の声に変えられる声変換システム - Dwango Media Village(ドワンゴメディアヴィレッジ,dmv)
    • コロナ感染記:ビュロ菊だより

      初めまして。僕は菊地成孔(きくち なるよし)と申します。音楽と著述を生業にしていまして、SNSというものは基本、やらないし、やったとしても、自分のライブや新刊、イベントの宣伝にしか使っておりません(それも全てマネージャーがやっています)。 なのですけれども、今月22日に、コロナ陽性反応が出まして、結論から先に申し上げると、少なくとも、僕個人に関しては「今度のコロナは感染力強いけど、重症化しない=行動制限もしませんよ」という図式は、真っ赤な嘘で、これは大げさではなく「一歩間違えたら死んでたかも」という経験をしました。 そこで、「SNSというのは、本来、こういうことを発信するためにあるのでは?」と思い、こうして発信させていただいている次第です。やっと今、フラフラではありますが、長文をキーパンチできる肉体的余裕が出てきた。という側面もあります。症状が出始めて10日目、抗原検査で陽性反応が出て9日

        コロナ感染記:ビュロ菊だより
      • マクドナルドが「ティロリティロリ」音源を配布 「ぜひご活用ください」

        日本マクドナルドが、ポテトが揚がったときに店内で流す音声「公式ティロリサウンド」を配布。「アラーム音にして目覚めるもよし、ご自身でリミックスして楽しむもよし。ご活用ください」という。 日本マクドナルドは1月17日、ポテトが揚がったときに店内で流すタイマー音「公式ティロリサウンド」の配布を始めた。使い方について「作業用BGMとして流すもよし、アラーム音にして目覚めるもよし、ご自身でリミックスして楽しむもよし。ぜひご活用ください」(同社)としている。 同音源を利用した楽曲「ティロリミックス」の公開に合わせた施策。これまでも音源を加工した楽曲などは公開していたが、オリジナル音源を公式に配布するのは初めてという。 関連記事 チキンを温めるゲーミングPC、KFCが正式発表 「ネタじゃなかったの?」ネットざわつく KFCのゲーム部門KFC Gamingが、プレイ中にフライドチキンを温めるゲーミングPC

          マクドナルドが「ティロリティロリ」音源を配布 「ぜひご活用ください」
        • ずんだもんが無料で使える、超高性能AIボイスチェンジャー、ParakeetVCが公開。1か月間は全キャラクタ、全機能が無料|DTMステーション

          自分の声をまったく別のキャラクタの声に変えることを実現するAIボイスチェンジャー。エフェクトを使って自分の声を加工する従来のボイスチェンジャーとは異なり、自分の声は完全に消えて、まったく別人になりきれるのが特徴で、これまでもVoidolやCoeFontボイスチェンジャーといったものを記事でも紹介してきたほか、中国系のフリーウェアでもかなりの精度を持ったものがいろいろ登場してきています。 そうした中、12月25日、まったく新たなAIボイスチェンジャー、Parakeet.VC(パラキート・ブイシー)が、福島県のベンチャー企業、Parakeet株式会社からリリースされました。ここには東北ずん子や東北きりたん、またずんだもんをはじめ、計109種類の声が収録されており、ユーザーはそれらを選んで、マイクで話せばリアルタイムにキャラクタの声に変換することが可能です。既存のAIボイスチェンジャーと比較して

            ずんだもんが無料で使える、超高性能AIボイスチェンジャー、ParakeetVCが公開。1か月間は全キャラクタ、全機能が無料|DTMステーション
          • AIの力で自分の声を好きな声にリアルタイム変換できるボイスチェンジャー「MMVC」が登場

            自分の声を美少女ボイスやイケメンボイスに変換してくれるボイスチェンジャーは、ライブ配信やムービー投稿の際にありがたい存在です。しかし、ボイスチェンジャーによって変換できる音声は固定されており、自分好みの音声に変換できるボイスチェンジャーを見つけるのは困難です。天王洲アイル氏は、この問題をAIを用いて解決する方法について解説し、さらにAIの力で自分の声を好みの声にリアルタイム変換できるボイスチェンジャー「MMVC」を公開しています。 VRChatなどの登場によって誰でも好きなアバターを使って好きなキャラクターになりきることが可能となりました。また、自分の声を美少女ボイスやイケメンボイスに変換できるボイスチェンジャーも多くの種類が存在しています。しかし、既存のボイスチェンジャーには「理想的な結果を得るためにはボイスチェンジャーに合わせた発声練習が必要」「リアルタイム変換が不可能なため、会話やラ

              AIの力で自分の声を好きな声にリアルタイム変換できるボイスチェンジャー「MMVC」が登場
            • マイクで録音するだけで誰でも「結月ゆかり」や「琴葉 茜・葵」の声になれるAI音声合成ソフト「Seiren Voice」を使ってみた

              これまでに誰でも簡単に「結月ゆかり」の声になれる音声変換技術や音声合成ソフト「VOICEVOX」を開発してきたヒホ氏の所属するドワンゴの機械学習技術研究部門Dwango Media VillageがAI音声合成ソフト「Seiren Voice」を発表しました。Seiren Voiceではマイクで録音した音声を自動で文字起こしして、イントネーションを再現したまま結月ゆかりや琴葉 茜・葵のボイスに変換可能とのことなので、実際に無料体験版をインストールして使い方や変換精度を確かめてみました。 高品質な音声変換ソフトウェア | Seiren Voice https://seiren-voice.dmv.nico/ ・目次 ◆1:Seiren Voice&音声ライブラリのインストール手順 ◆2:Seiren Voiceで音声を変換する手順 ◆3:Seiren Voiceで編集部員の声を結月ゆかりにボ

                マイクで録音するだけで誰でも「結月ゆかり」や「琴葉 茜・葵」の声になれるAI音声合成ソフト「Seiren Voice」を使ってみた
              • 今、タイでのVTuberブームが大変なことになっている "文化のるつぼ”から生まれる新たな才能を追う

                Home » 今、タイでのVTuberブームが大変なことになっている “文化のるつぼ”から生まれる新たな才能を追う バーチャルYouTuberという言葉が始まってから7年以上が経ち、VTuber文化は日本国内の若者から高齢者まで幅広く浸透してきています。このVTuber文化は海外でも少しずつ広がってきていて、各国のユニークな個性を映しだしはじめています。 中国語圏では日本と似た雰囲気のVTuber文化が根付いていて、英語圏ではVShojoを始めとした個人の個性を尊重する文化ができつつあります。ラテンアメリカではよりインディーVTuber(個人VTuber)の存在感がより際立っていて、韓国語圏ではKカルチャーの濃い音楽グループが国内外で人気を集めています。 これらのVTuber文化は言語の壁で、日常的にはなかなか目にする機会が少ないかもしれません。特に知られていない盛り上がりを見せているのが

                  今、タイでのVTuberブームが大変なことになっている "文化のるつぼ”から生まれる新たな才能を追う
                • もはや人間と区別がつかない次元に。多言語で歌う機能も搭載したSynthesizer Vの破壊力|DTMステーション

                  驚異的に進化したSynthesizer V AI まずは、バックグラウンドや機能、性能といったものを紹介する前に、私がSynthesizer V Pro Studioの1.5.0を使って打ち込んだ、弦巻マキの歌声をちょっと聴いてみてください。 いかがですか?従来の歌声合成の概念を覆すレベルに来ていると思いませんか?これは、2年前のコミケでDTMステーションCreativeからリリースしたoyasumiという曲の冒頭部分。そのときは声優の小岩井ことりさんにボーカルをお願いし、囁くように優しく歌ってもらったので、弦巻マキにも、それっぽく歌わせて仕上げてみたのです。本来、弦巻マキは「アニメキャラっぽい雰囲気の元気な女の子」というイメージの歌声ですが、そことはだいぶ違ったニュアンスの歌声になっているのも感じられたと思います。 「自動処理」メニューにある「自動ピッチ調整(カスタマイズ)」を選択する

                    もはや人間と区別がつかない次元に。多言語で歌う機能も搭載したSynthesizer Vの破壊力|DTMステーション
                  • “ゆっくりボイス”でお馴染みの「SofTalk」から、ゆっくりボイスが消える。ライセンスとフリーソフトの複雑な関係 - AUTOMATON

                    国内のソフトウェア個人開発者であるCNCC氏は7月23日、音声読み上げソフト「SofTalk」において、音声合成ミドルウェア「AquesTalk」への対応を中止することを発表した。また、同氏はしばらくSofTalkの開発自体を休止する意向を示している。 「SofTalk」は、CNCC氏が開発する音声読み上げフリーソフトウェア。テキストを入力すると合成音声を出力してくれる仕組みで、実況動画の音声などに広く用いられてきた。代表的なのは、一頭身化された「東方Project」キャラクターが掛け合いを繰り広げる動画での利用。いわゆる「ゆっくりボイス」だろう。同ソフトは複数の合成音声ライブラリに対応しており、ユーザー側で切り替えが可能。ライブラリの種類で声質も変化する。ゆっくりボイスとして認知されている声は、国内企業AQUEST(アクエスト)が開発する音声合成ミドルウェア「AquesTalk」シリーズ

                      “ゆっくりボイス”でお馴染みの「SofTalk」から、ゆっくりボイスが消える。ライセンスとフリーソフトの複雑な関係 - AUTOMATON
                    • にゃるら氏に聞く,「NEEDY GIRL OVERDOSE」に込めたディープな想い。幸せな結末は存在しなくても,あなたの思う幸せはあるかもしれない

                      にゃるら氏に聞く,「NEEDY GIRL OVERDOSE」に込めたディープな想い。幸せな結末は存在しなくても,あなたの思う幸せはあるかもしれない 編集部:早苗月 ハンバーグ食べ男 カメラマン:増田雄介 ワイソーシリアスは本日(2022年1月21日)18:00,同社のゲームレーベル・WSS playgroundから「NEEDY GIRL OVERDOSE」をSteamで発売した。価格は1680円(税込)。 本作は,ちょっぴり心の弱い女の子・あめちゃんと同棲しているピ(“彼ピ”や“プロデューサー”などの概念を包括する語。必ずしも男性ではない)となり,あめちゃんを人気配信者とすべく育成していくシミュレーションゲーム。あめちゃんは一見すると控えめな性格に思えるものの,ワガママかつ意地が悪いうえ感情の起伏が激しい女の子で,配信時は衣装やウィッグにより“超絶最かわてんしちゃん”へと変身する。 あめち

                        にゃるら氏に聞く,「NEEDY GIRL OVERDOSE」に込めたディープな想い。幸せな結末は存在しなくても,あなたの思う幸せはあるかもしれない
                      • VRChatのすべて(すべてではない) - Narazaka::Blog

                        VRChat口伝ノウハウ結構膨大にある気がするので、思いつくものを一度一括で吐き出してみようというやつです。 これを読めばVRChatの全てが分かる!!(大嘘 基本的にリンク集+αという感じですが、めちゃくちゃ色々手を広げて書いているので間違ってるとこ見つけたらコメントに書いてください。 なおこの記事はVRChat Advent Calendar 2020の6日目、VRChat Advent Calendar 2021の9日目のやつです。 adventar.org adventar.org 2021年色々更新してきて8万文字も超え、情報が当初の倍ちかくにはなったんじゃないかと思います。2022年もやっていくぞ。 本記事以外の「すべて」 本記事は主にVRChatに入ってからの生活面にフォーカスしたものですが、本記事以外の「すべて」系記事もあるのでご活用下さい。 「VRChatのアバタートラブ

                          VRChatのすべて(すべてではない) - Narazaka::Blog
                        • Synthesizer Vとは?〜使い方から最新機能まで徹底解説! - サンレコ 〜音楽制作と音響のすべてを届けるメディア

                          歌声合成ソフト、Synthesizer Vでは一体何ができるのか。自身でさまざまなクリエイターに声をかけ制作したコンピレーションアルバム『AIボーカルコンピVol.1 with Synthesizer V AI』をリリースするなど、Synthesizer Vに造詣が深い音楽プロデューサーの鈴木Daichi秀行氏に、その全貌を解説していただこう。 Text by 鈴木Daichi秀行 はじめに TOPIC 1|歌声を選んで歌詞を入力 TOPIC 2|外部からMIDIファイルを取り込む TOPIC 3|自動でテイクを作成するAIリテイク機能 TOPIC 4|好みに合わせて声色を調節 TOPIC 5|歌だけでなくラップにも対応 TOPIC 6|プラグインとしての活用とオーディオデータの書き出し TOPIC 7|直近のアップデートで追加された新機能 まとめ 【特集】夢ノ結唱 BanG Dream!

                            Synthesizer Vとは?〜使い方から最新機能まで徹底解説! - サンレコ 〜音楽制作と音響のすべてを届けるメディア
                          • 無料……だと? めちゃ自然に読み上げてくれるWeb音声合成サービスが登場、営利目的や配信などでも使用可

                            ※本記事はアフィリエイトプログラムによる収益を得ています Yellstonが、音声合成サービス「CoeFont STUDIO」を公開しました。入力した文章を読み上げてくれるWebサービスなのですが、無料とは思えない極めて自然な音声で読み上げてくれるとさまざまなかいわいの人たちをざわつかせています。すごいのが出てきた……! CoeFont STUDIO 試しに吉野家コピペを入力して読み上げさせてみたところ、大変流ちょうに読み上げ始めて爆笑しました。イントネーションが調整できるようになっているのですが、特に調整する必要性は感じないほど。 現在芯の通った声質の「アリアル」と透き通った声質の「ミリアル」の2種類の音声が公開されており、自由に切り替えられます。ミリアルの方は「Prototype」の記述があり、アリアルの方がより自然に読み上げてくれる印象でした。 CoeFont STUDIOはリリース

                              無料……だと? めちゃ自然に読み上げてくれるWeb音声合成サービスが登場、営利目的や配信などでも使用可
                            • テレカンのマイクは最低限の音質をクリアしていればいいのに頑張りすぎ という話 - 音味

                              【追記】ブクマでコメントいただいたので追記書きました 【追記2】この記事でのテレカンとはzoomやmeetなどのビデオ会議、Web会議のことです 。最初からWebのオンライン会議ってしておけばよかった... 【テレカンとは?】メリット5つと電話・テレビ・ウェブの選び方を紹介 | オンライン商談ツール・システムなら VCRM 「テレカンはマイクは最低限の音質をクリアしていればいいのに頑張りすぎ」って記事を書こうとしてもう2ヶ月過ぎてた— Masao Maeda (@brtriver) 2021年3月2日 というtweetをして、タイトルで言いたいこと書いてしまってさらに記事にする理由なくなったのですが、せっかくなので言いたかったことを書いてみます。 aroundで使っているマイクとカメラ 3行でまとめると ある程度聞きやすい音質であればそれ以上の高音質にする必要がない ボーカルレコーディング

                                テレカンのマイクは最低限の音質をクリアしていればいいのに頑張りすぎ という話 - 音味
                              • Vtuberにも人気のAIボイスチェンジャーが新音声変換エンジンを追加し、Voidol 2へ。声は自在に作り込む時代に|DTMステーション

                                自分の声をAI機能でアイドルの声やキャラクタの声などにリアルタイムに変換するユニークなソフトとして、これまでも何度か紹介してきたVoidol。これはクリムゾンテクノロジー株式会社が開発するリアルタイム音声変換技術「リアチェン voice」を搭載したアプリケーションで、VTuberやゲーム実況などの世界でも幅広く使われているWindowsおよびMacで動作するソフトとなっています。 そのVoidolがこれまでのAIリアルタイム音声変換機能に加えて、まったく新たな音声変換エンジンを搭載し、Voidol 2へとメジャーバージョンアップすることが関係者への取材から分かりました。正式な発表・発売は10月20日になるとのこと。税込み価格は13,200円(12月26日までは発売記念価格の8,800円)が予定されています。今回Voidolに加わった最大のポイントは、声をリアルタイム処理でシンセサイジングす

                                  Vtuberにも人気のAIボイスチェンジャーが新音声変換エンジンを追加し、Voidol 2へ。声は自在に作り込む時代に|DTMステーション
                                • 完全無料の動画編集ソフト「VideoProc Vlogger」は多種多様な便利機能の使いやすさが圧倒的で初心者にもオススメ

                                  YouTubeやTikTokの登場によって誰でも動画を公開できる時代が到来したわけですが、かといって誰でも「動画編集」を行えるかというと話は別で、「どうやって編集したらいいかわからない」「というか、まずどのソフトウェアを使えばいいのかすらわからない」という思いを抱いている人も多いはず。「VideoProc Vlogger」は完全無料なのに動画編集に必要不可欠な機能を完全網羅している上にそれぞれの機能が直感的に使え、編集から加工、そして書き出しまでこれ一本で大丈夫というソフトウェアになっています。 【公式HP】VideoProc Vlogger -無料動画編集&動画作成&動画加工ソフト https://jp.videoproc.com/videoprocvlogger.htm まずは公式ページにアクセスして、「無料ダウンロード」をクリック。 「ファイルを保存」をクリック。 保存先に生成された

                                    完全無料の動画編集ソフト「VideoProc Vlogger」は多種多様な便利機能の使いやすさが圧倒的で初心者にもオススメ
                                  • もっと早く知りたかった!Web制作に便利な最新オンラインツール46個まとめ

                                    この記事では、日々進化を続けるWeb制作で役立つ、便利な最新オンラインツールをまとめてご紹介しています。 Ai、人工知能を利用した、これまで面倒だった作業を改善できるツールも見かけるように。また、プロトタイプツールFigmaに関する便利なプラグイン、テレワークによるオンラインミーティングで使えるさーびすなども増えています。 カテゴリごとに整理しているので、目的にあったお気に入りツールを探してみましょう。 コンテンツ目次 1. Web制作便利ツール 2. デザインコレクション 3. イラスト系ライブラリ 4. 配色ツール 5. プロトタイプツール 6. アイコンツール 7. コラボ、リモートワークツール 8. 面白、クリエイティブツール Web制作が面白いほどはかどる!便利な最新オンラインツールまとめ Web制作便利ツール Eazy CSS どんなウェブサイトのデザインも、コード知識不要でタ

                                      もっと早く知りたかった!Web制作に便利な最新オンラインツール46個まとめ
                                    • 『池袋ウエストゲートパーク』が生んだカリスマ、「キング」の夢の対談が実現! 内山昂輝×窪塚洋介インタビュー(前編) | アニメ ダ・ヴィンチ

                                      『池袋ウエストゲートパーク』10月6日より、TOKYO MXほかにて毎週火曜24時30分より放送。Amazon Prime Videoにて毎週火曜 24:15頃~地上波先行・見放題独占配信 (C)石田衣良/文藝春秋/IWGP製作委員会 10月6日からいよいよ放送がスタートするTVアニメ『池袋ウエストゲートパーク』。原作は1998年から現在まで続く石田衣良の同名小説で、東京・池袋を舞台にトラブルシューターの「マコト」が様々な事件を解決していくストリート系ハードボイルド・ストーリーだ。2000年にはドラマ化され大ヒット、中でもブッ飛んだ強烈なカリスマ「キング」を演じ、熱狂的な支持を集めたのが窪塚洋介だ。今回、そんな窪塚とアニメ版キングの声を担当する内山昂輝の対談が実現。20年の時を経てふたりのキングが出会った! ――『池袋ウエストゲートパーク』のファンにとっては堪らない「キング」の対談となりま

                                        『池袋ウエストゲートパーク』が生んだカリスマ、「キング」の夢の対談が実現! 内山昂輝×窪塚洋介インタビュー(前編) | アニメ ダ・ヴィンチ
                                      • コード進行の話:サブドミナントマイナーの入った曲(30曲) - ブンゲイブ・ケイオンガクブ

                                        このサムネ画像を見てすぐにピンときた人は物分かりが良すぎると思いますが、単語の”サブドミナントマイナー”よりも「Radioheadの『Creep』の4つ目のコード」と言ったほうが分かりやすいのかも、と、この概念については時々思います。 ということで、今回はこの、『Creep』において4つの循環するコードの最後に置かれてとても不穏な空気を出している、正式には”サブドミナントマイナー”と呼ばれるコードについて少々調べてまとめた記事になります。とは言っても、楽理的な話は苦手なので、たとえば五線譜で音がこう配置されるから、とか、スケールの中でどうのこうの、とか、サブドミナントマイナーのコードの代理コードはこれで、とかそういう話はほとんど触れられませんので、そういうのを知りたい方は他のサイトを見た方がいいと思います。 今回集めた30曲は例によって最後にプレイリストを掲載します。 なお、今回の記事は弊

                                          コード進行の話:サブドミナントマイナーの入った曲(30曲) - ブンゲイブ・ケイオンガクブ
                                        • 無償入手可能な音声コーパス/音声データベースの一覧 - Qiita

                                          無償かつ入手しやすい音声データセットをメモしています。 ライセンス・利用規約は「商用利用可能」「研究用途のみ」ともに紹介します。 コーパスを探すときに有用なサイト コーパス配布元サイト 音声資源コンソーシアム : 日本語コーパスが豊富、無償または有償で利用可能 緩いライセンスのコーパスでなくても良いときはここ 自発的発話の日本語音声コーパスはだいたいここにある 入手は要申請 所属や責任者を記入する必要があるため、研究者や企業でないと厳しい? (この記事では音声資源コンソーシアムのコーパスは未掲載) Shinnosuke Takamichi: コーパス一覧 : 日本語中心。高道先生が携わっている音声コーパス 大量の日本語音声コーパスが配布されている 音声合成のコーパスをつくろう (Slideshare) : 2021年6月時点の音声コーパス事情 あなたにどうしても伝えたい30の音声コーパス

                                            無償入手可能な音声コーパス/音声データベースの一覧 - Qiita
                                          • 低遅延・直感操作のソフトウェアボイスチェンジャー「Voidol 2」を速攻レビュー | PANORA

                                            美少女の声でしゃべりたい──。クリムゾンテクノロジーから10月20日に一般販売が開始された「Voidol 2」(定価:税込1万3200円)は、そんな願望をかなえるソフトだ。 「Voidol 2」は、同社が開発する音声エンジン「リアチェン voice」を用いてリアルタイム声質変換を実現した、いわゆるソフトウェアボイスチェンジャー。シンセサイジングによる新エンジンを搭載し、40ミリ秒程度の低遅延で動作が可能な点が特徴だ。直感的でわかりやすい操作も魅力の1つで、特にこれからボイスチェンジャーに触れてみたい人にお勧めできるエントリー版となる。 そもそも「ボイスチェンジャー」とは レビューに入る前に、そもそも「ボイスチェンジャー」とはどのようなものなのか簡単に解説したい。ボイスチェンジャー(ボイチェン)は大きく分けて、「ハードウェアボイチェン」と「ソフトウェアボイチェン」の2種類が存在する。 前者は

                                              低遅延・直感操作のソフトウェアボイスチェンジャー「Voidol 2」を速攻レビュー | PANORA
                                            • 誰の声でも簡単・リアルタイムで女声・男声・ささやき声などへ自由自在に変換できる「Voidol3」のSYNTHモードを使ってみたよレビュー

                                              AI技術を応用したソフトを開発するクリムゾンテクノロジーから、AIリアルタイムボイスチェンジャー「Voidol3」が2023年9月8日に登場しました。Voidol3はシンセサイジングによる超高速声質変換エンジンによるボイスチェンジャー「SYNTHモード」と、自身の声を特定のキャラクターの声に変換するAIリアルタイム声質変換が可能な「AIモード」を搭載し、さらにその両方を連結したリアルタイムの声質変換も可能だとのこと。まずはVoidol3のSYNTHモードによるボイスチェンジャーを試してみました。 Voidol3 | 変幻自在の声質変換 | クリムゾンテクノロジー株式会社 https://crimsontech.jp/apps/voidol3/ 今回Voidol3を使うにあたって、オーディオインターフェースとしてコンデンサーマイクのMPM-1000とヤマハ・AG-03をPCに接続して使用しま

                                                誰の声でも簡単・リアルタイムで女声・男声・ささやき声などへ自由自在に変換できる「Voidol3」のSYNTHモードを使ってみたよレビュー
                                              • 機械学習の煩雑なパラメーター管理の決定版 「Hydra」「MLflow」「Optuna」の組み合わせで手軽にはじめる一元管理

                                                Optuna™は、オープンソースのハイパーパラメーター自動最適化フレームワークです。 「Optuna Meetup #1」では、Optunaのユーザー、導入を検討している方、また開発者を中心に、Optunaの様々な活用方法が共有されました。中村氏は、Hydra・MLflow・Optunaを組み合わせたハイパーパラメーター管理について発表しました。 ふだんは音声合成と声質変換技術などの音声を用いる技術を研究 中村泰貴氏(以下、中村):「HydraとMLflowとOptunaの組み合わせで手軽に始めるハイパーパラメータ管理」というタイトルで、東京大学大学院情報理工学系研究科の修士課程2年の中村が発表します。 軽く自己紹介ですが、先ほど述べたように情報理工学系研究科の、猿渡・小山研究室の修士課程2年です。音声合成に関する技術をふだん研究しています。「Twitter」をやっているので、ぜひフォロー

                                                  機械学習の煩雑なパラメーター管理の決定版 「Hydra」「MLflow」「Optuna」の組み合わせで手軽にはじめる一元管理
                                                • CASIOが歌うシンセサイザ・CT-S1000Vをリリース。和音も歌える新型カシオトーンが3月発売|DTMステーション

                                                  先日「CASIOが間もなく、新音源方式のシンセサイザーを発表か!?」という記事で取り上げたCASIOのシンセサイザが本日1月21日に、正式に発表されました。すでに海外からのリーク情報なども流れていたので、気になっていた方も多いと思いますが、登場したのはCT-S1000Vという製品で、指定した歌詞に合わせて歌わせることができるシンセサイザ。日本語、英語に対応するバイリンガルであり、和音を歌わせることも可能というものです。CeVIOを生み出した名古屋工業大学を中心とした研究に基づく技術を使用したテクノスピーチのHMMエンジンを中枢に据えるとともに、CASIOの電子楽器音源技術を組み合わせることで生まれたユニークな楽器となっています。 歌うキーボードとしては、2017年にYAMAHAがVOCALOID Keyboardを発売していますが、このCT-S1000Vは和音で歌わせることができるのが大き

                                                    CASIOが歌うシンセサイザ・CT-S1000Vをリリース。和音も歌える新型カシオトーンが3月発売|DTMステーション
                                                  • AIで自分のしゃべり声をリアルタイムに別人の声に変換させる無料のサービス、CoeFontボイスチェンジャーの威力|DTMステーション

                                                    すでにご存じの方、使っているという方も少なくないと思いますが、自分のしゃべる声をAIでリアルタイムにまったく違う人の声に変換するシステム、CoeFont ボイスチェンジャーが大きな話題になっています。これは株式会社CoeFontが提供しているAIによるボイスチェンジャーで、マイクに向かってしゃべれば、非常にリアルな声で別の人に声に置き換わるというもので、男性の声を入力しても、まったく違和感なく、リアルな女性の声にすることが可能です。あの、ひろゆきさんの声を含め、現在10人の声に変換が可能で、それを無料で使えてしまうというのが大きなポイント。 今後は人気キャラクターや著名人を含む1万種類以上の声への変換も可能になるとのことで、まさにボイスチェンジャーの世界における革命となりそうです。現時点ではWindowsのみで利用可能ですが、近い将来、Macにも対応するとのこと。またGPU搭載のパソコンで

                                                      AIで自分のしゃべり声をリアルタイムに別人の声に変換させる無料のサービス、CoeFontボイスチェンジャーの威力|DTMステーション
                                                    • ドワンゴ、AIボイスチェンジャー公開 誰の声でも100人の声に変換

                                                      ドワンゴは9月14日、ディープラーニング技術を活用したボイスチェンジャー「Seiren Voice」をWebサイトで無償公開した。デモページでは、声を録音して変換先の声を選び、変換ボタン押すと自分の声を100人分の声に変換できる。 録音した音声を加工するのではなく、目標の人物の声に変換するもの。選べるターゲットの数は100種類。変換のリアルタイム性より変換品質を優先しており、変換には数十秒から数分の時間がかかる。 既存の声質変換システムはリアルタイムに変換するものが多く、品質を重視したものはあまり見かけないとして開発に挑んだという。音声の合成には、スマートスピーカーなどで使われるWaveNetという方式から派生したWaveRNNを採用した。 ディープラーニングを使った声質変換では、変換前の声と目標とする人物の声をセットで学習する手法がとられることがある。この手法ではボイスチェンジャーを使い

                                                        ドワンゴ、AIボイスチェンジャー公開 誰の声でも100人の声に変換
                                                      • VOCALOIDじゃない「初音ミク NT」は何が違う? 現役ユーザーが詳細レビュー

                                                        クリプトン・フューチャー・メディア(CFM)の“VOCALOIDじゃない初音ミク”、6月4日に公開された試作バージョンに早速触れてみたのだが、すぐに「地味でも本当に欲しかった機能が盛りだくさんでうれしい……うれしい……」と語彙力を失った。ミクの歌声をもっと細かくいじり倒したかった人々には、文句なしにおすすめできる。 “VOCALOIDじゃない初音ミク”とは、初音ミク NTのことだ。CFMオリジナルの歌声合成ソフト「Piapro Studio」専用のボーカル音源で、ヤマハの歌声合成ソフト「VOCALOID」では使えない。 開発が自由にできるようになったのか、細かいところから大きなところまで、既存の歌声合成ソフトのいいとこ取りをしている。いじり倒したかった側の人間としては、「そう! それが欲しかったんだよ!」と叫びながら作業してしまう程度には満足度の高いものに仕上がっていた。 これまで約30種

                                                          VOCALOIDじゃない「初音ミク NT」は何が違う? 現役ユーザーが詳細レビュー
                                                        • 生成AI「Suno」が作った楽曲は再利用できる? 分解して想像した、「Suno以降」の音楽制作と音楽体験(CloseBox) | テクノエッジ TechnoEdge

                                                          脅威に感じたり、まだまだ不足している部分を指摘する一方で、「こういう使い方なら効率がすごく上がる」といったポジティブなアイデアが次々と生まれていて、さすがシンセサイザー、サンプリング、物理モデリング、ループベース制作、VOCALOIDといった破壊的技術をいくつもくぐりぬけてきただけのことはあります。 前回はSunoが作ったものをそのまま公開したのですが、全体的な完成度は相当に高いとはいえ、不満なポイントはいくつかあります。 ・ボーカルと伴奏が合っていない部分がある ・節回しで不自然なところがある ・全体的に音質が良くない ・無理やり展開しているところがある ・エンディングまで到達しておらず尻切れトンボ でも、楽曲としては非常に気に入っているので、部分的に直すことができればベスト。じゃあこれをベースに作り直してみようと考えたのです。最小限のアレンジを施した「歌ってみた」。これが目標です。 今

                                                            生成AI「Suno」が作った楽曲は再利用できる? 分解して想像した、「Suno以降」の音楽制作と音楽体験(CloseBox) | テクノエッジ TechnoEdge
                                                          • 2022年に見ていたアニメ - Close To The Wall

                                                            例年通り、そしてこのはしがきも去年のコピペに近いけど、今年見ていたアニメのなかで各クール10作程度をピックアップして、ツイッターにその都度書いていたことを元にしたりしなかったりしながらまとめた。ネタバレを気にせず最終話の内容を書いてるのもあるので各自ご留意されたし。いつものことだけど年始のものを年末にまとめたりしているので年始のものは記憶が曖昧だったりする。基本的にクール単位で上にあるものほど高評価だけどそんなに厳密ではないしショートアニメは下の方に置いてる。そして配信が年明けになってるものもあるのでいくつか追記する予定。 2022年アニメ10選 冬クール(1-3月) CUE! スローループ 怪人開発部の黒井津さん ハコヅメ~交番女子の逆襲~ その着せ替え人形は恋をする 明日ちゃんのセーラー服 失格紋の最強賢者 ジョジョの奇妙な冒険 ストーンオーシャン プリンセスコネクト!Re:Dive

                                                              2022年に見ていたアニメ - Close To The Wall
                                                            • VTuberのための悪魔のアイテム、Voidolに新キャラ12種類が追加。自分の声を佐藤聡美さんや小岩井ことりさんに変身!|DTMステーション

                                                              4月に「VTuberに超強力兵器が誕生!リアルタイムに自分の声をキャラクタボイスに変換できるソフト、Voidolが発売開始!」という記事で紹介したWindows/Mac用のソフト、Voidol(ボイドル)に新たなキャラクタ6種類が登場し、本日11月14日より発売が開始されました。11月中にはさらに6種類が追加され、計12種類が発売され、Voidol本体に含まれる「くりむ蔵」、「奏ミナト」、「音宮いろは」、さらに最新のアップデート版Voidol 1.2.0で本体内に追加された「ヨネちゃん」と併せて、計16種類となります。 第1弾として発売される6種類の中には、佐藤聡美さんがCVを務める「東北ずん子」、また小岩井ことりさんがCVを務める声乃ツバサなどがあり、これらをインストールすれば、自分の声をリアルタイムに佐藤さん、小岩井さんの声に変換してしゃべったり歌ったりすることが可能になります。このリ

                                                                VTuberのための悪魔のアイテム、Voidolに新キャラ12種類が追加。自分の声を佐藤聡美さんや小岩井ことりさんに変身!|DTMステーション
                                                              • 誰でも無料でブラウザから簡単に美少女ボイスになれる「VOICE AVATAR 七声ニーナ」を実際に使ってみるとこんな感じ

                                                                DeNAが、自分の声をキャラクターの声に変換できるウェブサービス「VOICE AVATAR 七声ニーナ」を発表しました。ブラウザ上で録音した声を、PyTorchによる機械学習モデルで無料で変換してくれるとのことで、実際に使ってみました。 VOICE AVATAR 七声ニーナ https://nanakoe-nina.dena.ai/ 上記ページにアクセスすると、音声のオン・オフを選べます。どちらも同じサービス内容ですが、音声オンを入れると七声ニーナの挨拶やシステムボイスが再生されます。今回は「ON」を選択。 画面はこんな感じ。声を録音するためには、「REC」のボタンをクリックします。 初回は利用規約とプライバシーポリシーへの同意を促されるので、「同意して音声を入力する」をクリック。 マイクデバイスの使用許可を尋ねるポップアップが出現するので、「許可する」をクリック。なお、VOICE AVA

                                                                  誰でも無料でブラウザから簡単に美少女ボイスになれる「VOICE AVATAR 七声ニーナ」を実際に使ってみるとこんな感じ
                                                                • 【寝かしつけから解放】自分で布団に行きたがる!ドリームスイッチの感想レビュー - さぶろぐ

                                                                  移転しました。 まじで毎日の寝かしつけしんどい・・。 たまには楽したいけど絵本は読んであげたい・・・。 ディズニー ドリームスイッチはこんな悩みを解決してくれる動く絵本のプロジェクターです。 ▼こんなメリットがあります ・子供から布団に行く ・自然と寝る姿勢になる ・知育効果がある ・驚くほどあっさり寝る ・スキンシップする余裕ができる 「今日は寝落ちするわけにはいかない」という日に、ドリームスイッチという選択肢が増えたのは、まさに革命。 我が家では今まで毎日欠かすことなく、寝る前には絵本を読んでいたせいか、「同じ部屋にいないと絶対寝ないマン」でした。 ドリームスイッチを購入してから、同じ部屋にいなくても自分たちで寝てくれるようになり、日々の寝かしつけも余裕を持って接することができるようになりました。 何より親も楽しい!! そんなディズニー ドリームスイッチをレビューしていきます! ディズ

                                                                    【寝かしつけから解放】自分で布団に行きたがる!ドリームスイッチの感想レビュー - さぶろぐ
                                                                  • 一日で俺の嫁を作る方法 ~一日で自分の好きな声・キャラ・見た目でおしゃべりしてくれるAIキャラクターを作ろう~ - Qiita

                                                                    はじめに いくつかのAPIを組み合わせることで、一日で自分の好きな声・キャラ・見た目でおしゃべりできるAIキャラクターを作りました。この記事を読めば同じ感じで誰でも一日で俺の嫁を作ることができるようになります。 また今回はVR環境版とスマートフォン環境版の二種類を作成しました。 これらのアプリとUnity Projectは以下のgithubで公開しています。 軽く試してみたい人は作り方の6に従って、AgentCraftでAIの会話例を作成して、それをSebastienでデバイスIDとして発行すれば試すことができます。詳しくは6および6に載せている資料をご覧ください。 https://github.com/gyokuro33/ai-agent 何を作ったか こんなのです。 スマートフォン版 俺の嫁を一日で作ってみた pic.twitter.com/c3xbmofXH8 — おろろ (@oro

                                                                      一日で俺の嫁を作る方法 ~一日で自分の好きな声・キャラ・見た目でおしゃべりしてくれるAIキャラクターを作ろう~ - Qiita
                                                                    • 音声・歌声合成ソフト「CeVIO」、オンライン授業向けに無償提供 新型コロナ対策支援で

                                                                      テクノスピーチは4月10日、Windows用の音声合成・歌声合成ソフトウェア「CeVIO Creative Studio」を期間限定で無償提供すると発表した。対象は大学、高校、中学校、小学校などの教職員で、新型コロナウイルスの感染拡大防止策として行われるオンライン授業やオンデマンド授業向けのコンテンツ作成での利用を想定している。 CeVIO Creative Studioは、HMM(隠れマルコフモデル)方式と呼ばれる統計的手法で、話者、歌手の表現や声質を再現するソフトウェア。女声2種類(さとうささら、すずきつづみ)と男声1種類(タカハシ)の計3種類の音声を合成できる。女声の1つ(さとうささら)は、歌声合成も可能だ。 オプションでさまざまな歌手を追加することもできる。その中には、故・三波春夫さんの歌声を再現した「ハルオロイド・ミナミ」も含まれる。 利用の申し込みはメールで受け付ける。ソフトを

                                                                        音声・歌声合成ソフト「CeVIO」、オンライン授業向けに無償提供 新型コロナ対策支援で
                                                                      • teenage engineeringから、“歌う木製人形”「choir」が登場…… 合唱やMIDIキーボードからのリアルタイム歌唱にも対応

                                                                        teenage engineering「choir」 teenage engineeringから、またまたユニークな製品が発売になりました。本日販売が開始された「choir」は、クワイア音源を内蔵した“歌う木製人形”。世界各地の民謡などプリセットされた22の楽曲を歌い上げるほか、BluetoothでMIDIキーボードを接続することにより、リアルタイムに音程や子音/母音などをコントロールすることも可能になっています。もちろんスピーカーやバッテリーも搭載し、満充電で最大4時間の連続歌唱に対応。外観や声質が異なる8種類のバリエーションが用意され、複数の「choir」をBluetooth接続すれば、合唱団として美しいハーモニーを奏でることも可能になっています(最大16体の合唱に対応)。 teenage engineeringの創始者であり代表であるジェスパー(Jesper Kouthoofd)氏は

                                                                          teenage engineeringから、“歌う木製人形”「choir」が登場…… 合唱やMIDIキーボードからのリアルタイム歌唱にも対応
                                                                        • “ローランド”初のゲーム配信者向けオーディオミキサー「BRIDGE CAST」1月28日に発売決定。デュアル・オーディオミキサーを搭載し、ハイクオリティな配信を実現する

                                                                          “ローランド”初のゲーム配信者向けオーディオミキサー「BRIDGE CAST」1月28日に発売決定。デュアル・オーディオミキサーを搭載し、ハイクオリティな配信を実現する ローランド株式会社はゲーミング・オーディオミキサー「BRIDGE CAST」を1月28日(土)に発売すると発表した。 ローランド株式会社は電子ドラムや電子ピアノ、シンセサイザーといった電子楽器のブランド「Roland」をはじめ、ギター関連製品の「BOSS」、ヘッドホンの「V-MODA」などを擁する日本の大手電子楽器メーカー。このたび発売日が発表された「BRIDGE CAST」はローランド初のゲーム配信用途に特化したオーディオミキサーだ。 PCに接続して運用することで音質の向上や音のバランス調整のほか、効果音やBGMなどの演出が可能。「視聴者が聴く音声」と「配信者本人が聴く音声」を個別に調整するデュアル・オーディオミキサーを

                                                                            “ローランド”初のゲーム配信者向けオーディオミキサー「BRIDGE CAST」1月28日に発売決定。デュアル・オーディオミキサーを搭載し、ハイクオリティな配信を実現する
                                                                          • プラグインでVTuberにチャレンジ!? トークボイスを大きく変化させるエフェクト3製品を試してみた|DTMステーション

                                                                            VSTやAU、AAXといったDAW用プラグインは、一般的には音楽制作のために用いるものですが、中にはちょっと違った使い方をするものも存在します。今回とりあえげる3つのプラグインは、音楽制作にも利用できないわけではないですが、基本的にはしゃべる声に対して利用するエフェクト。このオンラインミーティングやネット配信が盛り上がる今、こんなプラグインを使って遊んでみるのも楽しそうです。 紹介するのはFLUX::SEのIRCAM Trax、McDSPのFutzBox、KROTOSのDehumaniser Simple Monstersの3種類。いずれも、オモチャプラグインというわけではなく、ポストプロダクションなどでも用いられる本気の業務用プラグイン。映像作品を作る……といった場合にもいろいろと活用できそうです。今回、声優の葵井歌菜(あおいかな)さんに協力をいただき、声のサンプルをレコーディングしても

                                                                              プラグインでVTuberにチャレンジ!? トークボイスを大きく変化させるエフェクト3製品を試してみた|DTMステーション
                                                                            • NEUTRINO(歌声合成エンジン)とは (ニュートリノとは) [単語記事] - ニコニコ大百科

                                                                              NEUTRINO(歌声合成エンジン)単語 16933件 ニュートリノ 4.4千文字の記事 66 0pt ほめる 掲示板へ 記事編集 概要歌声合成手法の詳細について関連動画関連リンク関連項目脚注掲示板NEUTRINOとは、ニューラルネットワークを用いた歌声シンセサイザーである。 概要 楽譜データ(MusicXML形式)から発声タイミング・音の高さ・声質・声のかすれ具合などをニューラルネットワークで推定し、実際の歌唱データからなる歌声ライブラリで合成するソフトウェア。 「NEUTRINO」との名称については、「まだ聞いたことのないような楽曲・ジャンルを開拓してほしいという思いを込めて名付けました。[1]」とのこと。 2020年2月22日にαテスト版のVersion.0.100が公開された。公開されると早速、NEUTRINOを用いて様々な楽曲を歌唱させた動画が複数のユーザーからニコニコ動画などで

                                                                                NEUTRINO(歌声合成エンジン)とは (ニュートリノとは) [単語記事] - ニコニコ大百科
                                                                              • ローカル環境で音声・立ち絵付きのAIと会話できるソフトウェア ez-chat-llm を作りました。

                                                                                ※つくよみちゃんイラスト素材:花兎*さん 概要(忙しい人向け) 手軽にローカル LLM (音声・立ち絵付き) と会話できるソフトウェア ez-chat-llm を開発しました。動作の様子は動画 (https://www.nicovideo.jp/watch/sm43196446) からご覧いただけます。 ez-chat-llm は、GitHub のリポジトリ (https://github.com/offtoung/ez-chat-llm) から利用できます。また、Google Colab Pro をお使いの方は、ノートブックから簡単に試せます。 副産物として、Pythonから簡単に利用できる音声合成ライブラリ eztts ができました。なんと、このために音声合成モデルをフルスクラッチで学習するという手の込みようです。 上記の GitHubリポジトリをクローンしたディレクトリに入り、次のよ

                                                                                  ローカル環境で音声・立ち絵付きのAIと会話できるソフトウェア ez-chat-llm を作りました。
                                                                                • 人間らしい音声の合成を目指して感情の表現も可能なオープンソースの読み上げAI「StyleTTS 2」が登場

                                                                                  大規模音声言語モデル(SLM)と拡散モデルによる敵対的学習を利用して、人間レベルの読み上げ音声を合成できるText-to-Speech AI「StyleTTS 2」を、コロンビア大学の研究者らが開発しました。StyleTTS 2は参照する音声を必要とせず、読み上げるテキストに最適なスタイルを生成し、ネイティブスピーカーと同じくらいなめらかに英語を読み上げることが可能です。 [2306.07691] StyleTTS 2: Towards Human-Level Text-to-Speech through Style Diffusion and Adversarial Training with Large Speech Language Models https://arxiv.org/abs/2306.07691 GitHub - yl4579/StyleTTS2: StyleTTS

                                                                                    人間らしい音声の合成を目指して感情の表現も可能なオープンソースの読み上げAI「StyleTTS 2」が登場