並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 618件

新着順 人気順

音声の検索結果1 - 40 件 / 618件

音声に関するエントリは618件あります。 AI技術音声合成 などが関連タグです。 人気エントリには 『音声合成業界に激震! もはや人間の喋り声、入力文字読み上げソフトVOICEPEAKはビジネス用途でも自由に利用可能|DTMステーション』などがあります。
  • 音声合成業界に激震! もはや人間の喋り声、入力文字読み上げソフトVOICEPEAKはビジネス用途でも自由に利用可能|DTMステーション

    日進月歩というより、秒進分歩で進化している感じのある音声合成、歌声合成の世界ですが、また新たな革命ともいえるAI音声合成ソフトが誕生しました。これまでDTMステーションでも何度も取り上げてきた歌声合成ソフト、Synthesizer Vを開発するDreamtonics株式会社と株式会社AHSと共同開発する形で、もはや人間の喋り声にしか聴こえない音声合成ソフト、VOICEPEAKを発表し、3月11日から発売を開始するのです。Synthesizer Vと同様、Windows、Mac、Linuxでも動くマルチプラットフォームソフトで価格はダウンロード版で23,800円(税込み)となっています。 このソフト「VOICEPEAK 商用可能 6ナレーターセット」という製品名になっていますが、実際には女性3人+男性3人+女の子1人=7人の声を切り替えることが可能なAI音声合成ソフトで、テキストを入力すれば

      音声合成業界に激震! もはや人間の喋り声、入力文字読み上げソフトVOICEPEAKはビジネス用途でも自由に利用可能|DTMステーション
    • VOICEVOX | 無料のテキスト読み上げ・歌声合成ソフトウェア

      オープンソース VOICEVOX は OSS(オープンソース・ソフトウェア)版 VOICEVOX をもとに構築されています。 製品版と OSS 版の違いやモジュール構成は VOICEVOX の全体構成 をご参照ください。 ソフトウェア部分は Electron + Vue 、音声合成エンジン部分は Python + FastAPI です。 追加したい・改善したい機能があれば、ぜひ開発にご参加ください。

      • 「面倒なことはChatGPTにやらせよう」の全プロンプトを実行した配信のリンクを整理しました|カレーちゃん

        Youtubeで配信しながら全プロンプトを実行しましたので、各節へのリンクを整理しました。時間のところにYoutubeへのリンクになっています。 もしずれていたら、その時間まで移動して視聴ください。 はじめに (4:00) 1章 ChatGPTの基礎知識 (5:50) 2章 ChatGPTの基本的な使い方 (6:28) 3章 ChatGPT Plusのセットアップ (7:32) 4章 ファイルのアップロードとダウンロード (12:40)4.1 アップロード・ダウンロード (13:03) 4.2 扱うことができるファイル (16:02) 5章 繰り返し作業を一瞬で (16:55)5.1 文字列操作 (17:20) 5.2 正規表現でのパターンマッチ (25:36) →54ページの正規表現でできることの例の説明 (29:09) 5.3 ファイルの一括操作 (46:20) 5.4 QRコード作成

          「面倒なことはChatGPTにやらせよう」の全プロンプトを実行した配信のリンクを整理しました|カレーちゃん
        • 商用利用OKの音素材、600種以上無料公開 バトルの攻撃音も……「Springin’ Sound Stock」

          プログラミングアプリ「Springin'」(スプリンギン)などを提供するしくみデザインは6月23日、商用利用OKの無償音楽素材サイト「Springin’ Sound Stock」を公開した。戦闘ゲームの攻撃音や、8bitサウンドの効果音、システム音、乗り物の音など、600点以上をそろえた。 過去のプログラミングコンテスト使用音源など、同社のサウンドデザイナーが手掛けた音源を中心に提供。「つくる楽しさを知り、誰でもクリエイターになってほしいという願い」から公開したという。 誰でも無料で使うことができ、スプリンギンでの利用だけでなく、動画制作やイベントなどの商用利用も可能だ。 関連記事 タップやフリックなどのシステム操作音のフリー素材、電通が公開 商用利用も可能 電通は、タップやフリック、文字入力などの操作を想定したオリジナルのシステム操作音をフリー素材として公開した。「SND」と名付けられた

            商用利用OKの音素材、600種以上無料公開 バトルの攻撃音も……「Springin’ Sound Stock」
          • Microsoft、文字起こしアプリ「Group Transcrib‪e‬」を公開 - iPhone Mania

            Microsoft、文字起こしアプリ「Group Transcrib‪e‬」を公開 2021 3/16 Microsoftは3月上旬、対面での会議や会話のためのリアルタイムのテープ起こしと翻訳を提供する「Group Transcrib‪e‬(グループ転写)」のiOSアプリをリリースしました。会議の参加者がそれぞれのデバイスで使用することができます。 メモを取らずに会議に集中できる優れもの 最先端のAI音声・言語技術を搭載したGroup Transcribeで、会話の参加者は共有セッションを開始し、それぞれが携帯電話のマイクを使用して、リアルタイムで誰が何を言ったかを示す、非常に正確なトランスクリプトをキャプチャできます。 会話の高品質な記録に自信を持つことで、ユーザーはメモを取る必要がなくなり、会話そのものに注意を集中させることができます。トランスクリプトは、共有したり、再配置も簡単に行う

              Microsoft、文字起こしアプリ「Group Transcrib‪e‬」を公開 - iPhone Mania
            • 音声入力と生成AIの組み合わせが強すぎて、一人でブツブツ喋るオジサンとなった - 本しゃぶり

              なぜオジサンは一人でブツブツと喋るのか。 それは、音声入力こそが最強のプロンプトを生み出すからである。 両手をキーボードから解放する時が来た。 忙しい人向けの説明 さっそくChatGPTを開き、iOSのマイクから音声入力を起動したら、 これを使って入力 「本しゃぶりというブログにChatGPTの使い方について、面白そうな記事があったのでメモ。なんか音声入力を使うといいらしい。これまで話した内容について整理し、マークダウンで出力して」 と喋っておこう。誤字脱字などの修正をせずに投稿すればいい。 以上。 音声入力と生成AIの組み合わせが強い 生成AIをうまく使いたいならば、詳細なコンテキストを与えるのが良い。しかし、ここに大きな問題があった。 人間というものは楽をしたがる生き物である。特にAIに助けを求めるような人は、なおさらだ。文章を入力することに面倒くささを感じ、つい最小限の指示で済ませて

                音声入力と生成AIの組み合わせが強すぎて、一人でブツブツ喋るオジサンとなった - 本しゃぶり
              • 無料で公開されている音声合成サービスが凄いと話題に「ボイロ殺しに来てる」「ベタ打ちで自然に話せる」

                CoeFont (コエフォント) @coefont AI音声プラットフォーム「CoeFont(コエフォント)」の公式アカウント 英語: @coefont_global 採用募集中! coefont.com/recruit Instagram 始めました: https://t.co/CeN8nmcEWN coefont.cloud

                  無料で公開されている音声合成サービスが凄いと話題に「ボイロ殺しに来てる」「ベタ打ちで自然に話せる」
                • 【ドドンッ!】有名YouTuberが使ってる『効果音ラボ』の実態に迫る - イーアイデム「ジモコロ」

                  ※この記事は、音を再生できる環境で読むとより楽しめます。イヤフォン等がある方はぜひお手元にご用意ください。(もちろん音無しでも楽しめます!) 突然ですが、これらの音を聞いたことはあるでしょうか? 『和太鼓でドドン』 『男衆「オウ!」』 『ドンドンパフパフ』 YouTubeを見ていれば、必ず一度は耳にする音ばかりですね。実はこれらの効果音、すべて「効果音ラボ」というフリー音源素材サイトが提供している音なんです。 「効果音ラボ」は国内のフリー効果音サイトでは最大手と言っても過言ではありません。YouTubeに限らず、ゲームやコマーシャルでも様々な音が使われています。 効果音ラボ トップページ ただ皆さんご存知でしたか? このサイト、創設から9年の間ずっと、たった1人の方が運営しているんです。 さらに、銃声を録音するために海外に行ったり、録音のためだけにヘリコプターをチャーターしたりと、音源を作

                    【ドドンッ!】有名YouTuberが使ってる『効果音ラボ』の実態に迫る - イーアイデム「ジモコロ」
                  • 【レビュー】 まるで未来のイヤフォン“自分の耳が高機能に”「IQbuds2 MAX」

                      【レビュー】 まるで未来のイヤフォン“自分の耳が高機能に”「IQbuds2 MAX」
                    • 世界中の伝統音楽のデータベース、慶應大が公開 1026民族、5776件の音声記録を掲載

                      世界地図上にマッピングされたポイントをクリックすることで、その地域の民族にゆかりのある音楽を再生できる。例えば日本の東北地方なら、安全を願うために歌われてきた「津軽山唄」、東京都なら作業時に歌われてきた「木遣節」がある。他にもヨーロッパやアフリカ、米国など世界各国の伝統音楽が聞ける。 2017年に暫定版としてデータベースを一度リリースしていた。研究チームは、改めて楽曲の種別や特徴などを見直し、呼吸方法や楽器情報など、より詳細な情報や会話などの音楽ではない音源も加え、データの正確性を上げて再度リリースしたという。 データベース中の全ての楽曲は、個人や研究での利用など非営利での使用を推奨しており、著作権とその文化継承者が許す範囲内のみで利用できる。今後も継続的に新しいデータも追加していくという。研究チームは「Global Jukeboxが他の研究者に刺激を与え、音楽の伝統や文化の進化に関する多

                        世界中の伝統音楽のデータベース、慶應大が公開 1026民族、5776件の音声記録を掲載
                      • 無料 BGM・効果音のフリー音源素材 | Springin’ Sound Stock

                        無料 BGM・効果音のフリー音源素材 誰でも 報告不要で 商用利用無料! 今すぐ使える BGM・効果音 1,000点以上! 動画制作やイベントに もちろんスプリンギン アプリでも利用可

                          無料 BGM・効果音のフリー音源素材 | Springin’ Sound Stock
                        • ついに音声対話できるようになった ChatGPT が引くほど自然でなんか凄いし怖い「もうこれ人間じゃん!」

                          チキン(小橋川 遥)@ライター / マーケター @HeroofChickens フリーランス5年目。オウンドメディア運用、広告集客用LP制作と運用、改善が得意です。クライアントが困っていたこと、改善したことなどをXで発信しています。 https://t.co/tEMmPUtpxj

                            ついに音声対話できるようになった ChatGPT が引くほど自然でなんか凄いし怖い「もうこれ人間じゃん!」
                          • にじボイス(旧DMMボイス)はエロゲーを学習している

                            注意:AI批判目的ではありません。単なる考察結果の共有です。どちらかというと私は思想的にはAI推進過激派です。また、ここでの推測はすべて外れている可能性はあります、あくまで推測です。 追記(24/11/20)DMMボイスという名前から「にじボイス」という名称に変更された。主な変更点は以下。 キャラクターが15人増える なぜか久世凛さんとイルミルの声優が変更されるツッコミがあった利用規約の修正それ以外は本記事の内容はすべて当てはまるので、以下「DMMボイス」となっている箇所は適宜「にじボイス」へ読み替えて呼んでほしい。 DMMボイス(現にじボイス)最近AI界隈(?)で話題になっている、20人分のアニメ調キャラクターの声で感情的な音声を簡単に生成することができるAIサービス。 https://nijivoice.com/ それの学習元に、エロゲーのテキスト音声データが使われているのではないかと

                              にじボイス(旧DMMボイス)はエロゲーを学習している
                            • 「iPhoneの音声出力をPCに繋いだら、電話もYouTubeも自動で文字起こしできるようになった」――急遽テレワークを導入した中小企業の顛末記(97)【急遽テレワーク導入!の顛末記】

                                「iPhoneの音声出力をPCに繋いだら、電話もYouTubeも自動で文字起こしできるようになった」――急遽テレワークを導入した中小企業の顛末記(97)【急遽テレワーク導入!の顛末記】
                              • 3秒の音声があれば本人そっくりの声で日本語・英語・中国語合成できる「VALL-E X」はやはり脅威。MSが非公開にした技術のOSS版を試して実感した(CloseBox) | テクノエッジ TechnoEdge

                                わずか3秒の元音声から本人そっくりな音声合成が可能な技術「VALL-E X」が誰でも使える形で公開されました。オープンソース版で、ローカルマシンからWebUIで利用できます。さっそくインストールして使ってみました。 以前、ディープラーニングベースの音声・歌声合成ソフトであるDiff-SVC、リアルタイム処理が可能なAIボイチェンRVCを紹介したとき、自分は記事タイトルに「驚異の」という形容詞を付けました。それでも学習には数十分の本人による音声データが必要で、そこまでのデータを用意するのは容易ではありません。それに対してVALL-E Xでは元データが3秒あれば本人に似た声を生成できるのです。

                                  3秒の音声があれば本人そっくりの声で日本語・英語・中国語合成できる「VALL-E X」はやはり脅威。MSが非公開にした技術のOSS版を試して実感した(CloseBox) | テクノエッジ TechnoEdge
                                • ついにやってきた日本人対話型ポッドキャスト量産システム。NotebookLM使えばなんでもポッドキャストになる(CloseBox) | テクノエッジ TechnoEdge

                                  Google NotebookLMには、PDF、テキスト、YouTubeなどを読み込んで、その内容についてリアルな対話ポッドキャスト解説を生成する機能があります。 2024年9月11日にローンチした時点では英語でしか使えなかったのですが、4月30日、ついに日本語対応しました。 早速試しました。 ネタ元にしたのは、一緒にポッドキャストをやっている散財小説ドリキンの最新YouTubeエピソード。 このURLをNotebookLMにソースとして入力すると、概要が表示され、その内容についてチャット形式で質問できるようになります。すると、右上に「音声概要」という表示がされます。そこで生成ボタンを押すと、男女二人のポッドキャスト的会話形式で、音声による解説が生成されるのです。特定の方向性を指定するなどのカスタマイズも可能。 今回は、カスタマイズ無指定で生成しましたが、6分24秒の音声が、5分ほどで出来

                                    ついにやってきた日本人対話型ポッドキャスト量産システム。NotebookLM使えばなんでもポッドキャストになる(CloseBox) | テクノエッジ TechnoEdge
                                  • 現実世界にさようなら。「VRChat」を今さら始めたら,あっという間に美少女に堕ち,100万円近く飛んでいった

                                    現実世界にさようなら。「VRChat」を今さら始めたら,あっという間に美少女に堕ち,100万円近く飛んでいった 編集部:御月亜希 2024年9月末。本当に,本当に今さらなのですが,「VRChat」を始めました。それから5か月ほどが経った今,私の生活は完全にこのVR SNSに乗っ取られてしまい,ログインしない日はありません。☆5キャラを引くためのガチャも,札束でビンタする対人要素もないのに,もう100万円近くのお金が飛んでいきました。いったいどこで,なぜ足を踏み外してしまったのでしょうか……。 いえ,心当たりはいっぱいあるんですけど,とにかく危険な世界なんですよ,VRChatは。多くのプレイヤーは平和に楽しく過ごしているのだと思うのですが,恐ろしいことに,私のようにあっという間に壊れてしまう人もいます。何があったのかを,ここに残しておきましょう。お砂糖の話とかではないですよ。 本稿のスクリー

                                      現実世界にさようなら。「VRChat」を今さら始めたら,あっという間に美少女に堕ち,100万円近く飛んでいった
                                    • SNSへの写真・動画掲載について、ゴールデンボンバーからのお願い

                                      鬼龍院翔の「プッツンてれび」でお伝えした内容について、音声の聴きとりが難しい方もいらっしゃるため、画像にまとめて掲載をいたします。

                                        SNSへの写真・動画掲載について、ゴールデンボンバーからのお願い
                                      • フォントと画像の管理にはこれ!シンプルで使いやすい、WinMac両対応アプリ「Eagle」が神アップデート

                                        以前当ブログで紹介した時からずっと愛用しているEagleがver.2に神アップデートしたので、改めて紹介したいと思います。 簡単に言うと、フォント(ttf,otf,ttc,woffも)、画像(jpg,png,gif,svg,webpはもちろん、raw,psd,ai,xd,sketch,clipも)、動画、音声、PDFやテキストも管理でき、タグ付けやフォルダ分けやカラーフィルターなどで整理も簡単できるアプリです。 Windows, macOS(M1対応)に対応したアプリで、1ライセンスで2つ使用でき、サブスクではなく買い切り、しかもバージョンアップの追加料金なしです。 ver.2が先日リリースされ、ver.1の人は無料でアップデートできます! Eagle Eagleとは Eagle ver.2の神アップデート Eagleのダウンロード・インストール Eagleの使い方 Eagleとは Eag

                                          フォントと画像の管理にはこれ!シンプルで使いやすい、WinMac両対応アプリ「Eagle」が神アップデート
                                        • Dwango Media Village(ドワンゴメディアヴィレッジ,dmv)

                                          著者の声を録画・録音して声を変換し元の映像と組み合わせてみた映像です。 このときの変換元の音声は撮影用のスマートフォンで録音しており、部屋の残響が含まれるなど声が少し不鮮明になる収録環境ですが、それでもしっかり声変換できていることがわかると思います。 概要Dwango Media Villageの廣芝です。誰の声でも狙った複数の人の声に変えることができる声変換システムを開発し、実際に声を変えることができるデモページを公開しました。この記事では、声変換技術を研究開発する際に取り組んだ課題について紹介します。 声変換声の変換技術には、リアルタイム性と品質のトレードオフがあります。既存の声変換システムはリアルタイム性を重視する傾向がある一方、品質を重視したものはあまり見かけません。品質を優先した声変換システムがあると応用の幅が広がると思い、研究開発に挑戦しました。 声変換を含む音声合成の品質は、

                                            Dwango Media Village(ドワンゴメディアヴィレッジ,dmv)
                                          • まだ人間が議事録書いてるの? 日本語特化の文字起こしAI『kotoba-whisper-v2.0』がスゴいらしい

                                            まだ人間が議事録書いてるの? 日本語特化の文字起こしAI『kotoba-whisper-v2.0』がスゴいらしい 企業の業務の中でも会議やプレゼンなどの議事録作成は効率化したい作業の上位に挙がってくるのではないでしょうか。実際、2023年8月にソースネクスト株式会社が行った「議事録に関する意識調査」によると、議事録の作成には平均50.4分の時間が費やされており、また部下の75.8%が会議中の議事録の作成によって発言しにくいと感じることがあるといいます。 そこで利用を検討したいのが、AIによる自動音声認識を利用した議事録の作成です。本記事では、日本語に特化して高い精度と速度を誇ると話題を呼んだ『kotoba-whisper-v2.0』を主に取り上げ、AIによる議事録作成の最前線をご紹介します。 日本語特化の文字起こしAI『kotoba-whisper-v2.0』とは? 『kotoba-whi

                                              まだ人間が議事録書いてるの? 日本語特化の文字起こしAI『kotoba-whisper-v2.0』がスゴいらしい
                                            • Amazon Alexaは「巨大な失敗」と社員が吐露、損失は年間1兆4000億円のペースに

                                              7000億円以上の営業損失を出したデバイス事業の見直しを進めているAmazonが手がける音声アシスタント「Alexa」は、2022年だけで100億ドル(1兆4000億円)を食いつぶす大きな失敗だったと、Amazonの社員が語りました。 Amazon Alexa is a “colossal failure,” on pace to lose $10 billion this year | Ars Technica https://arstechnica.com/gadgets/2022/11/amazon-alexa-is-a-colossal-failure-on-pace-to-lose-10-billion-this-year/ Amazonは営業不振により最大で1万人を解雇する史上最大規模の人員整理を進めており、その中で最も大きな影響を受けているのが音声アシスタントであるAlexa

                                                Amazon Alexaは「巨大な失敗」と社員が吐露、損失は年間1兆4000億円のペースに
                                              • 「みんな怒って帰っちゃうんだよね。約束して、絶対に帰らないって」…声優・日髙のり子が“地獄の苦しみ”を味わった、ETC音声の収録裏話 | 文春オンライン

                                                地獄の苦しみだった収録 「ETC(※)カードが挿入されました」 車に乗ってエンジンを掛けると車内に響き渡る声、この音声を担当しているのが私だということをご存知ない方はまだまだ多い。なのでイベントなどでご披露すると「おお~」と思わず声を洩らす方もたくさんいる。そしてその声がどのキャラクターを演じたときよりも大きかったりして、私のほうがびっくりしてしまう。 反応の大きさは、その声のシェア率に比例している。どの世代にも満遍なく知られている私の声は、今のところ南ちゃんとETCが半々という感じだ。 いやいや出世しましたなぁ~ETC! 今となってはETC音声に起用していただいてありがとうございます、という気持ちだけれど、その収録は、実は地獄の苦しみだった。 「収録の前に一つだけ約束してほしいことがあるんだけど」 ETC音声収録の当日、機械音声の制作を専門にしている会社の社長さんが誰にも聞こえないように

                                                  「みんな怒って帰っちゃうんだよね。約束して、絶対に帰らないって」…声優・日髙のり子が“地獄の苦しみ”を味わった、ETC音声の収録裏話 | 文春オンライン
                                                • 音声入力+生成AI試してみた

                                                  この数日でバズっていた一連の記事を読んで自分も試してみることにした。 【発端】音声入力とAIの組み合わせが強力だという骨しゃぶり氏の記事 https://honeshabri.hatenablog.com/entry/talk2ai 【音声入力】SuperWhisperが良いよというお話 https://umiyosh.hatenablog.com/entry/2025/02/26/215102 【テキストエディター】Cursorはコード書くだけじゃなく、AIを使った文章作成にもいいよというお話 https://ascii.jp/elem/000/004/253/4253872/ 結論から言うと骨しゃぶり氏の言ってることがよくわかった。めっちゃ便利というかちょっとしたイノベーション感じてる。 音声入力自体は以前にも試したことあるけど、そこから先が人力編集なのと、間にAIをかますのとではまっ

                                                    音声入力+生成AI試してみた
                                                  • AI英会話スピーク | Speak | スピーキング特化アプリ

                                                    スピーキング特化の AI英会話アプリ最先端のAI英会話アプリを活用して英語に慣れ、的確なAIフィードバックを通じて自然な英語力を身につけましょう。 はじめる → 英 語 を 習 得 す る に は 声 に 出 し て 練 習 す る こ と が 重 要 で すスピークは、実際に英語を声に出し、繰り返し練習してもらうことを重視しています。

                                                      AI英会話スピーク | Speak | スピーキング特化アプリ
                                                    • 高性能で無料、誰の声にでもなりきれるAIボイチェン「RVC WebUI」がついに日本語表示に対応(CloseBox) | テクノエッジ TechnoEdge

                                                      オープンソースのAI声質変換(ボイスチェンジャー)ソフトウェア「RVC WebUI」が、日本語での表示に対応しました。 VITSという声質変換技術をベースにしたRVC(Retrieval-based Voice Changer)に、Webユーザーインタフェースを付加したのが「RVC WebUI」です。

                                                        高性能で無料、誰の声にでもなりきれるAIボイチェン「RVC WebUI」がついに日本語表示に対応(CloseBox) | テクノエッジ TechnoEdge
                                                      • 地下鉄サリン事件に関しては、ドラマを見るより「公安調査庁公式YouTubeチャンネル」にある無線指令音声記録を聴いたほうがいい

                                                        リンク YouTube PSIAchannel 公安調査庁の施策や取組,お知らせしたい情報等について,動画で紹介するチャンネルです。公安調査庁の最新情報については,公安調査庁ホームページを御覧ください。 運用方針等はこちら→ https://www.moj.go.jp/psia/2013090202.html 1 user 48

                                                          地下鉄サリン事件に関しては、ドラマを見るより「公安調査庁公式YouTubeチャンネル」にある無線指令音声記録を聴いたほうがいい
                                                        • マクドナルドが「ティロリティロリ」音源を配布 「ぜひご活用ください」

                                                          日本マクドナルドは1月17日、ポテトが揚がったときに店内で流すタイマー音「公式ティロリサウンド」の配布を始めた。使い方について「作業用BGMとして流すもよし、アラーム音にして目覚めるもよし、ご自身でリミックスして楽しむもよし。ぜひご活用ください」(同社)としている。 同音源を利用した楽曲「ティロリミックス」の公開に合わせた施策。これまでも音源を加工した楽曲などは公開していたが、オリジナル音源を公式に配布するのは初めてという。 関連記事 チキンを温めるゲーミングPC、KFCが正式発表 「ネタじゃなかったの?」ネットざわつく KFCのゲーム部門KFC Gamingが、プレイ中にフライドチキンを温めるゲーミングPC「KFConsole」を正式に発表した。 「星のカービィ」オーケストラ楽譜を無料配布 結婚式での演奏などに利用可能 オーケストラコンサートなどで使用された「星のカービィ」の楽譜が無料配

                                                            マクドナルドが「ティロリティロリ」音源を配布 「ぜひご活用ください」
                                                          • AI歌声合成は、もう人の歌声と区別できないレベルに。東北イタコも追加されたNEUTRINOの新バージョン、0.400が無料でリリース|DTMステーション

                                                            今年に入り、AI歌声合成の動きが激しく、その進化のすごさ、クオリティーの高さには驚くばかりです。中でも注目すべきは今年2月に彗星のように登場し、フリーウェアとして公開されたNEUTRINO(ニュートリノ)です。これはSHACHI(@SHACHI_NEUTRINO)さんが開発するフリーのソフトであり、これまで東北きりたん、謡子、そしてJSUT(いずれも学術的に公開されている歌声データベースを利用して開発している)の3つの歌声ライブラリが同梱されてました。そこに9月18日、新たに東北イタコが追加されたのです(9月18日現在、公開されている0.400には東北きりたん、東北イタコのみが同梱。それ以外については後日公開される模様です)。 先日、「AIきりたんに次ぐ第2のAIシンガー、東北イタコの歌唱データベース制作プロジェクトのクラウドファンディングスタート」という記事でも紹介し、無事にクラウドファ

                                                              AI歌声合成は、もう人の歌声と区別できないレベルに。東北イタコも追加されたNEUTRINOの新バージョン、0.400が無料でリリース|DTMステーション
                                                            • 韓国の高校で出された日本語の試験問題が全然わからないんだが「全部一緒じゃん」「日本の英語教育もこれ」

                                                              ケン(韓国ブロガー・海外在住日本人) @kenkorea2012 韓国の高校で出された日本語の問題です。 問題の下線部分と発音が同じものを選んで下さい。 日本人の皆さん、なめてかかると間違えますよ~😅 pic.twitter.com/baocPS4Hhl

                                                                韓国の高校で出された日本語の試験問題が全然わからないんだが「全部一緒じゃん」「日本の英語教育もこれ」
                                                              • 商用でも利用可能なAI音声合成ソフトウェア『VOICEVOX』がオープンソースとして無料でリリース|DTMステーション

                                                                本日8月1日、音声合成技術の世界に、また画期的な動きがありました。「Seiren Voice」や「Yukarinライブラリ」の開発者としても知られるヒロシバ(@hiho_karuta)さんが、ITAコーパスを利用した商用利用も可能なAI音声合成システム、VOICEVOXなるソフトウェアをオープンソースのとして無料でリリースしたのです。具体的には現時点Windowsで動くシステムで、「ずんだもん」および「四国めたん」の声でテキストを読み上げるシステムとなっています。 これがオープンソースとなったことで、一般ユーザーが自由に利用できるというだけでなく、さまざまなシステムに組み込んで喋らせることが可能になったのが画期的なところ。たとえばロボットなどに組み込んで対話型のシステムを作ることや、観光案内システムに導入して喋らせる……といったこともできるほか、クラウド型のシステムを構築し、ブラウザを経由

                                                                  商用でも利用可能なAI音声合成ソフトウェア『VOICEVOX』がオープンソースとして無料でリリース|DTMステーション
                                                                • 叫んでも周囲に声が漏れないBluetoothマイク「mutalk」量産版公開

                                                                    叫んでも周囲に声が漏れないBluetoothマイク「mutalk」量産版公開
                                                                  • OpenAI.fm

                                                                    An interactive demo for developers to try the new text-to-speech model in the OpenAI API

                                                                      OpenAI.fm
                                                                    • AIによるボイスチェンジャーソフト「Voidol」が期間限定で無償配布

                                                                        AIによるボイスチェンジャーソフト「Voidol」が期間限定で無償配布
                                                                      • 19歳・東工大2年生が社長。音声合成界に衝撃を与えたCoeFont STUDIOが目指すこれからの世界

                                                                          19歳・東工大2年生が社長。音声合成界に衝撃を与えたCoeFont STUDIOが目指すこれからの世界
                                                                        • Windows 10は好きな文章を合成音声で簡単に喋らせることができる (1/2)

                                                                          こんな簡単なコマンドで、Windowsは「しゃべって」くれる。画面キャプチャーでは声をお聞かせすることはできないが、お手元のWindows PowerShellで試してほしい スクリプトを作るとき、ちょっとユーザーの気を引きたくなることがある。たとえば、少し時間のかかる処理をするときに、終わったことを通知したい場合などだ。あるいは、実行後にすこし時間が経過してからエラーを通知するような場合にも、気を引きたくなることがある。 こんなとき昔のコンピューターならベル音やビープ音を鳴らすのが一般的だった。端末装置からコンピューターを使っていた頃、Ctrl+Gを出力するとベル音が鳴った。マイクロプロセッサが使われ始め、パソコンの原型ができあがった頃、BEEPと呼ばれる機能ができた。プログラムでビットをオンオフし、これをスピーカーに接続することで音を出していた。今もマザーボード上には、そのための小さな

                                                                            Windows 10は好きな文章を合成音声で簡単に喋らせることができる (1/2)
                                                                          • わずか10秒の元音声でもリアルな「なりきりボイチェン」できる無料ソフト『Seed-VC』は過去最高レベルの再現度か(CloseBox) | テクノエッジ TechnoEdge

                                                                            筆者はUTAUによる波形接続の時代から「その人の声になりきる」技術を試してきましたが、このほど、その中でも画期的と思える技術に出会いました。『Seed-VC』(Seed Voice Conversion)というオープンソースソフトです。 ■AIボイチェンの進化どこが画期的なポイントかというと、高い音質を維持しながら、ゼロショット、つまりファインチューニングをせずに、1秒から30秒までの短い音源を参照するだけで、短時間でオリジナルに近いボイチェンができるところにあります。 以前紹介したDiff-SVCやRVCは、オリジナル音声に近いボイチェンが可能ですが、学習にはそれなりの長さのオーディオデータと高性能GPUによる処理が必要です。

                                                                              わずか10秒の元音声でもリアルな「なりきりボイチェン」できる無料ソフト『Seed-VC』は過去最高レベルの再現度か(CloseBox) | テクノエッジ TechnoEdge
                                                                            • AITuber育成完全入門(冴えないAITuberの育て方)|みゆきP

                                                                              はじめにAITuberと書いて、アイチューバーと読みます。VTuberとは違って中の人が存在しないことが特徴です。 AITuber開発は高尚な深層学習のモデル開発ではまったくなく、むしろ、ただの推しの育成ゲームです。 なので、GPUもPythonもいりません。PCさえあれば今すぐはじめられます! この記事でできること以下のようなAITuberが作れます。可愛いですね(親バカ) 妹系AITuber🌸桜井りりか Twitter: https://twitter.com/Ririka_AIsister YouTube: https://www.youtube.com/@ririkasakurai 早い人で週末に2日で作れると思います! 土日に作ったAITuberをみんなに公開しちゃいましょう!!! AITuber作成手順立ち絵の生成 モデル・VAEの選定 Google ColabでStable

                                                                                AITuber育成完全入門(冴えないAITuberの育て方)|みゆきP
                                                                              • 全滅したウクライナ軍守備隊とされる音声明るみに、ロシア海軍に「消え失せろ」

                                                                                (CNN) 黒海に浮かぶ島を防衛するウクライナ軍兵士と、ロシア海軍の将校が交わしたものとみられる音声が明るみに出た。 ウクライナのゼレンスキー大統領によると、スネーク島の守備に当たっていた兵士全員が戦死したと報告されているという。 同大統領は、「国境警備隊の全員が英雄的に死亡したが、降伏しなかった。彼らには死後、ウクライナの英雄勲章が授与されることになる」と述べた。 ロシアの戦艦は24日のある時点で同島に接近。 両者のやり取りとされる音声によると、ロシア軍の将校が「こちらは軍艦、ロシア軍の軍艦。流血と不必要な犠牲を回避するため、武器を置くことを提案する。さもなくば、爆撃を受けることになる」と述べた。 ウクライナ兵士からのものとされる応答は、「ロシア軍艦、消え失せろ」という内容だった。

                                                                                  全滅したウクライナ軍守備隊とされる音声明るみに、ロシア海軍に「消え失せろ」
                                                                                • ずんだもんが無料で使える、超高性能AIボイスチェンジャー、ParakeetVCが公開。1か月間は全キャラクタ、全機能が無料|DTMステーション

                                                                                  自分の声をまったく別のキャラクタの声に変えることを実現するAIボイスチェンジャー。エフェクトを使って自分の声を加工する従来のボイスチェンジャーとは異なり、自分の声は完全に消えて、まったく別人になりきれるのが特徴で、これまでもVoidolやCoeFontボイスチェンジャーといったものを記事でも紹介してきたほか、中国系のフリーウェアでもかなりの精度を持ったものがいろいろ登場してきています。 そうした中、12月25日、まったく新たなAIボイスチェンジャー、Parakeet.VC(パラキート・ブイシー)が、福島県のベンチャー企業、Parakeet株式会社からリリースされました。ここには東北ずん子や東北きりたん、またずんだもんをはじめ、計109種類の声が収録されており、ユーザーはそれらを選んで、マイクで話せばリアルタイムにキャラクタの声に変換することが可能です。既存のAIボイスチェンジャーと比較して

                                                                                    ずんだもんが無料で使える、超高性能AIボイスチェンジャー、ParakeetVCが公開。1か月間は全キャラクタ、全機能が無料|DTMステーション

                                                                                  新着記事