タグ

音声に関するyurikissのブックマーク (11)

  • 音源定位 - 脳科学辞典

    音源定位とは 音源定位とは聴覚入力をもとに外空間における音源の位置を特定することである。つまり求める物体や回避する物体の方向、あるいは注意を向けるべき方向を決定することであり、我々人間を含めた動物にとって重要な能力である。その精度は非常に高く、人間やフクロウでは角度にして1度程度の精度で音の方向を識別できることが知られている。 音源定位に関わる聴覚情報 音源定位は主に、音源の位置によって左右の耳に生じる音情報の僅かな差を使って行われる。代表的なものは音の到達時間および強度の違いであり、それぞれ両耳間時差(interaural time difference: ITD)、両耳間音圧差(interaural level difference: ILD)と呼ばれる(図1)。 ヒトも含めた多くの哺乳類においては一般に高周波音ではILDを、低周波音ではITDを使っていると考えられている[1]。これは

  • Transformerに自分の好みのDLsite音声作品を学習させて、癖に刺さる新作を毎日通知するシステムを作った話 - Qiita

    Transformerに自分の好みのDLsite音声作品を学習させて、癖に刺さる新作を毎日通知するシステムを作った話 作ったもの DLsiteの新作音声作品をクローリング -> 好みかどうか推論 -> 好みならSlack通知をするシステムを完全サーバーレス(AWS SAM)で構築しました。さらなる精度向上のため、Slackメッセージのボタンをもとに教師データを蓄積する処理も作りました。 デモ(ぼかしMAX) とてもわかりにくいですが、好みであろう作品がPOSTされているSlackの画面です。各メッセージについている「興味あり!」「別に…」ボタンを押すとLambdaが起動し、DynamoDBに新たな教師データとして保存されます。 なぜ作ったのか DLsiteが好き、以上。 ・・・ もう少し真面目に書くと、 会社でテキストデータに触れることが多いので、うまく扱えるようになりたい 音声作品はシチ

    Transformerに自分の好みのDLsite音声作品を学習させて、癖に刺さる新作を毎日通知するシステムを作った話 - Qiita
  • 文字を入力するだけで「萌え声」を簡単一発生成してくれる「Moe TTS」

    萌(も)え声を出したくても出せない人でも簡単に簡単に萌え声を生成できる「Moe TTS」が公開されていたので利用してみました。Moe TTSは機械学習を用いて実際のゲームソフトの音声等を合成しており、機械学習でアプリケーションを開発するコミュニティ「Hugging Face」内で公開されています。 Moe TTS - a Hugging Face Space by skytnt https://huggingface.co/spaces/skytnt/moe-tts Moe TTSにアクセスするとこんな感じの画面が表示されます。 そのまま上にスクロールすると文字の入力ボックスが現れます。デフォルトで「こんにちは。」と入力されていたので、今回はこれに続けて「今日も寒いですね。」と入力。そして、「Generate」をクリックします。 すると、ページ下部に再生ボタンが現れます。そのまま再生ボタン

    文字を入力するだけで「萌え声」を簡単一発生成してくれる「Moe TTS」
  • 「DLSite」を運営するviviONグループの売り上げが250億→350億へ。売り上げが大きく伸びた理由を3つ考えてみた - 頭の上にミカンをのせる

    https://vivion.jp/company/statement/特にコロナ下での20年~21年の2年間でユーザー数が400万→800万と急増しており、圧倒的な成長とみてよいでしょう。 www.tyoshiki.com 8月時点ですでにFANZA同人よりも1日の売り上げ数で上回るようになっていましたが、その勢いがさらに続いているようです。 DLSiteの運営ってエイシスじゃないの?って思われる方がいると思いますがこういうことです。 ただ、DLSite以外の売り上げはまだそこまで大きくないようです。 去年からスタートした人材マッチングビジネス「GENSEKI」なんかは伸びそうな気がしますけどどうなることやら。 そもそもDLSiteってどういうジャンルがあるの? このうち今年大きく伸びたのは「同人ゲーム」「女性向け」。それからこの表にない「DLSite Comipo」ではないかと思いま

    「DLSite」を運営するviviONグループの売り上げが250億→350億へ。売り上げが大きく伸びた理由を3つ考えてみた - 頭の上にミカンをのせる
  • COEIROINK

    無料で使えるAIトークソフト

    COEIROINK
  • AIの力で自分の声を好きな声にリアルタイム変換できるボイスチェンジャー「MMVC」が登場

    自分の声を美少女ボイスやイケメンボイスに変換してくれるボイスチェンジャーは、ライブ配信やムービー投稿の際にありがたい存在です。しかし、ボイスチェンジャーによって変換できる音声は固定されており、自分好みの音声に変換できるボイスチェンジャーを見つけるのは困難です。天王洲アイル氏は、この問題をAIを用いて解決する方法について解説し、さらにAIの力で自分の声を好みの声にリアルタイム変換できるボイスチェンジャー「MMVC」を公開しています。 VRChatなどの登場によって誰でも好きなアバターを使って好きなキャラクターになりきることが可能となりました。また、自分の声を美少女ボイスやイケメンボイスに変換できるボイスチェンジャーも多くの種類が存在しています。しかし、既存のボイスチェンジャーには「理想的な結果を得るためにはボイスチェンジャーに合わせた発声練習が必要」「リアルタイム変換が不可能なため、会話やラ

    AIの力で自分の声を好きな声にリアルタイム変換できるボイスチェンジャー「MMVC」が登場
  • VOICEVOX | 無料のテキスト読み上げ・歌声合成ソフトウェア

    オープンソースVOICEVOX は OSS(オープンソース・ソフトウェア)版 VOICEVOX をもとに構築されています。 製品版と OSS 版の違いやモジュール構成は VOICEVOX の全体構成 をご参照ください。 ソフトウェア部分は Electron + Vue音声合成エンジン部分は Python + FastAPI です。 追加したい・改善したい機能があれば、ぜひ開発にご参加ください。

  • 機械の声で気持ちよくなれるか ささやきAIで「メイドさんASMR」動画作ってみた

    ASMR動画」をご存じだろうか。YouTubeでは主に「脳がゾクゾクするような気持ちいい音を収録した動画」という意味で使われる言葉だ。「包丁でいろんなものを切る音」「耳かきの音」「ささやき声」などを収めた動画が人気ジャンルになっている。そんなASMRにぴったりの“ささやくAI”が登場したので、早速動画にしてみた。 シナリオは普段からASMR動画を楽しんでいるという同僚に頼んで書いてもらった。タイトルは「あなたのことを世界一愛している一途メイドと密着添い寝ASMR」。登場人物はメイド、聞き手は女主人とのこと。後半が少し過激だったためカットしている。 「あなたのことを世界一愛している一途メイドと密着添い寝ASMR」 シナリオ:吉川大貴 コメント「音声作品らしさを出しつつ、プラトニックラブにも見えるようにしました」 いかがだろうか。普段からASMR動画を聞いている人であれば「これは確かにASM

    機械の声で気持ちよくなれるか ささやきAIで「メイドさんASMR」動画作ってみた
  • AIで“ASMR”が作れる時代に ささやき声も出せる音声合成「九州そら」無料公開

    音声合成ソフトの開発や販売を手掛けるSSS(仙台市)は3月16日、音声合成ソフト「VOICEVOX」用音源「九州そら」をリリースした。九州そらは、せりふを入力するだけで人間らしい“ささやき声”を出力できるAIだ。 VOICEVOXは、ドワンゴでAIの研究に携わっているヒホ(ヒロシバ)さん(@hiho_karuta)さんが開発した無料の音声合成ソフト。AI技術を活用して、人間らしい話し声を合成できる。イントネーションや話す速さなどの調整も可能。立体音声を制作できるソフトを活用すれば「ASMR動画」の制作にも使える。 九州そらはVOICEVOX用音源として初めてささやき声の合成に対応した。ソフトのダウンロードと利用は無料。「VOICEVOX:九州そら」とクレジットを記入すれば商用利用も無償でできる。 関連記事 「VOICEPEAK」と「CeVIO Pro」、 新しい音声・歌声合成製品はどこがす

    AIで“ASMR”が作れる時代に ささやき声も出せる音声合成「九州そら」無料公開
  • 無料でキャラクターボイスを自動で合成してくれるAIトークソフト「COEIROINK」は誰でも超簡単に創作物の「声」を作り出せる

    シロワニさん氏が趣味で開発したというWindows向けのAIトークソフト「COEIROINK(コエイロインク)」が無料で公開されています。COEIROINKは連絡不要で商用利用もOKなフリー素材キャラクター・つくよみちゃんに好きなテキストを誰でも簡単に読み上げてもらうことが可能なので、自作アニメやボイスドラマのキャラクターボイス、実況動画や解説動画のナレーションなどの作成にお役立ちです。 COEIROINK https://coeiroink.com/ ✨COEIROINKリリース✨ 無料の音声合成エンジン「#COEIROINK」が登場! 文章を読み上げます! ■公式サイト⇒https://t.co/66YStrCYu0 ■COEIROINK開発:シロワニさん様 @shirowanisan ■VOICEVOX開発:ヒホ様 @hiho_karuta 第1弾は「#つくよみちゃん」! 商用利用O

    無料でキャラクターボイスを自動で合成してくれるAIトークソフト「COEIROINK」は誰でも超簡単に創作物の「声」を作り出せる
  • 商用でも利用可能なAI音声合成ソフトウェア『VOICEVOX』がオープンソースとして無料でリリース|DTMステーション

    日8月1日、音声合成技術の世界に、また画期的な動きがありました。「Seiren Voice」や「Yukarinライブラリ」の開発者としても知られるヒロシバ(@hiho_karuta)さんが、ITAコーパスを利用した商用利用も可能なAI音声合成システム、VOICEVOXなるソフトウェアをオープンソースのとして無料でリリースしたのです。具体的には現時点Windowsで動くシステムで、「ずんだもん」および「四国めたん」の声でテキストを読み上げるシステムとなっています。 これがオープンソースとなったことで、一般ユーザーが自由に利用できるというだけでなく、さまざまなシステムに組み込んで喋らせることが可能になったのが画期的なところ。たとえばロボットなどに組み込んで対話型のシステムを作ることや、観光案内システムに導入して喋らせる……といったこともできるほか、クラウド型のシステムを構築し、ブラウザを経由

    商用でも利用可能なAI音声合成ソフトウェア『VOICEVOX』がオープンソースとして無料でリリース|DTMステーション
  • 1