soundに関するflakwingのブックマーク (40)

  • 無料 BGM・効果音のフリー音源素材 | Springin’ Sound Stock

    無料 BGM・効果音のフリー音源素材 誰でも 報告不要で 商用利用無料! 今すぐ使える BGM・効果音 1,000点以上! 動画制作やイベントに もちろんスプリンギン アプリでも利用可

    無料 BGM・効果音のフリー音源素材 | Springin’ Sound Stock
  • AIの力で自分の声を好きな声にリアルタイム変換できるボイスチェンジャー「MMVC」が登場

    自分の声を美少女ボイスやイケメンボイスに変換してくれるボイスチェンジャーは、ライブ配信やムービー投稿の際にありがたい存在です。しかし、ボイスチェンジャーによって変換できる音声は固定されており、自分好みの音声に変換できるボイスチェンジャーを見つけるのは困難です。天王洲アイル氏は、この問題をAIを用いて解決する方法について解説し、さらにAIの力で自分の声を好みの声にリアルタイム変換できるボイスチェンジャー「MMVC」を公開しています。 VRChatなどの登場によって誰でも好きなアバターを使って好きなキャラクターになりきることが可能となりました。また、自分の声を美少女ボイスやイケメンボイスに変換できるボイスチェンジャーも多くの種類が存在しています。しかし、既存のボイスチェンジャーには「理想的な結果を得るためにはボイスチェンジャーに合わせた発声練習が必要」「リアルタイム変換が不可能なため、会話やラ

    AIの力で自分の声を好きな声にリアルタイム変換できるボイスチェンジャー「MMVC」が登場
  • Windows 10は好きな文章を合成音声で簡単に喋らせることができる (1/2)

    こんな簡単なコマンドで、Windowsは「しゃべって」くれる。画面キャプチャーでは声をお聞かせすることはできないが、お手元のWindows PowerShellで試してほしい スクリプトを作るとき、ちょっとユーザーの気を引きたくなることがある。たとえば、少し時間のかかる処理をするときに、終わったことを通知したい場合などだ。あるいは、実行後にすこし時間が経過してからエラーを通知するような場合にも、気を引きたくなることがある。 こんなとき昔のコンピューターならベル音やビープ音を鳴らすのが一般的だった。端末装置からコンピューターを使っていた頃、Ctrl+Gを出力するとベル音が鳴った。マイクロプロセッサが使われ始め、パソコンの原型ができあがった頃、BEEPと呼ばれる機能ができた。プログラムでビットをオンオフし、これをスピーカーに接続することで音を出していた。今もマザーボード上には、そのための小さな

    Windows 10は好きな文章を合成音声で簡単に喋らせることができる (1/2)
  • 音階の数学|じーくどらむす

    私の大好きな数学者の名言で、「音楽は感性の数学であり、数学は理性の音楽である」という言葉があります。 数を原理とするピタゴラス教団がピタゴラス音律を作り出し、そこから純正律という整数比率によるハーモニーを重視した音律が作られたことからも、音楽数学の関係性は深いと言えるでしょう。 しかし、 実際に数学を多少わかって、音楽を多少嗜んでいる方であれば、音楽で使われる様々な単位への違和感を感じたことがあるのではないでしょうか。 とにかく既存の音楽理論や音楽文化が、「12音種」「7幹音」「5線譜」「1から数える」すべてが噛み合っていない感じがすごい。この噛み合ってない上で究極の覚えゲーを重ねがけして理論作り上げてんのヤバい。 — じーくどらむす/岩翔 (@geekdrums) July 12, 2020 音楽を取り巻く数への違和感まずこの「12音階」(ド~シまで、#、♭も含めた1オクターブ以内の

    音階の数学|じーくどらむす
  • 「AIきりたん」がすごい - すずしめにっき

    ゆうべ、そろそろ寝ようかなと思っていたらものすごいものが投下され、興奮して結局3時半まで起きてしまいました。 ということで、昨晩公開された「AIきりたん」こと歌声合成エンジンNEUTRINO1について(今の興奮をあとで思い返すためにも)書いておきます。 AIきりたんとは とりあえずこれを聴いてみてください。 これが合成音声か!?と思ってしまうような仕上がりですが、これがAIきりたん……歌声合成エンジンNEUTRINOによって生成されたきりたんの歌声です。 NEUTRINOはSHACHIさん(@SHACHI_KRTN)によって製作されたフリーウェアで、昨晩公開されました。その標準の同梱ライブラリの1つが東北きりたんのものなので、そちらのことが「AIきりたん」または「AIシンガーきりたん」と呼ばれているというわけです。 ニューラルネットワークを用いた歌声シンセサイザー【NEUTRINO】を公開

    「AIきりたん」がすごい - すずしめにっき
  • 逆FM音源

    与えられた楽器の音色に近いFM音源パラメータの探索を勾配法で解く方法を解説します これは2020年2月8日に行われた カーネル/VM探検隊@関西 10回目 での発表資料です サンプルコード: https://github.com/Fadis/ifm

    逆FM音源
  • 楽曲を最大5トラック(ヴォーカル/ドラム/ベース/ピアノ/その他)に分離できる無料のオーディオ分離ツール「Spleeter」公開 - amass

    楽曲を最大5トラック(ヴォーカル/ドラム/ベース/ピアノ/その他)に分離できる、高速かつ無料のオーディオ分離ツール「Spleeter」が公開。音楽ストリーミングサービス「Deezer」のエンジニアリングチームが開発。機械学習によって楽曲を分離するツールです。 「Spleeter」には、3つの事前トレーニングモデルが付属されており、以下の3タイプへの分離が可能になっています。 2つ(ヴォーカル/その他の伴奏) 4つ(ヴォーカル/ドラム/ベース/その他) 5つ(ヴォーカル/ドラム/ベース/ピアノ/その他) 実行例: https://waxy.org/2019/11/fast-and-free-music-separation-with-deezers-machine-learning-library/ 「Deezer」内の紹介文 https://deezer.io/releasing-sple

    楽曲を最大5トラック(ヴォーカル/ドラム/ベース/ピアノ/その他)に分離できる無料のオーディオ分離ツール「Spleeter」公開 - amass
  • リアルタイム声質変換ライブラリ「Realtime Yukarin」を公開しました

    はじめにリアルタイム声質変換アプリケーション、Realtime Yukarinを開発し、 OSS(オープンソースソフトウェア)として公開しました。 ここで言う声質変換とは、「誰でも好きな声になれる」技術のことを指します。 好きな声になれる声質変換は夢があって流行りそうなのですが、まだ全然普及していないと思います。 それは現時点で、声質変換を実際にリアルタイムで使えるフリーな仕組みが無いためだと考えました。 そこで、自由に使えるリアルタイム声質変換アプリケーションを作り、ソースコードと合わせて公開しました。 声質変換とは声を変える方法で有名なのは、声の高さや音色を変える手法、いわゆるボイスチェンジャーです。 既存のボイスチェンジャーは、元の声を起点として、変換パラメータを自分で調整する必要があります。 一方ここでの声質変換は、元の声と好きな声を用いて機械学習し、変換パラメータを自動で調整しま

  • 無料で使える音源ファイルが山のようにダウンロードできる「Freesound」

    ループ素材・効果音・野外音響などさまざまな音源のダウンロード・アップロードが可能な非常にお役立ちで覚えておいて損はないデータベースサイトが「Freesound」です。Freesoundはスペインのバルセロナにあるポンペウ・ファブラ大学のMusic Technology Groupが2005年にスタートさせたプロジェクトで、Google・Portada・TECNIOなどがサポートしているサービスでもあります。 Freesound.org - Freesound.org http://freesound.org/ ◆使用方法 Freesoundを使って音源をアップロードしたりダウンロードしたりするには、まず専用のアカウントを作成する必要があります。 そんなわけでまずはアカウントを作成。トップページ右上にある「Register」をクリック。 登録画面では上からユーザー名・ファーストネーム(任意)

    無料で使える音源ファイルが山のようにダウンロードできる「Freesound」
  • 音声の波形からピッチを検出するアルゴリズム - まめめも

    去年のクリスマスに公開したカラオケ機能つき Quine の仕組みについて。 ref: 声の高さで操作するゲームを作ってみた で解説されている内容と同一です。おわり。 で終わるのもつまらないので、簡単に解説します。でも思いだしながら書いているので嘘書いてたらごめんなさい。動画には図とかあるので、やはりそっち見た方がいいと思うけど。 「ピッチ検出なんて FFT するだけでしょ」と思ってる人は素人で、音叉みたいにきれいな正弦波を測りたいならともかく、声や楽器の音など倍音を含んだ音では誤判定が起きまくるようです。偉そうなこと言ってる私も素人です。そこで、Wikipedia の Pitch detection algorithm で挙げられている、MPM アルゴリズムを調べて実装してみました。以下の論文。 ref: P. McLeod and G. Wyvill. A smarter way to

    音声の波形からピッチを検出するアルゴリズム - まめめも
  • SPTKの使い方 (3) ピッチ抽出 - 人工知能に関する断創録

    SPTKの使い方 (2)(2012/7/4)の続き。 今回は、SPTKマニュアルの2章のピッチ抽出(pitch extraction)を試してみます。ピッチとは声の高さのことで、基周波数やF0とも呼ばれます*1。ピッチは、人間の発声におけるアクセント、イントネーション、感情表出などとも密接に関係しているため音声合成において非常に重要なパラメータになっています。 というわけでSPTKのピッチ抽出コマンドpitchを使って、音声からピッチを抽出してみました。 データの変換 使ったデータは、Galatea Talkに付属していたATR 503文の音声データです。物は有料のようですが、同じテキストで再度録音し直して無償公開しているデータみたい。a01.adからj53.adまで503個のrawファイルが含まれています。 さっそく何て言っているのか確かめるためSPTKの使い方 (1)(2012/7

    SPTKの使い方 (3) ピッチ抽出 - 人工知能に関する断創録
  • ピッチ抽出の試み(その1)(Pitch)

    ピッチ抽出の試み(その1)(Pitch) v0.6 周波数の測定方法として 周期測定・周波数カウンター・ヘテロダイン法・パワー スペクトル法などがありますが その中に線形予測法(Linear Prediction) によるスペクトル分析法があります。 その中からさらに PARCOR方式 (Partial Autocorrelation) <偏自己相関>の係数を計算機で求める方法として Durbin法というものがありす。

  • SoundGator.com - Free Sound Effects

    Free Downloads All sound effects are completely free to use in your projects.

  • 無料で使える東芝の録音・音声書き起こし専用クラウドエディタ「ToScribe」

    音声データに登場する発言者を分類して各発言の話者を特定する「話者分類機能」、書き起こした文章の文末・表記のゆれ・誤字・脱字などを検出する「整文支援/校正支援機能」、テキスト中のカーソル位置から音声再生を開始する「自動頭出し機能」、エアコン・プロジェクターのファンノイズなどを抑える「ノイズ除去/聞きやすさ向上機能」、声の高さを変更せずに話速を調整する「話速変更」といった、「音声書き起こし」「文字起こし」などの作業を支援するための機能が満載のすさまじい完全無料音声データ書き起こし支援サービス「ToScribe」が東芝からリリースされました。 なお、現在は試験的な公開であり、2012年2月9日(木)正午までにユーザー登録した場合はその後もサービス利用が可能、とのことなので登録して使ってみました。今までもいろいろな文字起こし支援のソフトやサービスを利用してきたのですが、今回の東芝の無料サービスはか

    無料で使える東芝の録音・音声書き起こし専用クラウドエディタ「ToScribe」
  • IBM Developer

    IBM Developer is your one-stop location for getting hands-on training and learning in-demand skills on relevant technologies such as generative AI, data science, AI, and open source.

    IBM Developer
  • KORG AUDIO UTILITYがかなり使える!

    ここのところ、ポータブルレコーダーがいろいろ発売されているのでそのうちまとめてご紹介でもしようかと見ていたら、KORGがレコーダーの支援ソフトとして無料配布している「KORG AUDIO UTILITY」がいろいろと使いやすいことがわかりました。 KORG AUDIO UTILITYは、音声ファイルの簡易編集ができるソフトで、WavやAIFFといったファイルをWav、AIFF、MP3、WMAに変換(サンプリング周波数やビット数、ステレオorデュアルモノを選択可)して保存したり、音量レベルやバランスの調整、フェードイン/アウトの処理やメタデータ(ファイルのアーティストやタイトル、画像等)の一括変更、音声ファイルの統合やチャンネルリンク(モノラルのファイルを左右のステレオに分配)、音楽CDの読み込みやCD-R/CD-RWに書き出し(ノーマライズも可能)したりすることができる簡易的な音声編集ソフ

    KORG AUDIO UTILITYがかなり使える!
  • YouTube人気急上昇

    【FF5】#5 完全初見ゆっくりプレイ♪。ジャコールの町~。FFも覚えたい٩(ˊᗜˋ*)و✧*。SFC版【FINAL FANTASY V/ファイナルファンタジー5】

    YouTube人気急上昇
  • フリー音源 64ジャンル 2万6千ファイル以上が公開「SampleRadar」 MusicRadar.com | DDN JAPAN / (DIGITAL DJ Network)

    DDN は 音楽 ・ 映像 に関する デジタル アート を中心に情報ミックスを配信中

    フリー音源 64ジャンル 2万6千ファイル以上が公開「SampleRadar」 MusicRadar.com | DDN JAPAN / (DIGITAL DJ Network)
  • IDEA * IDEA

    ドットインストール代表のライフハックブログ

    IDEA * IDEA
  • JavaScript によるオーディオ&ビジュアルプログラミング - Radium Software

    僕は JavaScript が好きだ。できるだけ多くのことを JavaScript で済ませてしまいたいと考えている。 以前は JavaScript では絵や音を扱うことができないという点がボトルネックになって,応用の幅を狭めていた。これが最近になると, Canvas 要素のおかげで絵を扱うことができるようになったり, Flash を代行役にすることによって音を出せるようになったりと,いろいろ状況が変わってきている。 そこで今回は,以前から機会があれば触ってみたいと思っていた Processing.js と SoundManager 2 を使って, JavaScript によるオーディオ&ビジュアルプログラミングに挑戦してみた。 Processing.js とは Processing.js は,ビジュアルデザイン向けプログラミング言語 Processing を模して作られた JavaScr

    JavaScript によるオーディオ&ビジュアルプログラミング - Radium Software