並び順

ブックマーク数

期間指定

  • から
  • まで

401 - 440 件 / 6990件

新着順 人気順

Audioの検索結果401 - 440 件 / 6990件

  • なぜWAVとFLACで「音質が違う」というバカが現れるのか

    オーディオファイル(audiophile; 日本だといわゆるオーオタ、オーディオマニア)界隈を観察していると、WAVとFLACで音質が違う!と叫ぶ人たちがいる。この記事では本当なのかを考察したい。 それぞれの違いWAV(WAVE)はリニアPCMを格納できるファイルフォーマットで、FLACは可逆圧縮(つまり、音質を損失することなく圧縮ができる)で音声を格納できるフォーマットである。 FLACの規格上、32bit整数 / 655,350 Hzまでのフォーマットが格納できるが、エンコーダ自体は24bit整数までの対応だ。 WAVは1991年にできた古い規格で、実際のところRIFFというコンテナ規格の一種だ。WAVには色々な波形データを保存でき64bit floatなども格納できる。 つまりどちらも24bitの範囲であれば、全く同じ波形を保存できるということだ。これは波形のレベルで完全に一致する。

      なぜWAVとFLACで「音質が違う」というバカが現れるのか
    • 【レビュー】 あの“ガチ過ぎる”PCスピーカー、ついに異次元へ。クリプトン「KS-55Hyper」

        【レビュー】 あの“ガチ過ぎる”PCスピーカー、ついに異次元へ。クリプトン「KS-55Hyper」
      • オーディオの革命!? 小型スピーカーで広い音場の独自技術「Dnote-LR+」を体験【藤本健のDigital Audio Laboratory】

          オーディオの革命!? 小型スピーカーで広い音場の独自技術「Dnote-LR+」を体験【藤本健のDigital Audio Laboratory】
        • Site Isolation 及び Web のセキュリティモデルの更新 | blog.jxck.io

          Intro Origin は Web におけるセキュリティモデルの一つとして、コンテンツ間の Communication に関する境界を定義し、リソースを保護してきた。 しかし、 Spectre の発覚以降、 Communication に関する制限だけではなく Isolation によるメモリレベルでのアクセス制御が必要となった。 そこで現在作業されているのが、 CORB, CORP, COEP, COOP といった仕様群であり、これは Web におけるセキュリティモデルの更新作業と見ることができる。 概要と現状について解説する。 DEMO & Resources 量が多いため、動作する DEMO と関連リソースは、ページ下部にまとめてある。 CORS による Cross Origin Communication の制限 CORS は、平たく言えば、リソース提供元(サーバ)が、クライアン

            Site Isolation 及び Web のセキュリティモデルの更新 | blog.jxck.io
          • 『機動武闘伝Gガンダム』30周年 ドモン・カッシュ役 関 智一インタビュー① | Febri

            ――ガンダムシリーズには前年の『機動戦士Vガンダム』から継続しての出演でした。 関 それでいうと『Gガンダム』のあとの『新機動戦記ガンダムW』にも出ているので、3年連続なんですよね。その後、『機動戦士ガンダムSEED』にも出ているので、僕はあの頃の『ガンダム』によく出ている男なんです(笑)。 ――たしかに。 関 でも、子供の頃は『ガンダム』にはそんなにハマっていなかったんです。どちらかというとスーパーロボット系の作品が好きだったので、『ガンダム』はちょっと難しい印象があって。だから『Gガンダム』のオーディションを受けたとき、内容がスーパーロボットっぽかったので「やった!」と思いました。「必殺技を言ってるぞ!」って。「きっと俺にぴったりだ!」とテンションが上がったまま受けたのをおぼえていますね。ただ、そんなことを感じながらも「受かるわけない」と思っていました。 ――なぜでしょう? 関 その前

              『機動武闘伝Gガンダム』30周年 ドモン・カッシュ役 関 智一インタビュー① | Febri
            • 普段使わないけど便利なWeb API 8選

              MDNのWeb APIリストから、便利で、しかし普段のサービス開発ではあまり使われていない可能性のあるAPIを8個選びご紹介します。これらのAPIはあまり知られていないかもしれませんが、特定の状況や要件に対して非常に有効であることがあります。 Beacon API Beacon APIは、非同期でブロッキングしないリクエストをWebサーバーに送信するために使用されます。このリクエストはレスポンスを期待しないため、XMLHttpRequestやFetch APIを使ったリクエストとは異なりページがアンロード(ウェブページがユーザーによって閉じられるか、別のページに移動する際)される前にブラウザがビーコンリクエストを開始し、それを完了させることを保証します。 主な使用例としては、クライアント側のイベントやセッションデータをサーバーに送信するために使用されます。このAPIは、navigator.

                普段使わないけど便利なWeb API 8選
              • 耳の形でぴったり合うイヤホンを見つけます!オーディオマイスター百武征美さんの接客術 #BICWAVE #イヤホン | BIC WAVE

                ビックカメラの名物販売員に話を聞く連載企画「ビックな仲間たち」。第一弾はビックカメラの中でも屈指のオーディオマニアである、有楽町店の百武征美さんです。入社の経緯から趣味、そして現在オススメのワイヤレスイヤホンについてお話を伺いました。 百武さんって何者? ──本日はよろしくお願いします。百武さんは2001年に新卒で入社されたということですが、なぜビックカメラに就職しようと思ったのでしょうか。 子どもの頃、ゲームソフトを買いに父親にビックカメラ池袋東口本店(現ビックカメラ アウトレット×ソフマップ 池袋東口店)に連れてきてもらったことがあったんです。私の地元から一番近い大きな駅が池袋だったもので。 そのとき、ビックカメラの店頭で店員の方が、メガホンを使わずに大きな声で販売されていたんです。それを見たときに、「なんて活気があるお店なんだ」という衝撃を受けました。それがずっと記憶に残っていて、就

                  耳の形でぴったり合うイヤホンを見つけます!オーディオマイスター百武征美さんの接客術 #BICWAVE #イヤホン | BIC WAVE
                • Web会議のおすすめヘッドセット12選:実際に使って徹底比較しました|tebiki ブログ

                  弊社が提供する「現場向け動画教育プラットフォーム tebiki では、最初の商談から契約後のオンボーディングまでWeb会議のみで行っています(たまに訪問もします)。 ▼こちら側の環境 ・オフィス勤務のときは近くでWeb商談している人がいる。 ・近くの人と一緒に出席することもある(ハウリングすることがある)。 ▼相手側の環境 ・複数人(ときには10名以上)に会議室に集まって頂く事が多い。 このような条件下では、 ・こちらの声がクリアに伝わる(=自分の周囲の音声を拾わない) ・相手の声がクリアに聞こえる(=自分の周囲の音声が気にならない) ことが営業上の死活問題となります。 会社の標準となるヘッドセットを探して、気づいたら12機種のヘッドセットを試していました。ちょっと数分試してみたというレベルではなく、どれも購入して1週間以上業務で使って比較しています。 仕様書を見ると各社機能をアピールして

                    Web会議のおすすめヘッドセット12選:実際に使って徹底比較しました|tebiki ブログ
                  • 音楽配信からCDまで“なんでも再生”アイ・オーのストリーミングプレーヤー「Soundgenic Plus」が便利すぎる[Sponsored]

                      音楽配信からCDまで“なんでも再生”アイ・オーのストリーミングプレーヤー「Soundgenic Plus」が便利すぎる[Sponsored]
                    • スティーヴ・アルビニ死去 - amass

                      ミュージシャンで、レコーディング・エンジニア/プロデューサーとしても知られる、インディー・ロックのアイコン、スティーヴ・アルビニ(Steve Albini)が死去。米Pitchforkや米ローリングストーン誌などが、彼のシカゴのレコーディング・スタジオ、Electric Audioのスタッフに、アルビニが5月7日の夜に亡くなったことを確認しています。死因は心臓発作。61歳でした。 アルビニは、ミュージシャンとしてビッグ・ブラック(Big Black)やシェラック(Shellac)といったアンダーグラウンド・バンドを率いただけでなく、オーディオ・エンジニアとしてニルヴァーナ『In Utero』、ピクシーズ『Surfer Rosa』、PJハーヴェイ『Rid of Me』などのアルバムのレコーディングにも参加し、高い評価を得た。シェラックの10年ぶりのアルバムは5月17日リリース予定で、ツアーに

                        スティーヴ・アルビニ死去 - amass
                      • 普通のXLRマイクをUSBマイクに超進化させる機材Shure MVX2Uが発売開始!|DTMステーション

                        Shureから、超小型のオーディオインターフェイスMVX2U(市場参考価格19,800円税込)が本日8月25日に発表と同時に発売が開始されました。これは、普通のXLR端子を持つマイクに直接装着することも可能なので、ある意味、普通のマイクをUSBマイクに進化させることのできる機材ともいえます。配信や出先で録音したい方にピッタリなMVX2Uには、DSPが内蔵されているのも重要なポイント。無料の専用デスクトップアプリShurePlus MOTIVを使ってDSPを設定することにより、レイテンシなしにEQやコンプといったエフェクトも使用可能となるのです。また最大60dBのゲインに対応しているので、配信で定番だけど出力が小さめのShure SM7Bのようなダイナミックマイクにも完全対応。本家本元が出しているだけあって相性は抜群です。 また、MVX2Uのポイントは、難しいセッティングを必要とせず、簡単に

                          普通のXLRマイクをUSBマイクに超進化させる機材Shure MVX2Uが発売開始!|DTMステーション
                        • MusicLM

                          MusicLM: Generating Music From Text |paper|dataset| Andrea Agostinelli, Timo I. Denk, Zalán Borsos, Jesse Engel, Mauro Verzetti, Antoine Caillon, Qingqing Huang, Aren Jansen, Adam Roberts, Marco Tagliasacchi, Matt Sharifi, Neil Zeghidour, Christian Frank Google Research Abstract We introduce MusicLM, a model generating high-fidelity music from text descriptions such as "a calming violin melody bac

                          • スマホアプリ開発者のための2019年動向まとめ - Qiita

                            はじめに 2019年は新元号「令和」のスタートやラグビーワールドカップなどなんとなくめでたい年でした。年始まで忙しかったので2020年の1月中旬ですが2019年のスマホアプリ業界をこっそりまとめます。 個人的には2019年はAndroidアプリを中心にネイティブアプリ開発保守をしていました。 スマホアプリ開発に携わっていない人もこの記事を見れば2019年のいろいろが分かるかも。 振り返り用に「ふむふむ」「へー」程度に見ていただければ幸いです。 【前年】 スマホアプリ開発者のための2018年動向まとめ Unityでスマホアプリ(特にプラグイン)を開発している人のための2017年対応まとめ Unityでスマホアプリ(特にプラグイン)を開発している人のための2016年対応まとめ 通信回線について 約10年に1度の通信回線アップデート、5Gがついにはじまりました。 2019年4月に米Verizon

                              スマホアプリ開発者のための2019年動向まとめ - Qiita
                            • 約2.2万円で人工耳付きのバイノーラルマイク「美耳」

                                約2.2万円で人工耳付きのバイノーラルマイク「美耳」
                              • フロントエンド x RTC界隈の最近とこれから - console.lealog();

                                フロントエンドエンジニアからみる、この界隈で今どんなIssueが話題になってるのかと、この先どういう動きがありそうかについて。 そこまで自分に先見の明があるとも思ってないけど、アウトプットしておかないと忘れてしまいそうなので・・。 ちなみにここでいうフロントエンドは、いわゆるブラウザとかJavaScriptのAPIのことです。 プロトコル的な側面はそこまで詳しくないのであまり触れません。 WebRTC 1.0 GitHub - w3c/webrtc-pc: WebRTC 1.0 API まず、RTCといえばズバリのWebRTCから。 昨年末にWDからCRへ格上げということで、もうAPIが激変したりはしない・・はず。 実際のところ、ここ半年くらい大きな対応した覚えがないです。(WebRTCそのものを実装してる人は、地味にいろいろ対応してると思うけど) ガワのAPIという観点でいうと、最近はも

                                  フロントエンド x RTC界隈の最近とこれから - console.lealog();
                                • AirPodsをMacに強制的に接続する - 宇宙行きたい

                                  AirPods Proの自動切り替え機能、MacからiPhoneへの切り替えは便利なんだけど、逆はうまく行かないことが多い。というかMacに繋げてたはずなのにちょっとiPhone弄った時に切り替わってていざミーティングしようと思ったらMacに繋がってなかったりとかして焦る。 で、この前 Rebuild.fm 聞いてたら id:miyagawa が「Alfredで接続後に音を鳴らすようにしてる」って言っててそれだ!!って思ったので真似てみた。いやマジでこの最後に音を鳴らすというのがメッチャ頭良いというかナイスハックで自分の耳で繋がってることが確認できるので素晴らしい!! やること bluetoothでAirPodsに接続 トグルとかにすると逆にわかりにくいので接続のみ MacのサウンドをAirPodsにする たまに繋がってるのに音が聞こえないことがあるのは別のスピーカとかになってる 音を鳴ら

                                    AirPodsをMacに強制的に接続する - 宇宙行きたい
                                  • GitHub - WerWolv/ImHex: 🔍 A Hex Editor for Reverse Engineers, Programmers and people who value their retinas when working at 3 AM.

                                    Featureful hex view Byte patching Patch management Infinite Undo/Redo "Copy bytes as..." Bytes Hex string C, C++, C#, Rust, Python, Java & JavaScript array ASCII-Art hex view HTML self-contained div Simple string and hex search Goto from start, end and current cursor position Colorful highlighting Configurable foreground highlighting rules Background highlighting using patterns, find results and b

                                      GitHub - WerWolv/ImHex: 🔍 A Hex Editor for Reverse Engineers, Programmers and people who value their retinas when working at 3 AM.
                                    • オーディオ超解像技術 AudioSR を試す|はまち

                                      低解像度の音声データを超解像化をする拡散ベースの生成モデル AudioSR が公表されていました。リンク先に変換サンプルなどもあり、音声や自然音、音楽など幅広いジャンルの例が示されています。高い再現度であるようなので、さっそく試してみました。 インストール!pip install git+https://github.com/haoheliu/versatile_audio_super_resolution実行!GPUメモリを16GBくらい消費します。Google Colab無料枠だとメモリが足らなくて動かない感じでした。 !audiosr -i /content/kurumi.wav変換例変換前(サンプリングレート8kHz)

                                        オーディオ超解像技術 AudioSR を試す|はまち
                                      • ADSLルーターをギターのエフェクターに改造した猛者が登場

                                        一般のアナログ電話回線を使って高速なデータ通信を行うADSLに使うHuawei製のルーター・HG532をギターのエフェクターにして演奏をするムービーを、エンジニアのbonsembiante氏が公開しました。また、HG532をエフェクターにするためのツールがGitHubで公開されています。 ¿Cómo conectar una guitarra a un router ADSL? - YouTube GitHub - bonsembiante/router-audio-dsp: Simple delay effect (with delay time, feedback and dry-wet params), developed to run on an ADSL Huawei router with a modified firmware https://github.com/bonse

                                          ADSLルーターをギターのエフェクターに改造した猛者が登場
                                        • Chrome の User-Agent 文字列削減に関する最新情報

                                          .app 1 .dev 1 #11WeeksOfAndroid 13 #11WeeksOfAndroid Android TV 1 #Android11 3 #DevFest16 1 #DevFest17 1 #DevFest18 1 #DevFest19 1 #DevFest20 1 #DevFest21 1 #DevFest22 1 #DevFest23 1 #hack4jp 3 11 weeks of Android 2 A MESSAGE FROM OUR CEO 1 A/B Testing 1 A4A 4 Accelerator 6 Accessibility 1 accuracy 1 Actions on Google 16 Activation Atlas 1 address validation API 1 Addy Osmani 1 ADK 2 AdMob 32 Ads

                                            Chrome の User-Agent 文字列削減に関する最新情報
                                          • 自分好みのアバターと声でビデオ通話できる「Vme!」が正式リリース。DiscordとGoogle Meetに対応、「ずんだもん」にもなれる

                                            HIGHBALL PTE. LTD. は9月11日(月)、自分の好きなアバターと声でビデオ通話できる「Vme!」を正式リリースした。 本ツールは、基本無料で自分の好きなアバターと声でビデオ通話に参加できるGoogle Chromeの拡張機能で、対応ツールはDiscordとGoogle Meetとなっている。HIGHBALL PTE. LTD.によるWeb3×VTuberプロジェクト「Vhigh!」のひとつで、同プロジェクトではファンとクリエイターが一体となってVTuberを制作する「分散型」への変革を掲げている。 また、カメラの映像だけではなく声も変えられることが大きな特徴。公開されているサンプル映像では男性の声が「ずんだもん」のキュートな声に変化している様子が確認できる。なお、リアルタイムのボイスチェンジャーで遅延が気になる場合は、声のピッチのみを変更する機能を使用することで遅延を軽減し

                                              自分好みのアバターと声でビデオ通話できる「Vme!」が正式リリース。DiscordとGoogle Meetに対応、「ずんだもん」にもなれる
                                            • Roland50.studio

                                              In celebration of 50 years, Roland has collaborated with sound designer Yuri Suzuki to create Roland50 Studio, a digital reworking of some of their most famous and influential devices. Enter

                                                Roland50.studio
                                              • 効果音ポン出し画面|効果音ラボ

                                                生配信やZoomなどで活用できる、効果音を好きなボタンに割り当てて鳴らせるWebアプリです。音は2000種類以上の中から選べます。

                                                  効果音ポン出し画面|効果音ラボ
                                                • ド素人でもシンセの仕組み、音作りが分かるウェブ教材、Learning SynthsをAbletonが無料で公開。曲作りを学べるLeaning Musicも無料公開中|DTMステーション

                                                  DAWのプラグインとしてソフトシンセは使っているけれど、基本的にプリセット音色から気に入ったものを選ぶだけで、音色エディットはほとんどしていない……という人はかなり多いと思います。またホントは自分で音作りをしてみたいけれど、難しそうで手を出せていない、パラメータがいっぱいありすぎて、さっぱり分からない……なんて人も少なくないでしょう。 そうした中、Abletonがシンセの仕組み、シンセの音作りの基本を学べるウェブ上の教材、Learnig Synthsを無償で公開しました。すでに英語版はあったのですが、2月4日から日本語版がリリースされ、誰でもウェブ上で使えるようになったのです。必要なものはブラウザのみ。DAWがなくても、シンセがなくてもOK。誰でも簡単にわかりやすく学べるツールになっています。 Abletonがシンセサイザのチュートリアル、Learning Synthsを日本語でサービスス

                                                    ド素人でもシンセの仕組み、音作りが分かるウェブ教材、Learning SynthsをAbletonが無料で公開。曲作りを学べるLeaning Musicも無料公開中|DTMステーション
                                                  • 音を楽譜にする“耳コピ”はここまで来た。AI自動採譜の最前線【藤本健のDigital Audio Laboratory】

                                                      音を楽譜にする“耳コピ”はここまで来た。AI自動採譜の最前線【藤本健のDigital Audio Laboratory】
                                                    • Go: A Documentary

                                                      Go: A Documentary by Changkun Ou <changkun.de> (and many inputs from contributors) This document collects many interesting (publicly observable) issues, discussions, proposals, CLs, and talks from the Go development process, which intends to offer a comprehensive reference of the Go history. Disclaimer Most of the texts are written as subjective understanding based on public sources Factual and ty

                                                      • New WebKit Features in Safari 15.4

                                                        ContentsHTMLCSSWeb APIsJavaScriptWeb AppsMediaPrivacySecurityWKWebViewSafari Web ExtensionsWeb InspectorFeedbackAnd More With over 70 additions to WebKit, Safari 15.4 is packed with new web technologies, updates, and fixes. We’ve assembled a huge release as part of our commitment to web developers, and the people who use the web. This is the first big WebKit release of 2022, and we’re just getting

                                                          New WebKit Features in Safari 15.4
                                                        • W3CとIETF、「WebRTC」が正式な標準仕様に到達したと発表

                                                          W3CとIETFは、WebRTCが正式な標準仕様に到達したことを発表しました。 The @W3C and the @ietf are pleased to announce that Web Real-Time Communications (WebRTC) is now an official standard, bringing audio and video communications anywhere on the Web.https://t.co/GCHkDK7BHH pic.twitter.com/gBwdap47sO — W3C (@w3c) January 26, 2021 The @ietf and @w3c are pleased to announce that Web Real-Time Communications (WebRTC) is now an offi

                                                            W3CとIETF、「WebRTC」が正式な標準仕様に到達したと発表
                                                          • バンダイナムコ知新「第8回 第2章ナムコサウンドの発展の足跡を追う【後編①】」 | ファンファーレ

                                                            各機種でイチから作っていた家庭用タイトルのサウンドドライバ ――前回の流れから続いて、家庭用の方のお話も伺いたいのですが、第1章ではナムコ(当時)がファミリーコンピュータに参入されてから、サウンドクリエイターの皆さまはアーケード、家庭用と部門が分かれるまでどちらも担当されていたことがあると伺っておりますが、当時はどんどんハードウェアが進化していくアーケードと、ハードウェアが基本固定の家庭用ゲーム機と、お仕事としてどう捉えていらっしゃったのでしょうか? 大久保:第1章で小沢さん(※1)たちがお話しされていたのは、アーケードタイトルを家庭用に移植するのは、取り外していく作業(仕様を削ったり、映像の質を家庭用のハードに合わせたり)だということで、家庭用ハードに移植することを「落とす」という言葉で表現をされていましたが、実際家庭用の作業は、そういったモノが多かったのですか? ※1 小沢純子:サウン

                                                              バンダイナムコ知新「第8回 第2章ナムコサウンドの発展の足跡を追う【後編①】」 | ファンファーレ
                                                            • 誰でも機械学習を活用したWebアプリを開発できる「Teachable Machine」の完全チュートリアル大公開! - paiza times

                                                              どうも、まさとらん(@0310lan)です! 今回は、ブラウザ上で多彩な学習モデルを誰でも作れるWebサービスの使い方をチュートリアル形式でご紹介します。 面倒な設定や導入準備・高価な機材などは一切不要で、ノートパソコン1台あれば今すぐ始められる手軽さが魅力です。 最終的に簡単なJavaScriptで独自の学習モデルを活用できるので、機械学習を利用したWebアプリ開発にご興味ある方はぜひ参考にしてみてください! なお、paizaラーニングでは動画で学べる「Python×AI・機械学習入門講座」を公開しています。合わせてチェックしてみてください。 【 Teachable Machine 】 ■「Teachable Machine」の使い方 それでは、どのようなサービスなのか実際に使いながら見ていきましょう! まずはTeachable Machineのトップページを開いて【Get Starte

                                                                誰でも機械学習を活用したWebアプリを開発できる「Teachable Machine」の完全チュートリアル大公開! - paiza times
                                                              • いつか「ゲーマー」という言葉がなくなってほしい――「風ノ旅ビト」「Sky」を作ったJenova Chen氏が語る,ゲームというエンターテイメントにかける想い

                                                                いつか「ゲーマー」という言葉がなくなってほしい――「風ノ旅ビト」「Sky」を作ったJenova Chen氏が語る,ゲームというエンターテイメントにかける想い 編集長:Kazuhisa カメラマン:田井中純平 12→ 新作ゲームにそこまで敏感な人でなくても,「風ノ旅ビト」という名前なら聞き覚えがあるだろう。2012年3月15日から配信が開始されたPlayStation 3用のゲームだ(のちにPS4版も登場した)。画面にはスコアもなく,ゲージもなく,ただひたすらに独特のビジュアルと演出効果だけで表現された世界の中でゲームを進めていく。 ……文字で読むと大変地味だが,パッケージがなく,ダウンロード販売のみというデメリット(当時はまだ,DL販売のみはデメリットでしかなかった)をものともせずに,2012年の海外のあらゆるGOTY(Game of the Year)を総ナメにしたタイトルだ。 その内訳

                                                                  いつか「ゲーマー」という言葉がなくなってほしい――「風ノ旅ビト」「Sky」を作ったJenova Chen氏が語る,ゲームというエンターテイメントにかける想い
                                                                • 変なホテルの客室ロボット タピアの脆弱性についてまとめてみた - piyolog

                                                                  2019年10月16日、H.I.Sホールディングスは同社の運営するホテル「変なホテル舞浜 東京ベイ」で導入していたコンシェルジュ機能を持つロボットに脆弱性が存在するといったTwitterへの投稿を受け、対応を行ったと発表しました。ここでは関連する情報をまとめます。 Twitterへの投稿 It has been a week, so I am dropping an 0day. The bed facing Tapia robot deployed at the famous Robot Hotels in Japan can be converted to offer anyone remote camera/mic access to all future guests. Unsigned code via NFC behind the head. Vendor had 90 days

                                                                    変なホテルの客室ロボット タピアの脆弱性についてまとめてみた - piyolog
                                                                  • 「RVC」+「VC Client」で自分の声を任意の声にリアルタイム変換しよう! - Eヤツのブログ

                                                                    【導入】 ・この記事の最終目標は「リアルタイム変換でずんだもんボイスになってDiscordで通話する」です。 ・大まかな記事の流れは「RVCで学習モデルを作る」→「学習モデルをVC Clientに入れる」→「リアルタイムボイチェン完成!」です。 ・「RVC」という超凄い非リアルタイム音声変換ソフトが話題になったと思ったら、翌日に「VC Client」という超凄いソフトがリアルタイム音声変換に対応したのを聞いたので、急いで記事を書きました。 ・この記事ではずんだもんボイスになることを目標としていますが、学習先の音声さえあればどんな音声にもなれます。 【手順】 ①~RVCのダウンロード~ ・以下のURLを開いて、「RVC-beta.7z」をDLします。(要Hugging Faceアカウント)(Hugging Faceアカウントを持ってない人は無料なので作りましょう) https://huggi

                                                                      「RVC」+「VC Client」で自分の声を任意の声にリアルタイム変換しよう! - Eヤツのブログ
                                                                    • LISTEN

                                                                      Apr 10, 2024 Audiostart News デジタル音声広告を音声業界のニュースをまとめるよ 【AD】 Audiostartでは、ポッドキャストに音声広告を掲載したい広告主を募集中です。詳細は以下のリンク先をご覧ください。 https://bit.ly/41jPwyu 【AD】 Audiostartでは、音声広告を掲載して広告報酬を受け取りたいポッドキャスターの方を募集しています。法人・個人問いません。詳細は以下のリンク先をご覧ください。 https://bit.ly/3GSVv5P https://listen.style/p/audiostartnews?mSIM7ycj Apr 10, 2024 ISESAKIFM(FM76.9)Tin tức GUNMA AIを活用して「いせさきFMニュース(ぐんま県のニュース)」をベトナム語でお伝えします。 Chúng tôi sẽ

                                                                        LISTEN
                                                                      • オーディオファイルをMIDIに変換するオープンソースのソフトウェア「NeuralNote」レビュー

                                                                        スタンドアロンのアプリまたはプラグインとして利用できる無料のオーディオ変換ソフト「NeuralNote」を実際に導入し、使ってみました。 GitHub - DamRsn/NeuralNote: Audio Plugin for Audio to MIDI transcription using deep learning. https://github.com/DamRsn/NeuralNote まずはGitHubのリリースページにアクセス。今回はWindowsでスタンドアロンのアプリとして使用するため、「NeuralNote_Standalone_Windows.zip」をクリックしてzipファイルをダウンロードします。 ダウンロードしたフォルダを解凍。 解凍先フォルダ内の「NeuralNote.exe」を実行します。 NeuralNoteの見た目はこんな感じ。ソフトで直接録音するか、既

                                                                          オーディオファイルをMIDIに変換するオープンソースのソフトウェア「NeuralNote」レビュー
                                                                        • Meta、テキストから音楽を生成するAIツール「AudioCraft」を発表

                                                                          Meta Platformsは米国時間8月1日、テキストから「質の高いリアルな」音楽を生成できる生成人工知能(AI)ツール「AudioCraft」を発表した。 AudioCraftは、Metaの3つの生成AIモデル、「MusicGen」「AudioGen」「EnCodec」で構成されている。MusicGenとAudioGenは、いずれもテキストからサウンドを生成するもので、MusicGenは音楽を、AudioGenは特定の音や効果音を生成する。 「HuggingFace」で公開されているMusicGenにアクセスすれば、デモを再生できる。プロンプトには、聴きたいと思うあらゆる時代のあらゆる種類の音楽を記述できる。Metaは、「バックグラウンドでドラムとシンセサイザーが強く響く、80年代風の迫力あるポップソング」などの例を公開している。 Today we’re sharing details

                                                                            Meta、テキストから音楽を生成するAIツール「AudioCraft」を発表
                                                                          • AWS Step Functionsで、音声ファイルがS3バケットに保存される度にAmazon Transcribeで文字起こしし、内容をメール送信してみた | DevelopersIO

                                                                            はじめに AWS Step Functionsを利用し、音声ファイルがS3バケットに保存されるたびにAmazon Transcribeで文字起こしを行い、文字起こし内容をメール送信する方法を紹介します。 今回構築する構成は以下の通りです。 処理の流れは以下の通りです。 音声ファイル(WAV)をS3バケットにアップロードする アップロードをトリガーにEventBridgeからStep Functionsステートマシンを起動する 音声ファイルからAmazon Transcribeで文字起こしし、文字起こした内容をAmazon SNSでメール送信する この構成を構築するきっかけは、以前執筆した「Amazon Connectでエージェントの介在がない場合でも電話中の発話を録音する」記事の構成に、録音ファイルに対して文字起こしとメール通知機能を追加する必要が生じたためです。 執筆した記事の構成図は以

                                                                              AWS Step Functionsで、音声ファイルがS3バケットに保存される度にAmazon Transcribeで文字起こしし、内容をメール送信してみた | DevelopersIO
                                                                            • 中身のない空の div 要素や空の span 要素は HTML 仕様として妥当なのか? - dskd

                                                                              公開日2021-09-06タグHTMLレイアウトや装飾目的で、中身のない div 要素や span 要素、いわゆる「空 div」「空 span」を作ることはままある。しかしそれは仕様として妥当なのだろうか? 目次 レイアウト目的の空 div の例 装飾目的の空 span の例 HTML にレイアウト目的や装飾目的のための要素はない div と span の仕様から探る フローコンテンツ フレージングコンテンツ コンテンツモデルにおける text "nothing" コンテンツモデル ol, ul, menu 要素 パルパブルコンテンツ カスタムエレメント トランスペアレント ここまでのあらすじ 僕の結論 レイアウト目的の空 div の例 下記は使う場所に応じて幅や高さを任意に設定できる例だ。.Spacer が空 div になっている。 <div class="Hero">...</div>

                                                                              • オーディオテクニカ、不正アクセス受け情報漏えいの可能性 会社は電話しかつながらない状況に

                                                                                オーディオ機器メーカーのオーディオテクニカ(東京都町田市)は3月7日、外部からランサムウェアによる不正アクセスを受け、社内の機密情報の一部が不正に閲覧された可能性があると発表した。調査のためECサイトやメール、Webサイトの問い合わせフォームなどが停止している。 同社によると、2月25日に発生したシステム障害を調査する過程でランサムウェアによる不正アクセスを受けた痕跡を見つけたという。27日に公式ECサイトなどを停止し、外部の専門業者に委託して調査を始めた。 ECサイトの決済は外部委託のため、クレジットカード情報は保有していなかった。ただし利用者の個人情報や取引先企業の情報を含め、情報漏えいの範囲は「調査中」とするに止めた。 Webサイトのフォームなども停止したため、製品の修理受付などもできない状態だ。7日になって安全が確認できた電話システムのみ運用を再開し、修理相談などの対応を始めている

                                                                                  オーディオテクニカ、不正アクセス受け情報漏えいの可能性 会社は電話しかつながらない状況に
                                                                                • 画面キャプチャを仮想カメラとして扱えるようにするChrome拡張を作ってみる

                                                                                  この記事について 先日、@catnoseさんがカメラ映像の代わりに絵文字(Emoji)を配信するためのサービスを公開されました。凄く完成度が高くて良いサービスだと思ったので、さっそく使ってみたのですが、仮想カメラとして使用するためには OBS Studio が必要でした。[1] サービスを使うには全然申し分無いのですが、「 もっと簡単にできたらなぁ~ 」と思ってしまうのが私の悪い所で、すぐさまブラウザのみでどうにかできないかと調べてみると、色々な制約はありますが、Chrome 拡張を使うことで OBS Studio を使わずとも仮想カメラを使用できることが分かりました。 実装も簡単にできるので、 今回は Google Meet で、画面キャプチャを仮想カメラとして表示する Chrome 拡張を作って行こうと思います 💪 今回作るモノについて 今回この記事で作る Chrome 拡張は、上記

                                                                                    画面キャプチャを仮想カメラとして扱えるようにするChrome拡張を作ってみる