Apr 10, 2024 Audiostart News デジタル音声広告を音声業界のニュースをまとめるよ 【AD】 Audiostartでは、ポッドキャストに音声広告を掲載したい広告主を募集中です。詳細は以下のリンク先をご覧ください。 https://bit.ly/41jPwyu 【AD】 Audiostartでは、音声広告を掲載して広告報酬を受け取りたいポッドキャスターの方を募集しています。法人・個人問いません。詳細は以下のリンク先をご覧ください。 https://bit.ly/3GSVv5P https://listen.style/p/audiostartnews?mSIM7ycj Apr 10, 2024 ISESAKIFM(FM76.9)Tin tức GUNMA AIを活用して「いせさきFMニュース(ぐんま県のニュース)」をベトナム語でお伝えします。 Chúng tôi sẽ
スタンドアロンのアプリまたはプラグインとして利用できる無料のオーディオ変換ソフト「NeuralNote」を実際に導入し、使ってみました。 GitHub - DamRsn/NeuralNote: Audio Plugin for Audio to MIDI transcription using deep learning. https://github.com/DamRsn/NeuralNote まずはGitHubのリリースページにアクセス。今回はWindowsでスタンドアロンのアプリとして使用するため、「NeuralNote_Standalone_Windows.zip」をクリックしてzipファイルをダウンロードします。 ダウンロードしたフォルダを解凍。 解凍先フォルダ内の「NeuralNote.exe」を実行します。 NeuralNoteの見た目はこんな感じ。ソフトで直接録音するか、既
オーディオ機器メーカーのオーディオテクニカ(東京都町田市)は3月7日、外部からランサムウェアによる不正アクセスを受け、社内の機密情報の一部が不正に閲覧された可能性があると発表した。調査のためECサイトやメール、Webサイトの問い合わせフォームなどが停止している。 同社によると、2月25日に発生したシステム障害を調査する過程でランサムウェアによる不正アクセスを受けた痕跡を見つけたという。27日に公式ECサイトなどを停止し、外部の専門業者に委託して調査を始めた。 ECサイトの決済は外部委託のため、クレジットカード情報は保有していなかった。ただし利用者の個人情報や取引先企業の情報を含め、情報漏えいの範囲は「調査中」とするに止めた。 Webサイトのフォームなども停止したため、製品の修理受付などもできない状態だ。7日になって安全が確認できた電話システムのみ運用を再開し、修理相談などの対応を始めている
配信をする際にマイクの音声が小さかったり、エアコンなどのノイズが乗ってしまったり、声の音量にバラツキがでてしまったり……、なかなか調整がうまくいかなくて困っている方も多いと思います。問題を解決するために、オーディオインターフェイスを使ってマイクの音声を上げたり、ノイズ除去するプラグインを使ったり、コンプレッサーを使ったりしますが、ある程度の専門知識が求められるし、それなりの経験を積まないとなかなか上手くいかないのも事実。また、いちいち設定するのも面倒くさい部分でもあります。 そんな中、配信の音声を最適化するオールインワンプラグインDeeTrimCastが、Dotec-Audioからリリースされました。これは、マイクの音量調整、ノイズ除去、声のバラツキなど、配信の音声設定を圧倒的に簡単に行うことができる、魔法のプラグイン。VST2/3、AU、AAX環境で使えるプラグインであり、リアルタイム処
その道を究めた職人の作業環境には、これまで紹介したガジェット専門インフルエンサーのデスクとは違った魅力にあふれている。個性豊かな「プロ」のデスクを徹底取材、仕事を最適化するための秘訣に迫った。 声優 小岩井ことりさん 声優、作詞家、作曲家。自他ともに認めるオーディオマニアでもある。MIDI検定1級を所持するほか、ASMRボイスドラマをリリースする「kotoneiro」を主宰。へビーメタルバンド「DUAL ALTER WORLD」のメンバーとしても活動している。 幅180cmの横長デスクが幅広い仕事を支える! 声優やDJをはじめ、マルチに活躍している小岩井ことりさん。外部のスタジオと自宅の作業机を、仕事の拠点にしているそうだ。 「本格的な録音はスタジオですが、そのほかのことを行なうのは、大抵ここ(自宅)ですね。DTM(PCを使った音楽制作)や、アニメ映像と台本を見ながらのアフレコ練習をはじ
はじめに AWS Step Functionsを利用し、音声ファイルがS3バケットに保存されるたびにAmazon Transcribeで文字起こしを行い、文字起こし内容をメール送信する方法を紹介します。 今回構築する構成は以下の通りです。 処理の流れは以下の通りです。 音声ファイル(WAV)をS3バケットにアップロードする アップロードをトリガーにEventBridgeからStep Functionsステートマシンを起動する 音声ファイルからAmazon Transcribeで文字起こしし、文字起こした内容をAmazon SNSでメール送信する この構成を構築するきっかけは、以前執筆した「Amazon Connectでエージェントの介在がない場合でも電話中の発話を録音する」記事の構成に、録音ファイルに対して文字起こしとメール通知機能を追加する必要が生じたためです。 執筆した記事の構成図は以
このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 米ワシントン大学と米Microsoftに所属する研究者らが発表した論文「Creating speech zones with self-distributing acoustic swarms」は、部屋内で話す人々の位置を特定し、その音声を分離するための小型の移動式音響ロボット群を提案した研究報告である。 この技術は、多くの人が一度に話している部屋において、部屋の一部で音を消す領域「ミュートゾーン」や、周囲を気にせず対話できる領域「スピーチゾーン」を作り出すことに活用できる。また多数の人が話している中で、物理的に離れた位置にいても特定の人々
WH-1000XM4が発売されたが、aptXが排除されたことで、ネットの一部では騒ぎになっている。これを機にこの記事ではBluetoothコーデックについて分析していきたい。 Bluetoothのオーディオ(A2DP)には圧縮方式がいくつかあり、SBC、AAC、aptX(HD)、LDACなどがあり、一部の人は「aptXは他よりも音質が良く遅延も少ない」と吹聴している。本当だろうか? 長い記事になったので、結論を先に書く。詳しく知りたい方は、下にスクロールして詳細を読んでほしい。 SBC、AptXで音質に違いを見出すことは難しい (※aptX HD はまた別の話です)PC(macOS)上ではSBCとの間で32ミリ秒の差があり、 再生遅延はaptXで180ms程度、SBCで210ms前後であると考えられるAndroid上ではどのコーデックでも遅延は大して変わらず、最低でも200ms、平均して3
一世代前のモデルと比べて、最大 2倍の 雑音を消すアクティブノイズキャンセリング。 空間オーディオは、臨場感を驚くほどパーソナルなレベルまで高めます。 スワイプで音量を調節できるタッチコントロールを搭載。 1回の充電で6時間使えるように、バッテリーも飛躍的にパワーアップしました。 オーディオパフォーマンス H2チップ。 あらゆる瞬間に、 さらなる臨場感。 AirPods Proと進化したオーディオパフォーマンス。その裏側で力を発揮しているのが、Apple製の新しいH2チップです。特別に設計されたドライバやアンプと連係し、鮮明でクリアな高音と深みのある豊かな低音を極めて忠実に再現。すべてのサウンドをかつてないほどあざやかに響かせます。 まったく新しいH2チップは、これまで以上に多才です。コンピュテーショナルアルゴリズムを使って、格段にスマートなノイズキャンセリングを届ける。圧倒的な3Dサウン
SoundFlowerのようにMacに仮想オーディオ入出力装置を作成してくれる仮想オーディオプラグイン&アプリ「GroundControl CUBE」がリリースされています。詳細は以下から。 Macに仮想オーディオ入出力装置を作成してくれるオープンソースのバーチャルオーディオプラグイン「Soundflower」が開発を終了して以降、同じような機能を持ったLoopbackやBlackHoleプラグインがリリースされていますが、同じく、Macに仮想オーディオ入出力装置を作成し、他のアプリからアプリへオーディオを接続してくれるプラグイン&アプリ「GroundControl Driver&Cube」がリリースされています。 GroundControl virtual audio drivers allow applications to pass audio to other applicatio
ZOOMが1月19日、192kHz/32bit Float(フロート)録音に対応した2ch入力の小型フィールドレコーダー、F3を発表し、1月末から発売を開始します。以前から販売されていたF6よりもコンパクトなレコーダーで、XLRのマイク入力を2系統持つレコーダーなのですが、実はこれ、トンでもない秘密機能を搭載しているのです。それは3月に予定されているファームウェアのアップデートおよびドライバのリリースにより、WindowsおよびmacOSでオーディオインターフェイスとして使えるようになるというものなのですが、まさにオーディオインターフェイス革命ともいえる機能・性能を搭載しているのです。 何が革命なのかというと、オーディオインターフェイスとして96kHz/32bit Floatでの録音に対応するということ。ピンと来ない方も少なくないと思いますが、32bit Floatに対応することにより、入
ReazonSpeech¶ ReazonSpeechは、世界最大のオープン日本語音声コーパスを構築するプロジェクトです。 日本語音声技術の推進を目的として、35,000時間の日本語音声コーパスを公開しています。 音声認識モデル・コーパス作成ライブラリをオープンソースライセンスで配布しています。
superwhisperという、whisper.cppを使った音声入力ができるmacOSアプリケーションを最近使っています。 基本的にはggerganov/whisper.cppのモデルを使って、音声認識しながら文字入力ができるアプリケーションです。 特徴 Whisperの認識精度が高い かなり早く喋っても認識してくれる 日本語も認識してくれるモデルがある 日本語で喋って英語に翻訳してくれる機能もある オフライン対応 有料: サブスク と 買い切り の2種類のプランがある 無料で15分のトライアル、その後は選べるモデルが制限される 公式サイトのデモをみると、かなり早く喋っても認識してくれるのがわかります。 大抵の人にとっては、多分文字入力するよりしゃべったほうが早いぐらいの入力速度が出ると思います。 superwhisper 長文はそこまで得意じゃないけど、1行とか2行ぐらいの文章はかなり
関連記事 地下鉄の駅構内に「完全無人書店」 日販、秋から実証実験 「書店経営の持続性向上に」 日販が完全無人書店「ほんたす ためいけ 溜池山王メトロピア店」を秋にオープンする。書店が減少する中、低コスト店舗のモデルを確立する考え。 マンガ実写化のカギは“キャラ”にあり 映画「キングダム」にみる良作の条件、マンガ家が解説 人気マンガ「キングダム」の実写映画化の第3弾「キングダム 運命の炎」が7月28日より公開中です。マンガの実写化に関しては否定的な意見が多いと思いますが、そんな中でもこのキングダムシリーズは成功を収めているといえるでしょう。 LINE、「太鼓の達人」の新作リリースへ LINEの友だちとプレイしやすい“つながり”コンセプト LINEがゲーム「太鼓の達人 RHYTHM CONNECT」をリリースする。これまでの太鼓の達人シリーズと同様のリズムゲームだが、LINEの友だちを追加する
中国に拠点を置くオーディオメーカー「Nobsound」が販売する真空管アンプ「MS-10D MKII」を購入したユーザーが、中身の伴わない粗悪品だったと報告しています。 Exposure of fake Chinese tube amplifier Nobsound MS-10D MKII. - Stereo Amplifiers & Pre-Amps - StereoNET International https://www.stereonet.com/forums/topic/246417-exposure-of-fake-chinese-tube-amplifier-nobsound-ms-10d-mkii/ Exposure of a fake Chinese tube amplifier Nobsound MS-10D MKII - YouTube MS-10D MKIIを購入し
多くの人がレコードで音楽を聴いていた頃、45回転(7インチ)、33回転(12インチ)を頻繁に切り替えていたため、レコードプレーヤーの速度切り替えスイッチを忘れてしまい、間違った速度で曲を流してしまうことがありました。時には、それが正しい音に聴こえ、より良い音が出ることもありました。 米ロサンゼルスのレコード・カルチャー・メディアIn Sheep's Clothing hifiは、そんな「間違った速度で再生すると素晴らしいサウンドになるレコード」を特集。YouTubeに投稿されている「間違った速度で再生した」音源にコメントを添えて紹介しています。 「間違った速度で再生すると素晴らしいサウンドになるレコード」の代表的な楽曲は、ドリー・パートンの「Jolene」で、YouTubeでの再生回数は1,100万回を超えています。 ●Dolly Parton - Jolene (1974) 間違った速度
※追記:この記事はハイレゾの勧めというより、PCのヘッドホン出力は音質が悪いから、外部USB-DACを使って音質を良くしよう!というもので、この程度の環境ではハイレゾの恩恵を受けられないのではという指摘はよくわかる。自分も、ヘッドホンではハイレゾと普通の音源はそれほど差を感じず、差を感じるようになったのはスピーカーにしてからだった。よく言われる高音ではなく、ヘッドホンでは感じづらい空間表現で大きな違いを感じた。 据置USB-DAC内蔵ヘッドホンアンプは1万円以上とそこそこの価格 PCに接続するUSB-DACというと、こんな感じで、据置型のUSB-DAC内蔵ヘッドホンアンプを勧めることが多い。今なら、この記事にあるように、最近出た比較的安くてコンパクトなiFi-Audio Unoがお勧めだろう。*1 【2023年5月最新】おすすめの据え置き型ヘッドホンアンプ・USB-DAC 特集 種類や選び
昨今のコロナ禍の影響で在宅ワークの時間が増えたため、本格的なデスクワーク環境を整えた人も多いと思う。そのため、2020年はウェブカメラやPCモニター、さらにはPCそのものも需要が高まり、売れ行きを伸ばした。それらと同様に人気が高まった製品が、PCスピーカーだ。 イヤホンやヘッドホンである程度の代用は可能なものの、長時間に渡って使用するとなると、やはりちゃんとしたスピーカーが欲しくなってくる。ノートパソコン内蔵スピーカーはもとより、コスト優先のPCスピーカーでも音楽を聴き続けるは厳しい。そんな状況を解決すべく、多くの人が良質なPCスピーカーを求めるようになったのだろう。 しかしながら、デスクの上はパソコンやモニター、周辺機器など設置する必要のあるアイテムが多々あり、スペース的にはそれほど余裕があるわけではない。そこで人気を集めたのが、小型で高音質なパワードスピーカーだ。これらの製品は、もとも
昔の人々が聞いていた音を再現する「音響考古学」という学問がある。古地図や文献などの資料をたよりに、当時の音環境を分析し、再現する学問だ。 その第一人者のミレーヌ・パルドアンは、2011年から18世紀パリの生活音の再現に取り組んできた。現在は2019年に火災に見舞われたノートルダム大聖堂の再建にもかかわる彼女の活動を、仏誌「ル・ポワン」が取材した。 ノートルダム大聖堂の再建に生かされる技術 ノートルダム大聖堂に夜の帳がゆっくりと下りる。建物に入ると、今では天井の先に巨大な空が見えることに驚く。 崩壊した天井のアーチからは、様々な耳慣れない音が聞こえてくる。工事用の足場には不安な風の音、呼びかけあう夜間労働者の叫び声、空に開かれた大聖堂を今夜の寝床とする鳥の叫び……。 地上では、白い防護服を着て、まるで亡霊のように忍び込んだ専門家の一団が、最新の録音機材で音響のチェックを進めている。夜遅くまで
1990年代から2000年代初頭にかけて国内で流行した「MD(ミニディスク)」。小さな本体に音源がたくさん入り、音飛びもしないというこの録音・再生媒体は、カセットテープよりも高性能で、CDよりも手軽という点が人気を呼びました。 しかし、最近では見かけることがなくなり、“最後のMDオーディオ”といわれた、音響機器メーカー「TEAC(ティアック)」の MD・CD一体デッキ「MD-70CD」も2020年12月で販売が終了。今年12月に発売される「三省堂国語辞典 第八版」では、「MD」という言葉自体が削除されることが決まっているそう。「MD」はこのまま消えてしまうのでしょうか? 国内で最後までMDオーディオ機器の生産・販売を行っていたティアック株式会社に聞きます。 ――MDの最盛期はいつ頃だったのでしょうか? 2000年代前半です。アーティストの新曲がMDで発売されることは少なかったですが、レンタ
最新のmacOSに対応した仮想オーディオ入出力ユーティリティ「BlackHole」を利用してGoogleドキュメントに議事録などの自動文字起こしをしてもらう方法です。詳細は以下から。 以前、既に開発が終了したCycling ’74チームのSoundFlowerのように、特定のアプリからの音声を他のアプリに送るれる仮想オーディオデバイスをMac内に作成できる仮想オーディオ入出力ユーティリティ「BlackHole」を紹介したさい、WWDCのセッションや議事録をGoogleドキュメントの音声入力に接続することで簡単に文字起こしができるという事を教えていただいたので試してみてください。(コメントでのご指摘ありがとうございます) 設定 まず、文字起こしを行う音源が入ったMacにBlackHoleをインストールし、macOSのAudio MIDI設定アプリからBlackHoleの仮想オーディオデバイス
1986年生まれ佐世保在住ライター。おもに地元の文化や歴史、老舗や人物などについての取材撮影執筆、紙媒体のお手伝いなど。演劇するのも観るのも好き。猫とトムヤンクンも好きです。 前の記事:思い入れのある曲で8cm短冊シングルを作ったら愛しかなかった > 個人サイト ヤマモトチヒロのブログ 長崎県西海市雪浦、電波の届かない場所にて 佐世保市街地から約1時間とちょっと車を走らせ、わたしは西海市大瀬戸町雪浦にいる。地名は「ゆきのうら」と読むのだが、とても詩的な響きが魅力的に感じている。人口1,200人ほどの小さな町だ。 角力灘を眺める 「音浴博物館」へは何度か訪れたことがあったのでスイスイ到着する予定だったのだが、なんと夏の大雨で道が全面通行止めになってしまっていた。仕方なく別ルートを進むことにしたのだがナビが動いてくれない。 周囲は綺麗な田んぼです 地図を見ながら、「本当にこの道で正しいのだろう
こんにちは ハタ です。 最近Mirrativ上に構築した配信の文字起こしシステムを紹介したいなと思います 音声からの文字起こしは、各社SaaSでAPI提供されているものがあると思いますが、今回紹介するものはセルフホスト型(自前のGPUマシンを使う)になります 構築していく上で色々試行錯誤したのでそれが紹介できればなと思っています どんなものを作ったか 前提知識: 配信基盤 前提知識: Unix Domain Socket Live Recorder Archiver DS Filter VAD Filter NAC / Compress Transcriber NAC / Decompress Speach To Text コンテナイメージ まとめ We are hiring! どんなものを作ったか 今回作ったものは Mirrativで配信されるすべての音声を対象に文字起こしを行う シス
経歴だけは長いベテラン記者・編集者の松尾(マツ)と、幾つものテック系編集部を渡り歩いてきた山川(ヤマー)が、ネット用語、テクノロジー用語で知らないことをお互い聞きあったり調べたりしながら成長していくコーナー。交代で執筆します。 ヤマー オンキヨーの子会社2社が破産申請というニュースが先週ありまして、結構衝撃を受けました。 オンキヨーの子会社2社が事業停止、破産申請へ マツ これ、よく分からなかったんです。子会社がなくなっても、本体が残るならいいじゃんとか思っていたけど、そういう問題ではないというね。 ヤマー そうですね。オンキヨーホームエンターテイメントが持っていたパイオニアブランドを含むホームAV事業は、2021年9月にシャープとVOXXの合弁会社に譲渡されまして。 オンキヨーホームエンターテイメントの傘下にあった2社が今回破産申請したという形ですね。オンキヨーマーケティングは販社、オン
耳をふさがずに聞こえる 「骨伝導」の仕組みとは? 通常、音は空気の振動として耳の穴から入って鼓膜を振動させ、内耳(聴覚神経)に伝わることで聞こえます(空気伝導)。 これに対して骨伝導は、頭の骨の振動を通じて音を聴覚神経に直接伝えます。実は骨伝導による音は日常的に聞こえており、例えば自分の声は耳からと骨伝導の音がミックスされたもの。 録音した自分の声を聴くと違和感があるのは、空気伝導で伝わった声だけが録音されているため、といわれています(出典:日本医療機器産業連合会) 骨伝導イヤフォンの装着方法と接続方法をチェック 多くの骨伝導イヤフォン・ヘッドフォンは、こめかみの後ろの辺りに両側から挟むようにして装着します。重さや装着感のほか、眼鏡やサングラスをかけても問題ないかどうか確認しましょう。
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く