タグ

規格と音に関するotori334のブックマーク (37)

  • Lyra V2 - a better, faster, and more versatile speech codec

    The latest news from Google on open source releases, major projects, events, and student outreach programs. Since we open sourced the first version of Lyra on GitHub last year, we are delighted to see a vibrant community growing around it, with thousands of stars, hundreds of forks, and many comments and pull requests. There are people who fixed and formatted our code, built continuous integration

    Lyra V2 - a better, faster, and more versatile speech codec
  • どんな爆音を入れても絶対クリップしない! ZOOM F3が、ついに32bit float対応の革命的オーディオインターフェイスに|DTMステーション

    レコーディングの常識を根底から覆す革命的な出来事が、現在のDTMの世界において進行中です。そのキーワードとなるのが32bit float=32bit浮動小数点という演算処理です。ちょっと難しそうに思える言葉ですが、実際試してみると使い方は至って簡単で、これによって絶対にクリップしないという夢のようなレコーディング環境を手に入れることができるのです。 その環境を実現するためにはDAW、オーディオインターフェイス、ドライバが揃う必要があり、これまで肝心の32bit float対応オーディオインターフェイスが存在しなかったため、絵に描いたのような理想論にすぎませんでした。しかし、ついに日のメーカー、ZOOMが誰でも手軽に入手できるコンパクトな32bit float対応のオーディオインターフェイス、ZOOM F3(実売価格35,100円前後)を誕生させました。正確にはF3はコンパクトなフィール

    どんな爆音を入れても絶対クリップしない! ZOOM F3が、ついに32bit float対応の革命的オーディオインターフェイスに|DTMステーション
  • Opusでエンコードする:tech.ckme.co.jp

    コーデックには -acodec libopus を指定する。 ビットレートを指定する 可変ビットレート、固定ビットレートとも、ビットレートを指定するには-b:aで指定する。 -b:a 128k この場合、128kbpsに指定している。 許容範囲内といえる最小ビットレートは80kbps、推奨ビットレートは128kbps以上である。 固定ビットレートと可変ビットレートモード Opusでは、デフォルトは可変ビットレートである。固定ビットレートにするには -vbr off とする。 -vbr on とすると可変ビットレートになるが、デフォルトでこのようになっているのでわざわざ指定する必要はない。 会話向けに最適化する -application voip オプションをつけると、会話向けに最適化される。 デフォルトでは -application audio 音楽向けとなっている。 このほかに -app

  • MP3より高音質! YouTube/Discord採用の「Opus」コーデックを試した【藤本健のDigital Audio Laboratory】

    MP3より高音質! YouTube/Discord採用の「Opus」コーデックを試した【藤本健のDigital Audio Laboratory】
  • オーディオコーデック - Wikipedia

    オーディオコーデック とは音声データをエンコードまたはデコードするコーデック。また、デジタルデータストリームをエンコードまたはデコードできるデバイスまたはコンピュータープログラムを指す[1][2][3][4]。 ソフトウェアでは、オーディオコーデックは特定のオーディオファイルまたはストリーミングメディアオーディオコーディング形式に従ってデジタルオーディオデータを圧縮および圧縮解除するアルゴリズムを実装するコンピュータープログラムを指す。アルゴリズムの目的は、品質を維持しながら、最小限のビット数で高忠実度のオーディオ信号を表現することである。これにより、保存されたオーディオファイルの送信に必要なストレージスペースと帯域幅を効果的に削減できる。 ほとんどのソフトウェアコーデックは、1つまたは複数のマルチメディアプレーヤーに接続するライブラリとして実装される。最新のオーディオ圧縮アルゴリズムのほ

  • System Bus Radio

    Tested on MacBook Air / Chrome with AM tuner at 1560 kHz. See field reports for other equipment and frequencies. Play tune Stop tune 400 2673 400 2349 400 2093 400 2349 400 2673 400 0 400 2673 400 0 790 2673 400 2349 400 2349 400 0 790 2349 400 2673 400 3136 400 0 790 3136 400 2673 400 2349 400 2093 400 2349 400 2673 400 0 400 2673 400 0 400 2673 400 0 400 2673 400 2349 400 0 400 2349 400 2673 400

  • みさき on Twitter: "外部ディスプレイに出力するHDMIケーブルを流れる信号を上手く変調することで、音楽をAM送信しています。ディスプレイサイズが1920*1080(60Hz)に対応しており、周波数は445.7MHzです。System Bus Radi… https://t.co/4duH0nrKSr"

  • Code Excited Linear Prediction - Wikipedia

    Code Excited Linear Prediction(CELP、セルプ)は線形予測符号・ベクトル量子化・合成による分析を組み合わせた音声符号化アルゴリズムである。直訳すると「符号励振線形予測」。 CELPは当時の既存の低ビットレートのアルゴリズム(RELP、LPC、ヴォコーダーのFS-1015など)に比べて格段に優れた音質を示した。様々な派生が生まれ(ACELP、RCELP、LD-CELP、VSELPなど)、現在最も広く使われている音声符号化アルゴリズムである。CELPはこのアルゴリズムのクラスを指す用語であり、特定のコーデックを指す用語ではない。 概要[編集] CELPアルゴリズムは次の考え方に基づいている: 線形予測符号 (LPC) に基づく音源フィルタモデル 声帯相当の音源 (励起信号): 線形予測残差 声道相当のフィルタ:    線形予測フィルタ ベクトル量子化 (VQ)

    Code Excited Linear Prediction - Wikipedia
  • [映像クリエイターが知るべき録音術]Vol.02 誤解が多いマイクの種類と用途について考える - PRONEWS : 動画制作のあらゆる情報が集まるトータルガイド

    カメラとの接続方法でマイクを分類することもできる。大別すると、電源の必要なマイクと電源の要らないマイクがある。まずは、電源の要不要の違いによる分類を解説することにしたい。 大きく分けると2種類。電源が必要なマイクと不必要なマイク マイクを構造で大きく分けると、電源が必要なマイクと電源が不必要なマイクに分かれる。何が違うかと言うと、概して言えば、 電源が必要なマイク=高感度マイク 電源が要らないマイク=低感度マイク これを読んで、「高感度マイクの方がいい」と思うなかれ。写真と同じで高感度カメラが万能ではないのは当たり前。感度は用途によって使い分ける。マイクも同じで、高感度マイクと低感度マイクは用途が全く違うのだ。 わかりやすい例を挙げると、雑踏の中でインタビューをする場合、高感度なショットガンマイクを使うと周囲の雑踏まで入ってしまう。そんな時には低感度なインタビューマイクを使えば、周囲の雑踏

    [映像クリエイターが知るべき録音術]Vol.02 誤解が多いマイクの種類と用途について考える - PRONEWS : 動画制作のあらゆる情報が集まるトータルガイド
  • 『1248 :ノイトリックのXLRコネクタは旧型の使い勝手が良い』

    ノイトリックのXLRコネクタ、 Shinさんはいまだに旧型のNC3MX-Bを好んで使っている。 写真はパッケージのNC3MX-B(左)とMXX-B(右) 5~6年前から新型であるNC3MXX-Bに切り替わったが、なんだこりゃ、シェルからブッシングに至るまでネジは「オス・メスが逆」、という奇異な構造。 きっとサードパーティ・メーカーによる「模造・なんちゃってノイトリック」を防御するためのモデルチェンジだったのだろうか。 賛否両論あろうが、新型の方が外形がやや大きく、その割に内径は細く・・・・・いやShinは何を云っているのだろう。 結局コネクタの中にいろいろ詰め込みづらいって事じゃないの?、最初からそう云えばいいのに。 ところで今でも旧型の純正品がまったく手に入らないわけではない、メーカーでは細々ながら生産を続けているそうで、「細々ながら」安定的に入手できるルートがあるのです。(成田の神様に

    『1248 :ノイトリックのXLRコネクタは旧型の使い勝手が良い』
    otori334
    otori334 2021/12/12
    “結局コネクタの中にいろいろ詰め込みづらいって事じゃないの?、最初からそう云えばいいのに。”
  • DTMF - Wikipedia

    通常、0から9までと*・#が使われる。このマトリックスに沿って、低群・高群それぞれから1周波数ずつの正弦波が用いられる。音声伝送回路にて伝送するため、全ての周波数は可聴帯域内に収まっている。耳に聞こえるDTMFは、2種類の正弦音波の合成音である。 その他の規格[編集] 信号周波数偏差 信号周波数の±1.5%以内 信号送出電力 絶対レベルで表した値。Lは、電気通信事業者交換設備から端末設備の接続点までの1,500Hzにおける通信線路伝送損失。 低群周波数 (-16.5+0.8L)dB以上・ (-6.5+0.8L)dB以下で、かつ-3.5dBを超えない信号 高群周波数 (-16.0+L)dB以上・ (-6.5+L)dB以下で、かつ-2.5dBを超えない信号 信号送出時間 50ms以上 ミニマムポーズ 隣接する信号間の休止時間の最小値。30ms以上 周期 信号送出時間とミニマムポーズの和。120

    DTMF - Wikipedia
  • ISDN - Wikipedia

    ディジタル回線終端装置 NTT-AT DSU AT144K ISDN(アイエスディーエヌ、Integrated Services Digital Network、サービス総合ディジタル網[注釈 1][注釈 2])とは交換機・中継回線・加入者線まで全てデジタル化された、パケット通信・回線交換データ通信にも利用できる公衆交換電話網である。ITU-T(電気通信標準化部門)によって世界共通のIシリーズ規格として定められている。 音声は、0.3 - 3.4kHzを64kbpsの回線交換でISDN網内を伝送しているため、VoIPよりも音声品質が安定している。また北アメリカ・日はμ則、その他の国々ではA則がPCM非直線符号化に使用されているため北アメリカ・日側の関門電話交換機で変換している。 データ通信では、通信相手が電話番号で特定でき、回線交換は通信速度が、パケット通信はQoS(サービスの品質)が

    ISDN - Wikipedia
  • 音の大きさ - Wikipedia

    音の大きさ(ラウドネス、英: loudness)はヒトの聴覚が感じる音の大小を示す心理量である[1]。 解説[編集] ヒトは音に対して大小を感じる。これが音の大きさ・ラウドネスである。単位はソーン(sone)。音圧レベル40dB・周波数1kHzの純音をヒトが聴いた際に感じる音の大きさが1soneと定義される[2]。ヒトの感じる音の大きさが2倍になれば2sone、半分になれば0.5soneと表される[3]。 同じ周波数の音であれば音圧が増大するほどヒトは音を大きく感じる。しかしヒトの聴覚の感度は周波数によって異なるため、同じ音圧であっても周波数が異なればヒトの感じる音の大きさは異なる。音の大きさが一定となる純音の音圧レベルを結んで得られる周波数と音圧レベルの関係を図示したものが等ラウドネス曲線である(右図)。 等ラウドネス曲線。横軸は周波数、縦軸は音圧レベル。 推定[編集] ラウドネスは心理

    音の大きさ - Wikipedia
  • 適切な音量について考える。ゲームサウンドの「ラウドネス基準」はどうあるべきか

    適切な音量について考える。ゲームサウンドの「ラウドネス基準」はどうあるべきか ライター:榎 涼 CEDEC 2012最終日,ゲームに限らず,音楽制作を行う人にとっては無関心ではいられない「ラウドネス基準」をテーマにしたセッションがCEDEC 2012で行われた。 開催からかなり時間が経ってしまったが,ここでは,ラウドネス基準とはなにか,それがゲーム業界にどういう意味を持っているのかなどを含めて紹介してみよう。 テレビ業界がラウドネス基準を定めたことでゲームにも影響が波及 以前と比較すると「圧倒的なNo.1」ではなくなったものの,音声関係の規格ではテレビ業界の影響力は依然として大きい。据え置き型のコンシューマゲーム機と接続されることの多いテレビも,来は放送番組を見ることを前提に作られており,その画質や音質の話をする際もテレビ番組が基準となることが多い。 そのテレビ業界が意を決して「ラウド

    適切な音量について考える。ゲームサウンドの「ラウドネス基準」はどうあるべきか
    otori334
    otori334 2021/11/18
    “音圧レベルをとにかく高くするため,ピークレベルを片っ端からつぶした素材をラウドネスメーターにかけて-24LKFSに合わせると,圧縮していない素材と比べて音量感がなくなったように聞こえてしまう”
  • Python: waveモジュールをハックしてfloat形式のwavファイルを読み込みnumpy配列に変換する - Wizard Notes

    問題 解決方法 waveモジュールのWav_readクラスをハック 検証 問題 www.wizard-notes.com 上記の実装の拡張として、Python の waveモジュールを使って32-bit or 64-bit float形式のwavファイル読込を追加しようとして試してみたところ、以下のようなエラーがでました。 >wave.Error: unknown format: 3 てっきりwaveモジュールはfloat形式にも対応しているかと思いきや、そうではないようです。 CPythonのWaveモジュールのソースコードを確認してみました。 github.com 87行目には、 WAVE_FORMAT_PCM = 0x0001 のみで、WAVE_FORMAT_IEEE_FLOATなどはありません。 また、254-273行目を見てもPCM以外の形式はunknown formatとしてエ

    Python: waveモジュールをハックしてfloat形式のwavファイルを読み込みnumpy配列に変換する - Wizard Notes
  • WAVデータの最大音量値を得るには - Visual Basic (VB・VBA・.NET)

    毎度お世話になります。 WAVデータの曲で最大ボリューム値を得ることは出来るでしょうか? 一般的な方法があったら教えて頂きたいです。 すいません・・・ 最大ボリューム?それはマシンのメインボリュームでは無くて、 WAVデータとしての最大出力値ということでしょうか・・・ であれば、それは理論的に決まってますが。 サンプリングのkHzもありますが、16ビットとか、12ビットとか 8ビットとか・・・その値で表現可能な限界値は、そのビット数 を超えれないですから・・・抽象的な表現ですが、あとは局中の WAVデータの各々の出力値を単純に見比べれば求められます。 ステレオやモノラルでのWAVデータのフォーマットは解ってお られますよネ?! それを知らないと、何ともなりませんので・・・ 以上。

    otori334
    otori334 2021/10/29
    “ノーマライズ時はデーターを2回読みます”
  • wavファイルの音圧はどのように定義されているのでしょうか?…

    wavファイルの音圧はどのように定義されているのでしょうか?例えばCool Editにデータを放り込むと、縦軸をnormやbitdbに簡単に変えられますが、これはwavはある程度の大きさ以上は再生できないということでしょうか?それともwavファイルの中に一番最低の音と最高の音についてかかれているのでしょうか?後取り込み機器や量子化bitによっても表現できる最大の音圧は変わってくるのでしょうか?うまく文章にできていなくてすみませんがご回答よろしくお願いします。

  • 小学生でも分かるデシベル(dB)の話

    1.1. はじめに 音の大きさや、電波の強さをデシベル(dB)で表示しますが、この正体を正確にご存知の方は意外に少ない様です。 かと言って、説明書を読むと突然難しい数式が出て非常に分かり難いので、ここでは小学生でも分かる様に順を追ってご説明したいと思います。 1.2. デシベル 例えば、図書館の音の大きさが40デシベル、一般的な会話が60デシベル、電車内が80デシベル、という話は耳にされた事があると思います。 これからすると、どうも数値が高くなるほど音が大きくなるというのは、何となく分かって頂けると思います。 また図書館の音と一般的な会話の音の大きさの差は、20(=60-40)デシベルというのも、抵抗なく分かると思います。 それでは、この20デシベルの差とはどの程度の差なのでしょうか? 少し遠回りになりますが(でもこれこそがデシベルの質を理解する最短の道なのです)、先ず”デシベルの差”か

  • デシベル - Wikipedia

    デシベル (英語: decibel 記号: dB)は、ある物理量を基準となる量との比の常用対数によって表した計量単位である[1]。 音の強さ、音圧レベル、電力比や電気機器の利得等の物理量をレベル表現を用いて表すときに使用される単位である。 国際単位系(SI)においては、非SI単位であるが、ベル、ネーパと並んでSI併用単位となっている。日の計量法においては、SI単位のない量についての非SI単位と位置づけられていて、電磁波の減衰量、音圧レベル、振動加速度レベルの3つの物象の状態の量に対応する法定計量単位である[2]。 なおSIにおいてレベル表現として表される量には次元が与えられておらず、無次元量である。電気工学や振動・音響工学などの分野で頻用される。 計量法における定義は次のようになっている[3]。 電磁波の減衰量についてのデシベル:減衰前の電磁波の電力の減衰後の電磁波の電力に対する比の常用

    デシベル - Wikipedia
    otori334
    otori334 2021/07/27
    “電圧や音圧などの交流信号の振幅からデシベルで表す利得LVを求める場合、パワーは振幅の2乗に比例すると仮定”
  • 音ファイル(拡張子:WAVファイル)のデータ構造について - 福岡・東京のシステム開発会社 (株)ユーフィット

    WAVファイルはWindows標準の音データファイルで、RIFF形式で作られています。Wavファイルのデータ構造を知るにはRIFF形式を理解する必要があります。 RIFF(Resource Interchange File Format) 形式とは、画像や音声などのデータを1つのファイルに格納するための共通フォーマットになります。 RIFFにはチャンク(chunk)と呼ばれる考え方があります。チャンクとはデータの論理的な単位でデータの集まりのようなものです。WAVファイルはいくつかのチャンクを1つにまとめた集合体になります。 チャンク(chunk)の例 項目 サイズ(byte) 説明

    音ファイル(拡張子:WAVファイル)のデータ構造について - 福岡・東京のシステム開発会社 (株)ユーフィット