タグ

圧縮と信号処理に関するotori334のブックマーク (15)

  • 片岡龍峰 on Twitter: "惑星間空間衝撃波が地球に到来しました。いま地磁気が急激に圧縮されています。 https://t.co/xZUvkeRH9U"

  • Film Grain Synthesis in AV1

    Film grain synthesis in AV1 Published Nov. 3, 2019, updated Dec. 18, 2019. This page describes the film grain synthesis as defined in the AV1 film grain tool. Recently, there have been a lot of question on the film grain in AV1. Hopefully, this page can answer some of them. If you would like to get more information, you can follow links on this page or contact me directly. Motivation to preserve f

    Film Grain Synthesis in AV1
  • チップチューン - Wikipedia

    ゲームボーイを使用したチップチューンを演奏する際の機材構成 チップチューン (英: Chiptune) は、コンピュータ音楽の黎明期において厳しい制約のある音源チップのみで作られた音楽のスタイルを志向した音楽ジャンルである。 おもに1980年代に発売されたパーソナルコンピューターや家庭用ゲーム機に搭載されていた内蔵音源チップを直接使用したり、それらをエミュレートした環境で作られる場合が多い。また、他の音源で「チップチューン風」の音楽が作られたり、他の楽器音と同時演奏されることもある。これらが広い意味でのチップチューンと見なされる場合もあるが、実機特有の雑音(ヒスノイズ・ハムノイズ・クリップノイズなど)や位相のずれを「実機らしさ」として評価される場合がある為「実機演奏された物だけがチップチューンである」という見方もある。 チップチューンに使われる音源には、「同時発声数が少ない」「オクターブレ

    チップチューン - Wikipedia
  • ラジオの遠距離受信のテクニック

    遠距離受信しなくてもネット配信で全国のラジオを聞くことができる時代になりました.そして,民放の中波AM放送は2028年で廃止され,2028年以降,FM放送(サイマル放送),あるいはネットでの radiko(ラジコ)が中心になる予定です.なお,NHKは中波AM放送を続ける(ただし、NHK第1とNHK第2を統合して縮小の計画)ようです. 以下の内容は20年以上前に作成したものをほぼそのまま移したものです.手直しした部分もありますが,現状に合わない部分があると思います. 530kHzから1600kHzでおこなわれているAM放送は中波放送に分類されます. AMとは電波で音声を送る方法のことで周波数のことではありません. 短波放送もほとんどの放送局がAM方式で音声を送っています. 同様にFMも電波で音声を送る方法のことです. ここでは中波放送の遠距離受信を考えます. AMラジオ(中波放送)が室内で入

    ラジオの遠距離受信のテクニック
  • Code Excited Linear Prediction - Wikipedia

    Code Excited Linear Prediction(CELP、セルプ)は線形予測符号・ベクトル量子化・合成による分析を組み合わせた音声符号化アルゴリズムである。直訳すると「符号励振線形予測」。 CELPは当時の既存の低ビットレートのアルゴリズム(RELP、LPC、ヴォコーダーのFS-1015など)に比べて格段に優れた音質を示した。様々な派生が生まれ(ACELP、RCELP、LD-CELP、VSELPなど)、現在最も広く使われている音声符号化アルゴリズムである。CELPはこのアルゴリズムのクラスを指す用語であり、特定のコーデックを指す用語ではない。 概要[編集] CELPアルゴリズムは次の考え方に基づいている: 線形予測符号 (LPC) に基づく音源フィルタモデル 声帯相当の音源 (励起信号): 線形予測残差 声道相当のフィルタ:    線形予測フィルタ ベクトル量子化 (VQ)

    Code Excited Linear Prediction - Wikipedia
  • 線形予測符号 - Wikipedia

    線形予測符号化(せんけいよそくふごうか、英: linear predictive coding, LPC)は線形予測法を用いた信号の符号化である。 特に音響信号処理・音声処理における音声分析・符号化・圧縮・合成で広く利用される。 概要[編集] 線形予測符号化 (LPC) は線形予測法を用いた信号の符号化である。すなわち時点 の信号 を 次の過去信号 の線形結合を用いて予測し、信号を予測係数 と予測残差 に符号化する手法である。 区間 の信号 () が線形結合でよく表現できれば、区間中で不変な予測係数 個 () と振幅の小さい残差 個 () へと信号を変換できる。残差系列に対して様々な圧縮を適用することで信号をより小さい情報量で伝達できる。この区間はしばしばフレームと呼ばれる。 例えば音声信号は数十ミリ秒の区間で定常性を持ち線形結合で良く表現できると経験的に知られている。残差系列の小振幅を生

  • ベクトル量子化 - Wikipedia

    ベクトル量子化(ベクトルりょうしか、英: Vector Quantization, VQ)は連続空間に存在するベクトルを有限個の代表ベクトルへ離散化する操作である。すなわちベクトルを入力とする量子化である。 通常の(スカラー)量子化は連続値を有限個の代表値へと集約する。例えば標化したアナログ音声信号の各サンプルを、最も近いビット/デジタル符号に置き換える。サンプルと代表値はともに1次元/スカラーである。 これに対してベクトル量子化はN次元空間内のベクトルを対象として量子化をおこなう。例えばステレオ2chの信号を各チャンネルごとでなく左右セット (=2次元ベクトル) で扱い、このベクトルをまとめて有限個の代表値へ符号化する。ベクトル単位での量子化であることからベクトル量子化と呼ばれる。

  • 適切な音量について考える。ゲームサウンドの「ラウドネス基準」はどうあるべきか

    適切な音量について考える。ゲームサウンドの「ラウドネス基準」はどうあるべきか ライター:榎 涼 CEDEC 2012最終日,ゲームに限らず,音楽制作を行う人にとっては無関心ではいられない「ラウドネス基準」をテーマにしたセッションがCEDEC 2012で行われた。 開催からかなり時間が経ってしまったが,ここでは,ラウドネス基準とはなにか,それがゲーム業界にどういう意味を持っているのかなどを含めて紹介してみよう。 テレビ業界がラウドネス基準を定めたことでゲームにも影響が波及 以前と比較すると「圧倒的なNo.1」ではなくなったものの,音声関係の規格ではテレビ業界の影響力は依然として大きい。据え置き型のコンシューマゲーム機と接続されることの多いテレビも,来は放送番組を見ることを前提に作られており,その画質や音質の話をする際もテレビ番組が基準となることが多い。 そのテレビ業界が意を決して「ラウド

    適切な音量について考える。ゲームサウンドの「ラウドネス基準」はどうあるべきか
    otori334
    otori334 2021/11/18
    “音圧レベルをとにかく高くするため,ピークレベルを片っ端からつぶした素材をラウドネスメーターにかけて-24LKFSに合わせると,圧縮していない素材と比べて音量感がなくなったように聞こえてしまう”
  • 意外と知られてない音量調整の話 〜後編〜 - スタジオ・サニーサイド

    ご無沙汰してました。やっとブログを書く余裕が出て来ました…。こんにちわ。banです。 えー前回の続きです。ゲームサウンドの音量調整の話。(前回はこちら) サウンドデータやプログラムからの制御で、音量をガッツリ上げるのは実は難しいんだぜ。と言う話でしたが、 それでも音量調整の工程で、どうしてもここの音に迫力を出さねばならん、というケースは往々にして生じます。 が、データやプログラムの音量パラメータは既にMAXですよう、というような場合、 次に取る手段としては、「元のwavファイルの音量を上げる」というのがまず思いつく手段です。 しかしそれは意外にカンタンな問題ではないのだよ、というのが前回までの話。 それはなぜか、という理由を理解していただくために、ちょっとwavファイルの性質について触れてみます。 一般に、wavファイルを波形編集ソフトで開くと、下のような毛ダワシのごときグラフが表示されま

    意外と知られてない音量調整の話 〜後編〜 - スタジオ・サニーサイド
  • FMラジオ放送の音質(ビットレート換算) - アマチュアSEのメモ書き

    試しにFMラジオ放送の音質をビットレートの観点から計算してみた。 ビット深度 オーディオのデジタイジングによると ビットデプス ダイナミックレンジ 8 bit 48 dB 16 bit 96 dB 24 bit 144 dB 32 bit 192 dB ダイナミックレンジ | 音声/音楽 | IT用語辞典 | 日立ソリューションズによると FM放送のダイナミックレンジは 60 dB 程度なので、 換算ビット深度は 60 dB ÷ 48 dB × 8 bit = 10 bit サンプリング周波数 FM放送の仕組み によるとFM放送は15 kHzで制限しているので、 換算サンプリング周波数は 15 kHz × 2 = 30 kHz ビットレート FM放送はステレオなので、 換算ビットレートは 10 bit × 30000 Hz × 2 = 600000 bit/秒 = 600 kbps (あく

    FMラジオ放送の音質(ビットレート換算) - アマチュアSEのメモ書き
    otori334
    otori334 2021/07/18
    “もし仮にFM放送を録音したい場合は無圧縮で16bit/32kHzあれば十分”
  • リミッター (音響機器) - Wikipedia

    ラックマウントされた各種Limiter/Compressor Manley Mastering SLAM Stereo Mastering LimiterとStereo Variable Mu Limiter/Compressor dbx 160XT Limiter/Compressor Millennia TCL-2 Twin Topology Opto-Limiter/Compressor リミッター(英: Limiter)は音の強弱差を一定範囲に限定するダイナミクス系エフェクターの一種である。 入力音量が予め設定された閾値を超えた場合に、その変化を設定した比率(レシオ、レイシオ、圧縮比)で減少させて、ピークのばらつきを一定範囲に抑える機材である。音量を一定のレベル以下に抑える(過大入力が起こらないようにする)ことを目的としてリミッターを入れる。圧縮比を∞:1に設定することもある[1]

    リミッター (音響機器) - Wikipedia
    otori334
    otori334 2021/07/11
    “リミッターはコンプレッサーよりも、スレッショルドレベルを高く、圧縮比を大きく設定してあることが普通である”
  • 離散コサイン変換 - Wikipedia

    二次元DCTとDFTとの比較。左はスペクトル、右はヒストグラム。低周波域での相違を示すため、スペクトルは 1/4 だけ示してある。DCTでは、パワーのほとんどが低周波領域に集中していることがわかる。 離散コサイン変換(りさんコサインへんかん、英: discrete cosine transform、DCT)は、離散信号を周波数領域へ変換する方法の一つである。 DCTは、有限数列を、余弦関数数列 cos(nk) を基底とする一次結合(つまり、適切な周波数と振幅のコサインカーブの和)の係数に変換する。余弦関数は実数に対しては実数を返すので、実数列に対してはDCT係数も実数列となる。 これは、離散フーリエ変換 (DFT: discrete Fourier transform) が、実数に対しても複素数を返す exp(ink) を使うため、実数列に対しても複素数列となるのと大きな違いである。なお、

    離散コサイン変換 - Wikipedia
    otori334
    otori334 2021/07/09
    直流バイアスの拡張 “DCTはy軸で折り返して偶関数化してDFTすることと等価であり、実際にそう計算することが多い。”
  • ヴォコーダー - Wikipedia

    この項目では、音楽分野のヴォコーダーについて説明しています。音声信号処理分野のヴォコーダーについては「音声分析合成#ボコーダー」をご覧ください。 Korg VC-10 音楽におけるヴォコーダー(英: vocoder)は音の分解・要素の操作・再合成をおこなう電子楽器・エフェクター・シンセサイザーの一種である。ボコーダーとも。 概要[編集] 音声符号化・音声分析合成分野で「音を要素へ分解し再構成するシステム」として発展したボコーダーを「要素を操作して音作りをおこなう機材」として音楽分野へ転用したものが(稿で解説する)ヴォコーダーである。 ヴォコーダーにはチャネルヴォコーダーとフェーズボコーダがあり、これらは使用分野が異なる。音楽分野における昔ながらの「ヴォコーダー」エフェクトはチャネルヴォコーダーを指し、フェーズボコーダは「タイムストレッチ/ピッチシフト」に用いられる[1][2][3][4]

    ヴォコーダー - Wikipedia
  • AAC - Wikipedia

    Advanced Audio Coding(略称: AAC、先進的音響符号化)は、不可逆のデジタル音声圧縮を行う音声符号化規格のひとつである。1997年にISO/IEC JTC 1のMoving Picture Experts Group (MPEG) において規格化された。MP3の後継フォーマットとして策定され、一般的にAACは同程度のビットレートであればMP3より高い音声品質を実現している。 AACはISOとIECにより、MPEG-2およびMPEG-4仕様の一部として標準化された。MPEG-4 Audio内のHE-AACとして知られるAACの一部は、DAB+やDigital Radio Mondiale、モバイルテレビジョン規格のDVB-やATSC-M/Hのようなデジタル無線規格においても採用されている。 AACは一つのストリームに、48の全帯域幅(最大96kHz)音声チャンネルを持た

  • FFTとは? ~本当は正しくないFFTの周波数特性~

    エンジニアや理工系の人と話をしていると、FFT=周波数特性と勘違いしている人が大勢います。それも絶対に正しいと思っている人が居るんだけどそれは大間違いです。 なるべく数式を使わずに簡単にFFTとは何であるのかを解説します。 フーリエ変換とは フーリエ級数展開とは フーリエ変換やフーリエ級数展開の特徴 標化と量子化 離散フーリエ変換(DFT)とは 高速フーリエ変換(FFT)とは FFT(DFT)の質 どうしてFFTは正しくないのか (おまけ)スペクトル推定法と基底変換 (おまけ2)フーリエ変換の存在についての補足 参考リンク 関連記事 フーリエ変換とは フーリエ変換=FFTと思っている人も多いのですが、これも間違い。 フーリエ変換とは 無限に続く任意の連続信号(1次元)を、無限の周波数までのsin波とcos波の重ねあわせとして表現できる ことを利用してある任意の信号を、sin波とcos波

    FFTとは? ~本当は正しくないFFTの周波数特性~
  • 1