タグ

Techと積和演算に関するakakitのブックマーク (2)

  • インテルCPU進化論 Haswellで導入されるCPUの改良 後編 (1/4)

    前回に引き続いて、今回も「Haswell」の詳細を解説する。まずは追加された「AVX2」命令から説明しよう。 HaswellでのAVXの強化 1サイクルで256bitの演算が可能に AVX2命令は、Sandy Bridge世代で投入された「AVX」命令の機能と性能を拡張するものである。大きなポイントは以下の3点だ。 性能が2倍 浮動小数点のFMA(Fused Multiply-Add)演算をサポート いくつかの新命令を搭載 まず性能が2倍の根拠はなにか。Sandy Bridge世代でのAVX演算は、既存のSSE用演算器を流用して実装されていた。SSEはご存知のとおり、1サイクルあたり最大128bitの演算を行なう(関連記事)。そのためAVX演算の場合は、128bitずつ2回に分けて演算を行なうことになっていた。 これに対してHaswellでは、SSE演算器がすべて拡張され、AVXにあわせて

    インテルCPU進化論 Haswellで導入されるCPUの改良 後編 (1/4)
  • 積和演算 ‐ 通信用語の基礎知識

    DSPの得意とする処理であり、かつ信号処理では必須の処理となる。 積和演算は、式で書くと、次のようになる。 a ← b + (c × d) このままだと4項演算だが、aとbを同じにして3項演算とし、累算に特化した実装も多い。 a ← a + (b × c) 極めて単純明快な演算ではあるが、この演算速度が信号処理における最大の律速要因になり、信号処理速度そのものを決めてしまうので侮れない。 この積和演算速度を表わすために、MMACS(メガ積和演算/秒)やGMACS(ギガ積和演算/秒)といった単位も存在するほどである。 従って、全てのDSPには汎用のMPUにはない高速乗算器とともに積和演算器が搭載され、積和演算命令(MAC命令)が用意されている。これにより、ほぼ全てのDSPはこの演算を1命令サイクルで実行するのである。

  • 1