タグ

SIMDに関するal001のブックマーク (1)

  • ./note008.html

    7. SSE の限界(2005/12/23) 1スレッドの性能を極端に落とさずに演算器の数を増やすには色々なアプロー チがありえますが、実際に採用されているのは SIMD 拡張命令 ヘテロジニアス・マルチコア のどちらかです。ヘテロジニアス・マルチコアのことはまた後で触れることに して、ここでは SIMD 拡張のことを考えてみます。 現在では SIMD 拡張としてもっとも広く知られているのは Intex IA32 (x86-64 となってこの名前もなんだか座りが悪い)の SSE/SSE2/SSE3 でしょう。 これは、基的には 128 ビット幅のレジスタを 8 (x86-64 では16だだったよ うな)ワード用意して、それを 32ビット単精度 4 語あるいは 64 ビット倍精 度 2 語の固定長ベクトルとみなし、その各要素に同じ演算をする命令を用意 する、というものです。 ソフトウェアの

  • 1