タグ

AVXとHaswellに関するakakitのブックマーク (1)

  • インテルCPU進化論 Haswellで導入されるCPUの改良 後編 (1/4)

    前回に引き続いて、今回も「Haswell」の詳細を解説する。まずは追加された「AVX2」命令から説明しよう。 HaswellでのAVXの強化 1サイクルで256bitの演算が可能に AVX2命令は、Sandy Bridge世代で投入された「AVX」命令の機能と性能を拡張するものである。大きなポイントは以下の3点だ。 性能が2倍 浮動小数点のFMA(Fused Multiply-Add)演算をサポート いくつかの新命令を搭載 まず性能が2倍の根拠はなにか。Sandy Bridge世代でのAVX演算は、既存のSSE用演算器を流用して実装されていた。SSEはご存知のとおり、1サイクルあたり最大128bitの演算を行なう(関連記事)。そのためAVX演算の場合は、128bitずつ2回に分けて演算を行なうことになっていた。 これに対してHaswellでは、SSE演算器がすべて拡張され、AVXにあわせて

    インテルCPU進化論 Haswellで導入されるCPUの改良 後編 (1/4)
  • 1