タグ

avxとhaswellに関するyassのブックマーク (2)

  • HPC性能が大幅に強化されたHaswell(前編) -各コアに256bit長のFMAを2個装備

    IDF 2012で、2013年に登場と見られるIntelの次世代プロセサ「Haswell」のアーキテクチャが発表された。Haswellのアーキテクチャ全般については大原雄介氏の記事を参照戴くのが分かり易いと思うが、それを補足する意味で、HPC(High Performance Computing)向けの強化ポイントについて詳細に見て行きたい。 Haswellで一番目に付くのは、各コアに256bit長(64bit×4)のFMA演算器を2個装備し、1サイクルに倍精度の浮動小数点演算を16回実行できるようにした点である。また、32bitの単精度浮動小数点なら32回の演算を実行できる。 「京」スパコンに使われている「SPARC64 VIIIfx」とその後継の「SPARC64 IXfx」のコアは8演算、2012年6月にTop500 1位となった「Sequoia」に使われている「BlueGene/Q(

    HPC性能が大幅に強化されたHaswell(前編) -各コアに256bit長のFMAを2個装備
    yass
    yass 2013/12/07
    "各コアに256bit長(64bit×4)のFMA演算器を2個装備し、1サイクルに倍精度の浮動小数点演算を16回実行 / ベクトルの内積 / Sum=Xi×Yi+Sumをi=0から順に計算 / この場合は(A×B)+CのCに結果を格納する必要があり、VFMADD231命令が使われる"
  • プログラマのためのHaswell入門 - 2013-06-02 - J

    (上の生データやらグラフを見て情報読み取れる人は読まなくてよいです) さて、世間のレビュー見てると、Haswellいらん子感があるけど、HaswellはIvyと比べて性能2倍になっている点はプログラム書く人は知っておくべきだと思う。 (IntelのCPUはCore2以降デスクトップ向け強化とサーバー/HPC向け強化を交互にやってる感があって、今回はHPC向けターンかなーという気がする) Haswellで性能出すために知っておくべきことなどを書いておく。 Haswellで強化された点 プログラム書く場合に考慮すべきHaswellの強化点は、 FMA命令が追加/FMULx1/FADDx1 が FMAx2 になった AVX2命令が追加 整数演算パイプ追加 TSX あたりかと思う。以下、それぞれどう意識すればいいか解説する。 (TSXは使えないCPUを選んでしまったので特に解説しません) FMA命

    プログラマのためのHaswell入門 - 2013-06-02 - J
    yass
    yass 2013/06/07
    "AVXは、浮動小数しか無くて整数系の人達はガッカリだったわけだが、Haswellで整数も256bitになった。"
  • 1