2023年2月4日のブックマーク (1件)

  • Ryzen 9 7950XおよびApple M1 Maxの内積計算速度について - Qiita

    背景 最近Ryzen 9 7950xを載せたPCを作ったのですが思ったより数値計算の速度が出なかったので、よく出てくる基的な演算性能を調べてみました。今回は巨大なベクトルの内積の計算速度を対象とします。なお筆者はHigh-performance computingの専門家ではないので以下には間違いが含まれているかもしれません。 測定対象 10億次元のベクトルの内積を倍精度で計算する以下のプログラムの計算速度を測ります。特にOpenMPを用いた並列化のよりどの程度速くなるかを主眼としています。 #include <vector> #include <iostream> #include <omp.h> #include <chrono> #include <ios> #include <iomanip> template<typename RealType> void vec_inner_

    Ryzen 9 7950XおよびApple M1 Maxの内積計算速度について - Qiita
    forest1040
    forest1040 2023/02/04
    メモリ帯域で律速しているんだろうけどこれはこれで有用