タグ

2023年2月3日のブックマーク (1件)

  • Ryzen 9 7950XおよびApple M1 Maxの内積計算速度について - Qiita

    背景 最近Ryzen 9 7950xを載せたPCを作ったのですが思ったより数値計算の速度が出なかったので、よく出てくる基的な演算性能を調べてみました。今回は巨大なベクトルの内積の計算速度を対象とします。なお筆者はHigh-performance computingの専門家ではないので以下には間違いが含まれているかもしれません。 測定対象 10億次元のベクトルの内積を倍精度で計算する以下のプログラムの計算速度を測ります。特にOpenMPを用いた並列化のよりどの程度速くなるかを主眼としています。 #include <vector> #include <iostream> #include <omp.h> #include <chrono> #include <ios> #include <iomanip> template<typename RealType> void vec_inner_

    Ryzen 9 7950XおよびApple M1 Maxの内積計算速度について - Qiita
    millfi
    millfi 2023/02/03
    M1 Maxのメモリ帯域の公称値は多分GPU側の数字で、CPUだとこの記事の通り100GB/sしか出ない。Ultraでも200GB/s止まりなんじゃないかな。Ryzenは帯域が狭い代わりにレイテンシが小さい。(LPDDR系とDDR系の特性?)(M1 Maxが110ns、7950Xが85ns)