millfiのブックマーク / 2023年2月3日

millfi id:millfi

2023年2月3日のブックマーク (1件)

Ryzen 9 7950XおよびApple M1 Maxの内積計算速度について - Qiita
背景最近Ryzen 9 7950xを載せたPCを作ったのですが思ったより数値計算の速度が出なかったので、よく出てくる基本的な演算性能を調べてみました。今回は巨大なベクトルの内積の計算速度を対象とします。なお筆者はHigh-performance computingの専門家ではないので以下には間違いが含まれているかもしれません。測定対象 10億次元のベクトルの内積を倍精度で計算する以下のプログラムの計算速度を測ります。特にOpenMPを用いた並列化のよりどの程度速くなるかを主眼としています。 #include <vector> #include <iostream> #include <omp.h> #include <chrono> #include <ios> #include <iomanip> template<typename RealType> void vec_inner_
millfi 2023/02/03
M1 Maxのメモリ帯域の公称値は多分GPU側の数字で、CPUだとこの記事の通り100GB/sしか出ない。Ultraでも200GB/s止まりなんじゃないかな。Ryzenは帯域が狭い代わりにレイテンシが小さい。(LPDDR系とDDR系の特性?)(M1 Maxが110ns、7950Xが85ns)
リンク
- 2023年2月4日
- 2023年2月3日
- 2023年2月1日