エントリーの編集
![loading...](https://b.st-hatena.com/bdefb8944296a0957e54cebcfefc25c4dcff9f5f/images/v4/public/common/loading@2x.gif)
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
SDPA のマルチスレッド化と numactl その3 - 最適化問題に対する超高速&安定計算
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
![アプリのスクリーンショット](https://b.st-hatena.com/bdefb8944296a0957e54cebcfefc25c4dcff9f5f/images/v4/public/entry/app-screenshot.png)
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
SDPA のマルチスレッド化と numactl その3 - 最適化問題に対する超高速&安定計算
次はその2のときと同様の実験を AMD Barcelona で行う。Barcelona は添付の図のように2次キャッシュが... 次はその2のときと同様の実験を AMD Barcelona で行う。Barcelona は添付の図のように2次キャッシュが各コア専用なので、複数のコアを共有しているのは3次キャッシュのみになっている。コア番号は左から 0, 1, 2, 3 という順番になっている。というわけで今度は 0,1 or 0,2 or 0.3 とすると3次キャッシュ共有での実行になる。0,4 とすると異なる CPU での実行になる。 CPU : Quad-Core AMD Opteron(tm) Processor 8356 問題名 theta6.dat-s A: 1 スレッド動作時; 1m43.614s B: 2 スレッド動作時; 1: numactl --physcpubind=0,1 ./sdpa.2 ~/src/sdplib/theta6.dat-s out 1m43.469s 2: numactl --p