エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント1件
- 注目コメント
- 新着コメント
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
126. Xeon におけるノード内MPI性能 (2015/4/30)
126. Xeon におけるノード内MPI性能 (2015/4/30) 某プログラム、というか、単に独立時間刻みで 1000粒子... 126. Xeon におけるノード内MPI性能 (2015/4/30) 某プログラム、というか、単に独立時間刻みで 1000粒子くらいの N体系を積分するものを、Xeon 2 ソケットとかのノード内並列で なるべく速くしたい(ノード間でもいいのですがどうせ速くならないだろうみ たいな)ということが研究上あって、少し OpenMP をいじっていたのですが、 OpenMP の同期等のオーバーヘッドが巨大で、普通に書いたのではなかなか 速くならない、ということがわかってきました。 独立時間刻みのプログラムは以下のような構造をしています。 次の時刻と、そこで積分する粒子群を決める(アクティブ粒子) 全粒子のその時刻での位置を予測する 全粒子からアクティブ粒子への力を計算する 計算した力を使って、アクティブ粒子をアップデートする 1 へ戻る 計算量のほとんどはステップ2,3なので、ここは並列化も S
2015/05/04 リンク