126. Xeon におけるノード内MPI性能 (2015/4/30)

学びカテゴリーの変更を依頼記事元:

jun-makino.sakura.ne.jp

4 usersがブックマークコメント

コメント

1

記事へのコメント1件

注目コメント
新着コメント

zu2 “126. Xeon におけるノード内MPI性能 (2015/4/30)”

2015/05/04 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

126. Xeon におけるノード内MPI性能 (2015/4/30)

126. Xeon におけるノード内MPI性能 (2015/4/30) 某プログラム、というか、単に独立時間刻みで 1000粒子... 126. Xeon におけるノード内MPI性能 (2015/4/30) 某プログラム、というか、単に独立時間刻みで 1000粒子くらいの N体系を積分するものを、Xeon 2 ソケットとかのノード内並列でなるべく速くしたい(ノード間でもいいのですがどうせ速くならないだろうみたいな)ということが研究上あって、少し OpenMP をいじっていたのですが、 OpenMP の同期等のオーバーヘッドが巨大で、普通に書いたのではなかなか速くならない、ということがわかってきました。独立時間刻みのプログラムは以下のような構造をしています。次の時刻と、そこで積分する粒子群を決める(アクティブ粒子) 全粒子のその時刻での位置を予測する全粒子からアクティブ粒子への力を計算する計算した力を使って、アクティブ粒子をアップデートする 1 へ戻る計算量のほとんどはステップ2,3なので、ここは並列化も S

あとで読む

ブックマークしたユーザー

MetaVariable2015/05/05
dowhile2015/05/05
fromAmbertoZen2015/05/04
zu22015/05/04

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - 学び

いま人気の記事 - 学びをもっと読む

新着記事 - 学び

新着記事 - 学びをもっと読む

設定を変更しましたx