サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
アメリカ大統領選
galaxy.u-aizu.ac.jp
ツリーのデータ構造として、Barnes&Hut(1986)のFortranでの実装では、八分木をポインタ(のようなもの)で表現していた。この素直な実装は、ある節(以下cell/セル)の粒子が少ない場合には、効率が悪い。そこで、fully threaded treeという方法では、八分木の代わりに2つのポインタでツリーを表現できる。というのは、この論文とは関係ない背景知識で、この論文ではhashを使って直接ツリー構造を保持するという手法を提案している。ハッシュに使うキーはMortonキーと呼ばれる、三次元の粒子座標を一次元の値にマップしたものである。Mortonキーは、3 bitごとに区切られていて、八分木のある階層のどの三次元象限にいるかに対応しており、このキーが計算できると、簡単にツリー上の上の階層や下の階層のキーを計算できる。粒子の分布を一次元であらわすことができるのなら、これほどよい
OpenCLでSPH法のプログラムを実装し、様々なプロセッサで性能を比較している。 このSPHのプログラムは、 http://arxiv.org/abs/1112.4539 の論文で発表したGPUでの直接treewalkを拡張したもので、この論文のAppendixにある、OpenCL Cで書かれたコードがベースとなっている。我々の手法は、treewalkだけをGPUなりmulti core CPUで実行するというものであり、我々の意見ではこうするのが一番性能がでる。この論文は重力相互作用場合の性能評価をしているが、この方法の拡張で、SPHの近接相互作用の和を直接計算することができる。粒子をキャッシュにやさしい順番に並び替えるということも同じく効果的である。 さらに、現時点のコードでは、ホスト計算機でのtreeデータのconstructionを含めて、全体的に実装しなおして高速化した。これは
Fox, Williams, Messinaによる"Parallel Computing Works"(ISBN 1-55860-253-4 Morgan Kaufmann Publishers, Inc. 1994)の20章の訳を仮公開。 https://docs.google.com/document/edit?id=1EdAV8_bwZwjiWZi46PQztlP3H6u2rmdND7r41nuvyI0&hl=ja 20章だけでなく他の章も面白いので、大著で通読するのは大変だし古い内容もあるが、最初の数章は読むべき価値はあると思う。一年前に書いたCosmic Cubeも、実はC3Pの前にCaltechで実現されたものである。そこからはじまったであろうQCD用に計算機を「手作り」するという考え方は、現在でもQPACEに生きている。 以下、最近知った蛇足情報。天文のN体シミュレーションを
高速に計算するための様々な方法の研究 ハードウエア、ソフトウエアによる様々なアプローチで、数値計算・シミュレーションを加速する研究について 会津大学 コンピュータ理工学部 准教授 中里直人 Naohito NAKASATO, Assistant Professor, School of Computer Science and Engineering, University of Aizu CV.pdf nakasato@u-aizu.ac.jp 適応精度メニーコアコンパイラ Compiler_For_High_Performance_Computing_With_Many_Core_Accelerators XXXについて LLVMメモ GRAPE-DR GRAPE-DR model 450 : 使用方法まとめ Programming RV770/Cypress GPU How t
x2のボードは単純に2倍の性能 Stream Coreと呼ばれる単精度浮動小数点演算器が800個搭載されており、それぞれが単精度でMultiply-Addが可能なprocessorである。Stream Coreには2種類あり、片方は単純に単精度演算ができるStream Core(SC)で、他方は三角関数なども演算可能なT-Stream Core(T-SC)である。 4組のSCとひとつのT-SCが組になり、5 wayのVLIW processorを構成している。このThread Processor(TP)は、内部に128個(?)の128 bit汎用レジスタとその他一時レジスタなどをもつ(はず)。TPの命令実行には様々なパターンがあり、最大で5個の単精度または32 bit整数演算、あるいは4個の単精度/整数演算+1個の関数演算、あるいは2個の倍精度加算、または1個の倍精度乗算が実行できる。RV
このページを最初にブックマークしてみませんか?
『galaxy.u-aizu.ac.jp』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く