最近、現実逃避でやっていた作業結果のメモ. SIGMOD'10のintel lab.論文の内容を実際に自分でプログラムして、評価してみた. 2000年以降DB研究界隈では、データ領域が全てメモリ上に載る環境を前提としたボトルネック分析/改善提案を積極的に行っていて、最近は特にその傾向が強い. 今後の研究作業の役に立つだろうと思い、上の論文を題材にoprofileを使ってCPU内処理分析をやってみた(ノウハウ獲得のために).oprofileを使うと、xxstat系では分からない、CPU使用率の内訳を取得することができる. 参考論文は以下. http://portal.acm.org/citation.cfm?id=1807167.1807206 論文内では、簡単にいえば以下3点を行っている. 1. ポインタを利用した2分木実装ではノード移動毎にCache/TLBミスが発生し、CPU内処理がス
![CPU内キャッシュ効率とベクトル演算(SIMD)を利用した計算密度向上のための2分木構築 - maropuのメモ墓場](https://cdn-ak-scissors.b.st-hatena.com/image/square/85e7d8901b72f5de6dc2d138bcac9fe7fdeb7cdf/height=288;version=1;width=512/https%3A%2F%2Fcdn-ak.f.st-hatena.com%2Fimages%2Ffotolife%2Fm%2Fmaropu%2F20100828%2F20100828201958.jpg)