タグ

ブックマーク / maropu.hatenadiary.org (3)

  • pg_strom on multi-GPUs - maropuのメモ墓場

    この前GPUを使ってPostgreSQLの参照性能を向上を図る 外部モジュールpg_stromがkaigai氏からreleaseされた. このモジュールは9.0からPGにmergeされ,9.1でwhere句の push-downにも対応したFDW(Foreign Data Wrapper)という 外部接続用のIFを使って実装されている(詳細は以下参照). blog: http://d.hatena.ne.jp/kaigai/20120106 github: https://github.com/kaigai/pg_strom 最近のDB研究やOSS(PostgreSQLに限らず)界隈では,CPUの コア数増加への対応や,GPU/MICなどのコプロセッサの 活用のための議論が盛んで,pg_stromも同様の位置付けだ. 当人曰く年末年始でコーディングしたらしいが,コード自体は 素晴らしく非常

    pg_strom on multi-GPUs - maropuのメモ墓場
    mooz
    mooz 2012/01/14
    ラウンドロビンで pgstorm をマルチ GPU に対応。考察。
  • 単体マシン(x86/x64)における最速sort algorithmは何か? - maropuのメモ墓場

    今日はsortの日なのでしょうか・・・ twitterのタイムラインを眺めていると,tim-sortというalgorithmが話題のようです. quick sortよりも高速でmerge sortのように安定しているソートアルゴリズムtim sort http://d.hatena.ne.jp/gfx/20111019/1318981818 単体マシン(x86/x64)における高速なsort algorithmの研究はIntelが近年行っていて,有名な実装だとbufferingを利用したradix-sort実装と,SIMDを利用したmerge-sort(bitonic-sort)実装があります. 1. radix-sort: Fast Sort on CPUs and GPUs: A Case for Bandwidth Oblivious SIMD Sort, SIGMOD'10, ht

    単体マシン(x86/x64)における最速sort algorithmは何か? - maropuのメモ墓場
  • CPU内キャッシュ効率とベクトル演算(SIMD)を利用した計算密度向上のための2分木構築 - maropuのメモ墓場

    最近、現実逃避でやっていた作業結果のメモ. SIGMOD'10のintel lab.論文の内容を実際に自分でプログラムして、評価してみた. 2000年以降DB研究界隈では、データ領域が全てメモリ上に載る環境を前提としたボトルネック分析/改善提案を積極的に行っていて、最近は特にその傾向が強い. 今後の研究作業の役に立つだろうと思い、上の論文を題材にoprofileを使ってCPU内処理分析をやってみた(ノウハウ獲得のために).oprofileを使うと、xxstat系では分からない、CPU使用率の内訳を取得することができる. 参考論文は以下. http://portal.acm.org/citation.cfm?id=1807167.1807206 論文内では、簡単にいえば以下3点を行っている. 1. ポインタを利用した2分木実装ではノード移動毎にCache/TLBミスが発生し、CPU内処理がス

    CPU内キャッシュ効率とベクトル演算(SIMD)を利用した計算密度向上のための2分木構築 - maropuのメモ墓場
    mooz
    mooz 2011/08/04
    "2000年以降DB研究界隈では、データ領域が全てメモリ上に載る環境を前提としたボトルネック分析/改善提案を積極的に行っていて、最近は特にその傾向が強い"
  • 1