タグ

kyoto cabinetとネタに関するkgbuのブックマーク (1)

  • 開発メモ: MapReduce on Kyoto Cabinet

    Googleで実用化されHadoopで流行しているところの分散処理フレームワークMapReduceをKyoto Cabinetにおいても実現してみた。その解説。 ローカルなMapReduce MapReduceは多数のマシンが連携して分散処理を行うためのフレームワークなので、プロセス組み込みDBMであって分散など全く関係ない世界に生きているKCでMapReduceを実行して意味があるのだろうか。答えは、「あんまりない」である。それにもかかわらず実装したのは、何となく話題性がありそうだからってのが最大の理由なのだが、もうひとつ理由がある。 スクリプト言語で集計処理をやろうとすると、めっちゃメモリうしCPUパワーを使うわりに遅いからである。1000万件のソートってだけでスクリプト言語だと結構辛いからね。そこで、MapReduceフレームワークをC++で実装してmapとreduceだけをスクリ

    kgbu
    kgbu 2010/11/02
    スクリプト側でやるより高速だし効率もええよ。という話。KC側では分散はやってない。上位層でさらにreduceするなら分散可能だろうか<元データ分散は?気軽に試せてmap reduceに慣れる機会が増えるのはいいことかも。
  • 1