タグ

ブックマーク / pekeq.hatenablog.com (2)

  • 分散ストレージについて再び(6) - pekeqのブログ

    LustreでもAFSでもないと思って探した結果、見つけたのがGfarmだった。これはかなりすてきな分散ファイルシステムで、なぜこれがこんなに知られていないのかさっぱりわからない。どこかのメジャーな技術系ブロガーが記事一書けばブレイクするんじゃないかと思う。ぼくのブログじゃ無理だ。 メタデータサーバとストレージノードが分かれたアーキテクチャ メタデータサーバはPostgreSQLで動く メタデータキャッシュサーバを立てることができ、メタデータサーバの負荷が高まらないようにできる(!) レプリケーション可能。しかもファイル単位で設定できる(!!!) 巨大なファイルを複数ノードに分散させることも可能 分散処理コマンドが豊富。gfgrepなんてもうシビれる 並列分散処理のための基盤としても使うことができる などなど、すてきな機能が盛りだくさん 詳しくはGfarm Workshopのページに資料

    分散ストレージについて再び(6) - pekeqのブログ
    kdaiba
    kdaiba 2007/02/16
    GFSに近いそうな
  • グーグル技術講演会 - pekeqのブログ

    日行われた「グーグル技術講演会」に行ってきた。MapReduceやSawzallの話は、Googleが公開しているpaper以上の内容ではなかった感じ。それ以外で記憶に残ったのはこんなところでした。 ノード 何千台の2CPU 2-4GBmem x86 PC GbE ローカルIDE HDD(あんまりローカルF/Sにはアクセスしない) インフラ MapReduce Sawzall Protocol Buffer (Sawzall論文のPDF5ページ目 後半) GFS Work Queue BigTable MapReduceを利用して、保管されているWebページ全体に対してとあるクエリーを投げ、終わるまでに半日かからない Googleエンジニアは、社内で利用しているソフトウェアのソースコードに自由にアクセスできる 一方で、データは扱えるレベルがあって、たとえば(アクセスログに記録された)I

    グーグル技術講演会 - pekeqのブログ
    kdaiba
    kdaiba 2006/03/15
    この計算能力が魅力的
  • 1