タグ

ブックマーク / ozalog.blogspot.com (3)

  • Coordination Service(ZooKeeper,etcd ,consul) の比較

    概要 最近,consul,etcd,ZooKeeper といった,いわゆる Coordination Service(この名前は ZooKeeper の論文から拝借した)の実装が頻繁に行われている.記事では,開発が盛んな背景を踏まえた上で,オープンソース実装の Coordination Service の比較を行う. Chubby から現在まで Paxos が Google の手によって Chubby という形で実用化された後,故障検出+分散合意アルゴリズムを用いた高可用KVSという組み合わせによる Coordination Service のオープンソース実装がいくつが出てきた.そのはしりが ZooKeeper である.ZooKeeper は Hadoop ファミリではデファクトスタンダードの Coordination Service であり,Hadoop を初めとして HBase,M

    yass
    yass 2014/08/01
    " etcd, consul は,Paxos ベースの分散合意アルゴリズムである Raft を利用しており,台数を増やしても書き込みも読み込みもスケールしない."
  • RCFile,Parquet,ORCFile

    この2ヶ月で,Cloudera/Twitter,Hortonworks からそれぞれ別の列指向ファイルフォーマットが公開されました.Parquet と ORCFile です. この記事では,まず RCFile の復習をして,その後 Parquet と ORCFile それぞれの共通点と違いをおおまかに見ていこうと思います.コードレベルの詳細な違いについては,次回以降で見ていきます. RCFile の復習 RCFile は Record Columnar File の略で,Hive から利用できるストレージフォーマットです.特に,HDFS や S3 といった分散ストレージ上でパフォーマンスがでるように設計されています. HDFS/S3 といったストレージでは,基的にデータを計算機間で同じ負荷になるようにデータを分散配置します.このため,従来の列指向ストレージフォーマットのように適当に列毎に

    yass
    yass 2013/03/18
    "index には各列のMin/Maxの値が入っており / データの読み飛ばしを効率的に行うための10000レコードごとのポインタ / footer には stripes の一覧と,型と行番号,Count, min, max, sum といった集計処理用"
  • Auto Commit Memory に関するメモ

    Fusion IO が,Auto Commit Memory という新技術のプレスリリースをした.プレスリリースによると,数十億 IOPS という驚異的な性能が出るということだが,PCI Express の Bus を介して毎回 commit しているとすると,明らかに物理性能を超えており,ホントにデータの永続化が保証されているか気になったのでメモしておく.根拠は全て書いているが,ところどころに私の予想が入っているため,正しさは保証できないので注意されたし. まず,数十億 IOPS を達成するには,PCI Express の bus を介していたら間に合わない.しかし,特殊なハードウェアを使っているわけではなく,プレスリリースには HP ProLiant DL 370 + ioDrive2 Duos を使っていると記述されている. (プレスリリースから引用 http://www.fusio

  • 1