タグ

bigtableに関するteahutのブックマーク (7)

  • Principles and Guidelines for an Optimized Use of BigTable

    teahut
    teahut 2008/06/01
    >後で必要な計算結果は事前に行って格納, データ構造はModelのコードとして表現, 小さな属性は独立したレコードではなくカラムを追加して格納する, 更新は高くつくのでバッチで, counterのような共有リソースはよくない
  • Hypertable Lead Discusses Hadoop and Distributed Databases

    InfoQ Software Architects' Newsletter A monthly overview of things you need to know as an architect or aspiring architect. View an example

    Hypertable Lead Discusses Hadoop and Distributed Databases
    teahut
    teahut 2008/04/05
    HBaseから分裂したのはC++(Hypertable)とJavaの選択が原因.オフライン計算向けなHadoopがHypertableに適すのかという興味深い問い?に対する答えは的外れ (Hypertableはオフライン計算後の多数の小さな結果を格納するとのこと).
  • TechCrunch Japanese アーカイブ » Googleが巨大データベース「BigTable」をウェブサービスとして公開か?

    TechCrunch Japanese アーカイブ » Googleが巨大データベース「BigTable」をウェブサービスとして公開か?
    teahut
    teahut 2008/04/05
    >この非リレーショナルなシステムは、膨大なデータ量に超高速でアクセスしなくてはならないグーグルならではの特殊ニーズを満たすようデザインされた(毎秒数百万件もの読み取り・書き込みを処理している)
  • GoogleのBigTableの特長の1つはエンジンとストレージが疎結合であること - llameradaの日記

    GoogleのBigTableの特長の1つはエンジンとストレージが疎結合であることである。 MySQLやPostgreSQLではSQLクエリを受け付けるマシン(エンジン)と、実際にデータを格納するマシン(ストレージ)は同じである。つまり、エンジンとストレージが密結合である。 エンジンとストレージが密結合である利点は、ストレージへのアクセスが、ネットワーク越しの場合に比べて高速なことである。 しかし、この利点は薄れつつある。ディスクへのアクセスはメモリへのアクセスに比べれば遥かに低速である。そのため、ストレージをメモリにキャッシュして運用することが多い。そして、常にストレージをメモリにキャッシュするならば、ストレージがローカルディスクにあるが、ネットワーク越しの別マシンにあろうが大差ない。必要に応じてメモリに読み込むだけである。 GoogleのBigTableではストレージはGFS上に格納さ

    GoogleのBigTableの特長の1つはエンジンとストレージが疎結合であること - llameradaの日記
    teahut
    teahut 2008/02/28
    >常にストレージをメモリにキャッシュするならば、ローカルディスクかネットワーク越しか,大差ない... BigTableではストレージはGFS上に格納される... エンジンと別の複数のサーバにレプリケーションされて保存される
  • カイハツニッキ(2008-02-12)

    _ [ソフトウェア] hadoop + hypertable 先日話題になっていたHypertableなのですが、まさにこういうものが欲しいなー、と思ってflaredとかを作り始めてみたわけなので興味津々眺めてみました...。そのうち4台くらいに入れて負荷かけてみたいのですがまだちょっと時間が取れないのでまずはドキュメントを眺めてみました。 そもそもHypertableができること、というのはよくある(?)key-value分散ストレージです(が、単純にkeyからvalueを引くというオペレーションよりは複雑あるいは細かい処理が可能なようです)。 そのHypertableは、Range Serverとよばれる実際のデータを格納するn個のサーバプロセスと、Master Serverとよばれる1つのコントロールプロセス、そしてHyperspaceというn + 2個のプロセスによって成り立つのだ

    teahut
    teahut 2008/02/13
    >Range Serverというデータを格納するnのプロセス、Master Serverという1つのコントロールプロセス、Hyperspaceというn+2のプロセス... Master以外にもHyperspaceを通じてMETADATAにアクセスしてkey-Range Serverを取得... 分散や冗長化はDFSレイヤ
  • Googleの誇る巨大データベースBigTableのオープンソースクローン「Hypertable」

    Googleのあの巨大な検索システムなどを支えるデータベース「BigTable」は書き込みが毎秒700MB、読み込みが毎秒18GBという化け物システムなのですが、それのクローンを作るプロジェクト「Hypertable」というのがあるようです。既にバージョンが今年の2月4日に「0.9 Alpha」まで到達しており、超巨大な分散データベースを考えている人々から注目されているようです。 詳細は以下から。 Hypertable: An Open Source, High Performance, Scalable Database http://www.hypertable.org/ ダウンロードは以下から。同梱されているテキストファイルにインストール方法などが記されています。 Download Hypertable 実際のテスト結果などは以下に書いてあります。 PerformanceTestAO

    Googleの誇る巨大データベースBigTableのオープンソースクローン「Hypertable」
    teahut
    teahut 2008/02/08
    >AOLの検索データセット2800万行を使った実験結果では、1ノードあたり毎秒7MBの書き込み速度をマークし、一度読み込んでロードしたデータを再読込する際には毎秒100万セルほどの速度が出たそうです。
  • Bigtable: A Distributed Storage System for Structured Data - steps to phantasien t(2006-09-11)

    2006-09-11 近況 今月は貧乏なので慎しく暮らしている. 週末もひきこもりとしてオンラインの記事を読んで過ごすことに. ウェブを眺めているといいタイミングで Google の新作論文が出ていた. ありがとう, Google の中の人. これ. GFS, MapReduce, Sawzall とつづく Google インフラ N 部作の 4 章が幕をあげた. 実はデータベースも作ってるんだぜ, という話. BigTable という名前だけは以前から O'Reilly Radar などに登場していた. ようやく公式な文書があらわれた. BigTable は GFS をはじめとする Google インフラの上に作られた分散データベース. 少し変わったデータモデルと, 運用までワンセットのヘビーな実装を持つ. 実装の話もまあ面白いんだけれど, それよりデータモデルが印象的だった. 先にその

    teahut
    teahut 2007/12/26
    >BigTable は一風変わった Google 謹製分散 DB だよ, join がないかわりに多次元で任意長データを保存できる, バージョン管理も組込みで用意, Google Analytics, Google Earth, Personalized Search
  • 1