タグ

cassandraとsstableに関するyassのブックマーク (2)

  • Cassandra導入事例と現場視点での苦労したポイント cassandra summit2014jpn

    え、まって。その並列分散処理、Kafkaのしくみでもできるの? Apache Kafkaの機能を利用した大規模ストリームデータの並列分散処理

    Cassandra導入事例と現場視点での苦労したポイント cassandra summit2014jpn
  • MemtableSSTable_JP - Cassandra Wiki

    Overview Cassandraの書き込みはまずコミットログ(CommitLog)に対して行われます。そしてColumnFamilyごとにMemtableと呼ばれる構造体に対して書き込まれます。Memtableは基的にキーで参照可能なデータ行のライトバックキャッシュです。つまりライトスルーキャッシュと違ってSSTableとしてディスクに書き込まれる前に、Memtableが一杯になるまで書き込まれます。 Flushing MemtableをSSTableへ変換するプロセスをフラッシュ(flushing)と呼びます。JMX経由で(例えばnodetoolを使用して)手動でフラッシュを実行することも可能です。コミットログのリプレイ時間を短くするためにノードを再起動する前に行った方が良いでしょう。Memtableはキーでソートされ、シーケンシャルに書き出されます。 したがって書き込みは超高速に

    yass
    yass 2013/09/21
    " Memtableのフラッシュ時のサイズと同じサイズから始まって、サイズが最大N倍になりながら階層的に形作 / 入力元となるSSTableはすべてキーでソートされているため、マージは効率良く行われランダムI/Oを必要としません "
  • 1