先日11/5に行われた勉強会GLT vol.21 & HBase勉強会お疲れさまでした - tragicomedyでのHBaseについての質問の件。 同じColumn Familyのデータは物理的に近い場所に格納されることと、HRegionではデータをソートして格納しているが、そのこととどう関連しているのか?という疑問について調べたメモ。 Amazon CAPTCHAにもあるように、 Physically, all column family members are stored together on the filesystem. また、Hbase/HbaseArchitecture - Hadoop Wikiにも HBase stores column families physically close on disk, so the items in a given column