米Clouderaは2015年9月28日(米国時間)、オープンソースソフトウエア(OSS)の分散処理ソフト「Hadoop」用の新しいストレージである「Kudu」をOSSとして公開した。データの分析処理とオンライン処理の両方の高速化を図ったことが特徴。 Kuduは、データウエアハウス(DWH)のストレージとして一般的な「カラム(列)ストア」だ。カラムストアはデータをロー(行)単位ではなくカラム(列)単位で扱うため、データの分析処理において頻繁に発生する「特定のカラム(列)に対するデータの読み出し」を高速化できる。 これまでも「Parquet」というソフトウエアを使用すると、Hadoopの標準ストレージである「HDFS」をカラムストアとして使用できた。しかしHDFSは、データのオンライン処理に向いていないという弱点があった。 HadoopにはHDFS以外にもう一つ、データのオンライン処理が高速
