最近、「ビッグデータ」という言葉をよく耳にする。何を指す言葉なのかを調べようとWeb検索したところ、さまざまな定義が出てきた。どうやら、明確な定義はないようだ。共通しているのは、構造化データだけでなく非構造化データも対象にしていることと、データ量が膨大であること。ある記事によれば、データ容量はペタバイト級になるらしい。 筆者は新たな言葉が出てきたとき、その言葉のマーケティング要素を取り除き、できるだけ技術そのものを見ようと努める。その視点でビッグデータを見てみる。なお、この記事で取り上げるビッグデータは、膨大な量の構造化データと非構造化データという意味にとどめ、ストレージレイヤーに絞って話を進めたい。 並列DB技術を超えるものとは? 最初は、「何だ、大容量ということなら、ディスク装置を並べれば済む話じゃないか」と思った。だがよく考えると、最近登場した技術がないと大量データをうまく処理できな