NTTとプリファードインフラストラクチャー(PFI)は2011年10月26日、分散ソフトウエア基盤「Jubatus(ユバタス)」を開発したと発表した。Jubatusは大量データに対する機械学習などの高度な分析をリアルタイムで処理できるソフトウエア。10月27日からオープンソースソフトウエア(OSS)として公開する。 Jubatusは、発生したデータを複数のサーバーに振り分けて、リアルタイムに分析処理を行う。サーバー台数を増やすことで処理性能を向上するスケールアウト構成をとることができる。Jubatusの構成は、複合イベント処理(CEP)やストリーミング処理ソフトに似ている。しかし、CEPやストリーミング処理ソフトが、集計やパターンマッチングといった単純な処理のみを実行するのに対して、Jubatusは機械学習のような高度なデータ分析をリアルタイム処理できることが特徴だ。 機械学習とは、データ