元Appleの開発者Pete Warden氏は3月23日、大規模データ向けのデータ分析ツールプロジェクト「Data Science Toolkit」を発表した。複数のオープンソース技術やデータベースを組み合わせてREST/JSONインターフェイスで利用できるようにしたもので、即座に利用できるよう環境が構築された仮想マシンイメージが提供されている。 Data Science Toolkitは、大規模データセットの加工やデータ解析を自動化できるツール集。住所データベース「Geocoder」などのオープンなデータ集や、テキスト抽出ツール「Bilerpipe」などを組み合わせ、REST/JSONインターフェイスで利用できるようになっている。インターフェイスや各種コマンドラインツールはPythonとJavaScriptで構築されている。 Data Science Toolkitはカスタム化されたUb
![オープンソースの大規模データ向けデータ分析ツールセット「Data Science Toolkit」発表 | OSDN Magazine](https://cdn-ak-scissors.b.st-hatena.com/image/square/4196864a37518a8c4219cc80d90c0a0b1a82a491/height=288;version=1;width=512/https%3A%2F%2Fmag.osdn.jp%2Fimages%2Fmag%2Fmagazine-200x200.png)