米Googleは11月10日、データクリーニングツール「Google Refine 2.0」を公開した。一貫性のないデータセットのクリーニング、分析、フォーマット変換などができるという。Google Codeのプロジェクトページから入手できる。 Google Refineは、Googleが2010年7月に買収した米Metawebのオープンソースデータセットクリーニングツール「Freebase Gridworks」をベースとする。今回名称を変えてバージョン2.0として公開した。ライセンスは修正BSDライセンス。 同じ種類のデータに対しさまざまな用語を持つデータセット内の用語を統一するなど、一貫性のないデータをクリーニングできる。コード作成は不要で、容易にデータをソートできるという。 最新版は新しい拡張アーキテクチャを持ち、標準的な照合サービスにプラグインできる照合フレームワークを導入した。J
![米Google、データクリーニングツール「Google Refine 2.0」をリリース | OSDN Magazine](https://cdn-ak-scissors.b.st-hatena.com/image/square/4196864a37518a8c4219cc80d90c0a0b1a82a491/height=288;version=1;width=512/https%3A%2F%2Fmag.osdn.jp%2Fimages%2Fmag%2Fmagazine-200x200.png)