タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

OSSとデータに関するstibbarのブックマーク (1)

  • 米Google、データクリーニングツール「Google Refine 2.0」をリリース | OSDN Magazine

    Googleは11月10日、データクリーニングツール「Google Refine 2.0」を公開した。一貫性のないデータセットのクリーニング、分析、フォーマット変換などができるという。Google Codeのプロジェクトページから入手できる。 Google Refineは、Googleが2010年7月に買収した米Metawebのオープンソースデータセットクリーニングツール「Freebase Gridworks」をベースとする。今回名称を変えてバージョン2.0として公開した。ライセンスは修正BSDライセンス。 同じ種類のデータに対しさまざまな用語を持つデータセット内の用語を統一するなど、一貫性のないデータをクリーニングできる。コード作成は不要で、容易にデータをソートできるという。 最新版は新しい拡張アーキテクチャを持ち、標準的な照合サービスにプラグインできる照合フレームワークを導入した。J

    米Google、データクリーニングツール「Google Refine 2.0」をリリース | OSDN Magazine
    stibbar
    stibbar 2010/11/20
    すごいな、Google。いろいろな意味で。
  • 1