タグ

GoogleRefineに関するwara_beのブックマーク (2)

  • Google Refineの使い方 - KazusaWiki

    Google Refineとは Metaweb社のFreebase Gridworksをベースに開発されたデータセットのクリーニング、解析、変換を行なうことができるオープンソースソフトウェアです。 インストールの方法 Google Refineは、インストールして自分のコンピュータ上で実行するデスクトップアプリケーションです。しかしながら、多くの他のデスクトップアプリケーションとは異なり、それが自分のコンピュータに小規模なWebサーバーとして実行され、Webブラウザ上でRefineに使用することができます。 ここからGoogle Refineをダウンロード MacOSX, Windows, LinuxのそれぞれのOSの指示に従ってインストール http://127.0.0.1:3333/にアクセス 開発版 開発版についてはこちらを参照 Google Refineはデータをクリーンナッ

  • Google Refineは神ツールである | wrong, rogue and log

    Google Refine 2.0 http://code.google.com/p/google-refine/ Googleのデータクレンジングツール。ローカルwebサーバーで動作するアプリである。なぜローカルで動作するwebサーバにしているかというと、それには理由があるのだ。ほんと、ビックリ。 公開しているデータはタイトルやデータ形式がマチマチで、それを自分のところで統計解析するには、データレンジングをかなりやらなければいけなかった。そのためには、いままでgrepだとかfindだとかのコマンドやPythonスクリプトで半狂乱になって汚れ落としをしていたけれど、このGoogle Refineを使うとそういう問題がアホみたいに簡単に解決する。 例えば、カテゴリカルデータがセルに割り当てられているとする。記入者によってそれが略語だったりフルの名称だったりマチマチである。これを全て一つの文字

    Google Refineは神ツールである | wrong, rogue and log
  • 1