Lecture The themes of this lecture are extracting information from (often messy) data, and the challenge of linking data together.
RDF Refine - a Google Refine extension for exporting RDF Main features Reconcile & interlink Reconcile against SPARQL endpoints, RDF dumps Search the Web for related RDF datasets Export RDF GUI for defining the shape of the RDF graph Use you own vocabulary or import existing ones Autocomplete for property and class names Download extension 0.8.0 Getting started… Make sure "extensions" folder exist
Using Google Refine to Clean a Data Set Google Refine is a cracking tool for tidying up data sets. It’s got oodles of features that make light work of massively messy data. Here I want to show, from start to finish, how to tidy a public data set and prepare it to be consumed by some other process. We want to structure it with one record per row, with clear headings and consistent and useful data.
Clean up Clean up your metadata and discover how to handle those embarrassing errors. Reconcile Match your metadata with controlled vocabularies connected to the Linked Data cloud. Entity extraction Even unstructured fields can provide meaning thanks to named entity extraction. Sustainable access Once your metadata is in shape, it is ready to be published in a sustainable way. Reaching out Freeing
Google Refineとは Metaweb社のFreebase Gridworksをベースに開発されたデータセットのクリーニング、解析、変換を行なうことができるオープンソースソフトウェアです。 インストールの方法 Google Refineは、インストールして自分のコンピュータ上で実行するデスクトップアプリケーションです。しかしながら、多くの他のデスクトップアプリケーションとは異なり、それが自分のコンピュータに小規模なWebサーバーとして実行され、Webブラウザ上でRefineに使用することができます。 ここからGoogle Refineをダウンロード MacOSX, Windows, LinuxのそれぞれのOSの指示に従ってインストール http://127.0.0.1:3333/にアクセス 開発版 開発版についてはこちらを参照 Google Refineはデータをクリーンナッ
Google Refine 2.0 http://code.google.com/p/google-refine/ Googleのデータクレンジングツール。ローカルwebサーバーで動作するアプリである。なぜローカルで動作するwebサーバにしているかというと、それには理由があるのだ。ほんと、ビックリ。 公開しているデータはタイトルやデータ形式がマチマチで、それを自分のところで統計解析するには、データレンジングをかなりやらなければいけなかった。そのためには、いままでgrepだとかfindだとかのコマンドやPythonスクリプトで半狂乱になって汚れ落としをしていたけれど、このGoogle Refineを使うとそういう問題がアホみたいに簡単に解決する。 例えば、カテゴリカルデータがセルに割り当てられているとする。記入者によってそれが略語だったりフルの名称だったりマチマチである。これを全て一つの文字
This project adds a graphical user interface(GUI) for exporting data of Google Refine projects in RDF format. The export is based on mapping the data to a template graph using the GUI. You need to have Google Refine (version 2.0 or later) installed on you machine (see download page) If not exists, create a folder named extensions under your user workspace directory for Google Refine. The latter sh
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く