国立国会図書館では、10月に、デジタル化した図書、雑誌、新聞、古典籍資料約34万点のデータを追加提供します。 これにより、国立国会図書館内で提供するデジタル化資料の総数は、約137万点となります。 今回新たに提供する資料、URL等は次のとおりです。 資料 提供開始日 点数(うちインターネット提供数) 提供URL 古典籍資料
Google Refine 2.0 http://code.google.com/p/google-refine/ Googleのデータクレンジングツール。ローカルwebサーバーで動作するアプリである。なぜローカルで動作するwebサーバにしているかというと、それには理由があるのだ。ほんと、ビックリ。 公開しているデータはタイトルやデータ形式がマチマチで、それを自分のところで統計解析するには、データレンジングをかなりやらなければいけなかった。そのためには、いままでgrepだとかfindだとかのコマンドやPythonスクリプトで半狂乱になって汚れ落としをしていたけれど、このGoogle Refineを使うとそういう問題がアホみたいに簡単に解決する。 例えば、カテゴリカルデータがセルに割り当てられているとする。記入者によってそれが略語だったりフルの名称だったりマチマチである。これを全て一つの文字
Clean up Clean up your metadata and discover how to handle those embarrassing errors. Reconcile Match your metadata with controlled vocabularies connected to the Linked Data cloud. Entity extraction Even unstructured fields can provide meaning thanks to named entity extraction. Sustainable access Once your metadata is in shape, it is ready to be published in a sustainable way. Reaching out Freeing
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く