タグ

wikipediaに関するbiochem_fanのブックマーク (2)

  • Wikipediaのダウンロードできるデータファイル一覧 | mwSoft

    概要 記事はWikipediaのダウンロード可能なデータについてまとめたものです。 Wikipediaではクロール行為は禁止されています(ここを見る限りでは)が、代わりに全記事の情報を圧縮したファイルが公開されています。 日Wikipedia情報ダウンロードページ http://download.wikimedia.org/jawiki/latest/ 記事は2009年の10月下旬に取得した情報を元に書いています。時間が経つと結果が変わる可能性があるのでご注意ください。 事前情報 2009/10/25に確認した時点では、日Wikipediaのダウンロードページには55個のファイルが置いてありました(うち半分は更新を通知する為のRSS)。 ファイルの形式は「XML」、「MySQLのダンプ」、「テキスト」などがあります。 詳しいデータのインポート方法は、こちらのリンク集が参考になる

    biochem_fan
    biochem_fan 2013/02/16
    Wikipedia の SQL ダンプの各ファイルの内容
  • Wikipedia-Lab

    Wikipedia研究所は、Wikipediaのダイナミクスの解析やコンテンツ解析を行う研究グループです。 このWebサイトでは、Wikipediaマイニング研究のためのリソースを配信していく予定です。 これからWikipedia研究を始める方の情報共有の場になれば幸いです。 人工知能学会の近未来チャレンジにて,サバイバルが決定しました!詳しくは近未来チャレンジのページを御覧ください. Wikipedia APIJavaに対応しました. 第一回Wikipediaワークショップを開催します! Silverlight 2で開発したWikipediaシソーラスの可視化プログラムを公開しました. 新しいアプローチでのWikipediaシソーラスの構築方法に関する論文がCIKM 2008にて採録されました. Wikimania 2008にWikipediaマイニングに関する論文が採録されました.

  • 1