タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

wikipediaに関するrosiroのブックマーク (2)

  • Wikipediaのある特定カテゴリにおける記事をすべて取得する方法|Miningoo

    前回の記事にて、Wikipediaの全記事をMySQLにぶっこみました。しかし、あるカテゴリにおける全記事を取得したいときってどうするの?となったため、ごちゃごちゃいじったときのメモを残します。 Wikipediaデータをxml2sqlを利用しMySQLにぶっこむ Categoryリンクってのがあるらしい? 前回の記事でも紹介しましたが、Wikipediaの記事以外にも配布されているデータがあります。 その中で、categorylinksというカテゴリの情報がありそうなデータをみつけました。 http://www.mediawiki.org/wiki/MediaWiki/jaというWikipediaのデベロッパ向けのサイトによると、 The categorylinks table stores entries corresponding to links of the form [[Cat

    Wikipediaのある特定カテゴリにおける記事をすべて取得する方法|Miningoo
    rosiro
    rosiro 2020/03/09
    “mysql -u root -p wikipedia < jawiki-latest-categorylinks.sql ”
  • Wikipediaのダウンロードできるデータファイル一覧 | mwSoft

    概要 記事はWikipediaのダウンロード可能なデータについてまとめたものです。 Wikipediaではクロール行為は禁止されています(ここを見る限りでは)が、代わりに全記事の情報を圧縮したファイルが公開されています。 日Wikipedia情報ダウンロードページ http://download.wikimedia.org/jawiki/latest/ 記事は2009年の10月下旬に取得した情報を元に書いています。時間が経つと結果が変わる可能性があるのでご注意ください。 事前情報 2009/10/25に確認した時点では、日Wikipediaのダウンロードページには55個のファイルが置いてありました(うち半分は更新を通知する為のRSS)。 ファイルの形式は「XML」、「MySQLのダンプ」、「テキスト」などがあります。 詳しいデータのインポート方法は、こちらのリンク集が参考になる

  • 1