前回の記事にて、Wikipediaの全記事をMySQLにぶっこみました。しかし、あるカテゴリにおける全記事を取得したいときってどうするの?となったため、ごちゃごちゃいじったときのメモを残します。 Wikipediaデータをxml2sqlを利用しMySQLにぶっこむ Categoryリンクってのがあるらしい? 前回の記事でも紹介しましたが、Wikipediaの記事以外にも配布されているデータがあります。 その中で、categorylinksというカテゴリの情報がありそうなデータをみつけました。 http://www.mediawiki.org/wiki/MediaWiki/jaというWikipediaのデベロッパ向けのサイトによると、 The categorylinks table stores entries corresponding to links of the form [[Cat