Wikipedia の本文データは、XML形式で公開されています。 (詳しい内容は、Wikipediaのダウンロードできるデータファイル一覧 | mwSoft が参考になります) これをデータベースに投入する手順として、xml2sqlを使う方法がよく紹介されていますが、Wikimedia では「これを使ったやり方は推奨しない」と明記されています。 かといって、importDump.php を使うには PHP 環境を用意しなくていけません。 なので、Java で動く MWDumper を使って jawiki-latest-pages-articles.xml.bz2 (Wikipedia の本文データ)を投入してみました。 ダウンロード データベース定義 (tables.sql) Wikipedia の本文データ (jawiki-latest-pages-articles.xml.bz2)