elasticsearchの機能を試すように何かしらデータを入れてみたかったので、wikipediaのデータをelasticsearchに適当にインデックスしてみた。 wikipediaのデータセット wikipediaのデータセットは Wikipedia:データベースダウンロード - Wikipedia 辺りからダウンロードできる。いろんなデータがあるが、今回はhttp://dumps.wikimedia.org/jawiki/latest/ の中にあるpages-article1.xml.bz2辺りを利用する。 wikipediaデータのインデックス https://github.com/shibayu36/wikipedia-elasticsearch にサンプルを置いてある。 perlで適当に書いているので、最初にcarton installだけしておいてください。 elastic