変換環境は前回と変わらずです。元データは、9月27日版を使用しました。変化ツールは、Kazuhiro's blogさんからwikipedia-fpw-20090831-src.tar.gzを入手して使用しました。今回は読み(ひらがな)で検索できるようになりました。収録項目数とサイズは以下のとおり、圧縮後はEBwin 3.03付属のEBShrinkでレベル5圧縮したデータです。 エントリー数 1216511 honmon 2498844672Byte honmon(shrink) 1079081341Byte wikipedia-fpw.confの設定(抜粋) # 0にすると相互参照が無効になります。 # 1にすると相互参照が有効になります。 # 2にすると1ぺージ内からの参照先がユニークなもののみ有効にします。 # 'enable_reference' => 1, # # 0 に