■概要 ひょんな事から、sqliteでの全文検索について調べました。 すると全文検索用に、fts3/4指定ができる事を発見したのですが、予想通り"スペース"での、単語区切りしかできないようです。 日本語を処理したかったので、自分でn-gramしたデータを登録してテストしてみました。 確かに高速に検索できます。 ※ MeCabを利用したtokenizerとかはandroidでの利用を考え考察していません。 ■テストデータ 郵便番号データを下記からダウンロードしました。 http://www.post.japanpost.jp/zipcode/dl/kogaki.html 全国版データを利用しました。 ちなみにcentos6.xではlhaコマンドを入手できなかったので、http://d.hatena.ne.jp/pcmaster/20100211/p3 を参考にインストールしました。 $ lh