PostgreSQL の全文検索機能で, 実際のテキストデータをゴニョゴニョしてみます. いわゆるやってみた系の記事です. クエリの効率とかそっちのけです. やること 口コミやアンケート形式のテキストデータに対して, 1. 出現単語の頻度を調べる 2. 文脈の傾向とその推移を調べる 学術研究用に livedoor グルメのデータが公開されているので, そちらを利用させていただきます. - livedoor グルメの DataSet を公開 使用するのは ratings.csv(評価データ) と restaurants.csv(店舗データ) です. textsearch_ja の準備 用意するもの textsearch_ja: 9.0.0 MeCab: 本体及び IPA 辞書 MeCab のインストール tar xf mecab-0.996.tar cd mecab-0.996 ./conf