タグ
最近全文検索エンジンLudia(1.4.0)を触る機会を得た。LudiaはSennaのPostgreSQLバインディングである(念のため)。 Ludiaでのクエリーは、演算子@@を使ったSQLを投げればいいだけの簡単操作である。 たとえば次の例はauction_itemというテーブルのdescriptio... 続きを読む
Lucene本の6章では、TermFreqVectorを使って、ブッシュ大統領の就任演説や小泉純一郎首相(当時)の所信表明演説の単語の出現頻度分析を行うプログラムを紹介した。そのプログラムでは「ごみ」を取り除くために「3文字以下のひらがな」を一律に切り捨てていた。... 続きを読む

