タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

NLPとPostgreSQLに関するYasSoのブックマーク (2)

  • [PostgreSQLウォッチ]第32回 PostgreSQL 8.2の全文検索機能

    8.2の正式リリース時期は? 現在β3までリリースされているPostgreSQL 8.2の正式版のリリース時期だが,この記事を執筆している時点では12月5日とされている。少し早めのクリスマスプレゼントという感じのリリースになりそうだ。楽しみにしておこう。 GIN再び PostgreSQLウォッチ第30回ではPostgreSQL 8.2の追加機能について報告した。今回は,そのとき取り上げた汎用転置インデックスGINに関する追加調査結果を報告する。 GINを使うと今まで不可能だった,データベース中のテキストのインデックスを使った高速な全文検索が可能であることは既に報告したとおりだ。しかし,その後しばらく使ってみると,いくつか問題点が見つかった。 (1) 重複した単語が登録されるので無駄 (2) 大きなテキストでは,データ登録に時間がかかるだけでなく,メモリーを消費する (1)に関してはGINに

    [PostgreSQLウォッチ]第32回 PostgreSQL 8.2の全文検索機能
  • plotless: UTF-8での全文検索メモ(PostgreSQL + Tsearch2 + MeCab 編)

    慣れない perl に苦戦しているわけですが、"Bad free() ignored (PERL_CORE)" って警告が出てくる原因がイマイチわかりません…。 perl5.8を入れ直してみようかとportsでコンパイルするとエラーが出るようになるし…。困ったなぁ…。 で、それとは関係なくポスグレのTsearch2 + MeCabを使った全文検索の仕方を忘れないようにメモメモ。 参考にしたのは以下のページ。 https://www.oss.ecl.ntt.co.jp/tsearch2j/index.html http://www.emaki.minidns.net/Programming/postgres/index.html --- 環境 ・FreeBSD 5.4 ・PostgreSQL 7.4.13 インストール済み (/usr/ports/databases/postg

  • 1