タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

全文検索とPythonに関するtenten0213のブックマーク (2)

  • WhooshとMongoDBを使った全文検索Webアプリの構築 - その1

    ひょんなことから全文検索システムを作ることになり、いろいろ調べたことを備忘録的に記録しておく。 自分はいつもPython+Tornado+Nginx+MongoDBの構成でWebアプリを書いていて、この環境で手軽に全文検索ができたらいいなぁと思って試行錯誤した結果、稿のようなことができることが分かったので公開しました。 【やりたいこと】 ・全文検索(基的にN-gram。できれば記事内の単語を元に関連記事の表示や単語の編集など) ・主に.txtのファイル内のテキスト文を対象とする ・アカウントを発行して外部にも公開 (ここは記事の趣旨から外れるので除外する。) 【環境】 ・さくらVPS 2Core 1GBメモリ ・CentOS 6.2 ・Python 2.7.2 ・Tornado 2.4.1(フレームワーク) ・MongoDB 2.2.3(データベース) ・Nginx 1.2.6(W

  • pythonのwhooshで全文検索してみる - Blanktar

    全文検索、一度やってみたかったのよね。 whooshってのが手っ取り早そう。 という訳で、使ってみました。 Copy import os import whoosh.fields import whoosh.index import whoosh.qparser # ディレクトリをインデックスとして使うらしい。 # インデックスがすでにあるかどうかをチェック。 if os.path.exists('/tmp/index') # 既存のインデックスを開く ix = whoosh.index.open_dir('/tmp/index') else: # インデックスの構造を定義 schema = whoosh.fields.Schema( # IDはユニーク・・・ってわけでもないらしい。 # とりあえず、インデックス化はされないとのこと。 name=whoosh.fields.ID(store

    pythonのwhooshで全文検索してみる - Blanktar
  • 1