全文検索エンジンgroongaを囲む昼下がり@札幌はたっぷり3時間もあるので、「groongaがどのように動いているか」、「より効率的に検索するためにはどうしたらよいか」などといった話ができるはずです。 この文書は、札幌でのgroonga勉強会で使うための「groongaがどのように動いているか」を説明に使うための文書です。後でgroongaのドキュメントにマージする予定です。 それでは、groongaがどのように全文検索用のインデックスを作成しているかを説明します。まず、全文検索機能で重要なオブジェクトを説明して、その後にそれらを使ってどのようにインデックスを作成しているかを説明します。 主要オブジェクト groongaの全文検索機能で大事なオブジェクトは以下の3つです。 テーブル カラム トークナイザー それぞれ順に説明します。 テーブル groongaでは、ひとまとまりのデータを「レ
2011年07月10日12:09 全文検索 Groonga を使って perl で Google Suggest ならぬ Groonga Suggest を作る カテゴリ Tweet 前回もちょっと書いた全文検索 Groonga がすごい便利なので、そのことが少しでも伝わるように、 例によって日本郵便が提供してる郵便番号データを使って、Google Suggest 風の何かを作ってみました(伝わらないとか言わないで!)。あと Yappo さんがやられている優良バインディング案件が待ち遠しいです。 今回使うものは全部 https://github.com/wata/Groonga-Suggest に。 1. DBの作成作成するテーブル、カラムはこんな感じ。 table_create --name KEN_ALL --flags TABLE_HASH_KEY --key_type UInt32
groonga(単体サーバ)で大量のデータをロードする場合はファイルにloadコマンド+データを書いて、標準入力にリダイレクトしましょう。 データはJSON形式なのでこんな感じで適当に作れます。 use strict; use warnings; use utf8; use JSON qw(encode_json); my @load_data; my $table_name = "Foo"; #do something my $json_data = encode_json(\@load_data); print <<"__EOS__"; load --table $table_name $json_data __EOS__ あとは、以下の様にすればデータをロードできます。 スタンドアローンモード groonga /path/to/db < /path/to/data クライアントモード
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く