Search and analytics, data ingestion, and visualization – all at your fingertips.
紙で散在するドキュメントを電子化した場合、様々な利点がありますがそのうちの一つに「検索」機能があると思います。ドキュメント指向のDBであるCouchDBも例外ではありません。coucdb-luceneを使えば、CouchDB上にあるデータベース内を縦横無尽に検索して、キーワードに当てはまるドキュメントを探し出すことができます。以下、事前準備と簡単な使い方について書いておこうと思います。 主な手順はこんな感じです。(CouchDBは事前にインストールしてあることを前提に書きます) Javaのインストール coucdb-luceneの取得 CouchDBの設定変更 インデックスの作成 検索のテスト 1.Javaのインストール Java 5以上が推奨のようです。私はSunのサイトから最新版を入手しました。インストールの方法はSunのサイトに詳しく載っているのでそちらをご覧ください。ちなみに私はJ
Twitterのリアルタイム検索機能が、オープンソースのLuceneベースになったと、Twitter Engineeringブログへのエントリ「Twitter's New Search Architecture」で紹介されています。 これまでTwitterはリアルタイム検索にMySQLベースの独自システムを利用してきましたが、規模の拡大が難しくなってきたため、6カ月前に新システムの構築を決定。オープンソースの検索エンジンであるLuceneを選択したとのことです。 従来の50倍も高速に! 検索エンジンに対する要件は以下のように非常に厳しいものでした。 Our demands on the new system are immense: With over 1,000 TPS (Tweets/sec) and 12,000 QPS (queries/sec) = over 1 billion
これまでの連載を通して、CouchDBの基本的な概念と使い方、アプリケーションの作成方法までを解説してきました。ここからはさらに一歩踏み込んで、CouchDBをDBサーバやAPサーバとして実際に運用するときに役に立つ機能を紹介していきます。具体的には、次の3つのテーマを取り扱います。 全文検索を導入すれば、CouchDB内にあるすべてのドキュメントを対象に、特定のキーワードを指定して検索できます。ユーザー認証では、例えばDBの管理者権限を特定のユーザーのみに付与できます。ユーザー認証はまだ充実しているとはいえないレベルですが、現時点ではどのような選択肢があるかを紹介していきたいと思います。最後にCouchDBへの負荷を分散させる方法として、CouchDBのインスタンスをノードとして複数用意し、各ドキュメントを分散して配置するやり方を紹介します。これらの手段を目的に応じて生かすことができれば
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く