タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

solrに関するoinumeのブックマーク (8)

  • GitHub - hatena/solr-tutorial: Solrの導入資料です。LAMP構成に特化しています。

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    GitHub - hatena/solr-tutorial: Solrの導入資料です。LAMP構成に特化しています。
    oinume
    oinume 2012/05/04
  • 『アメーバサーチにApache Solr 1.4をつかってみた』

    皆様、こんにちわ 新規開発局コアテクGで、現在はサービスの管理ツールなどの開発を担当しているGakuです。 現在は担当していないのですが、以前に担当しており、全面的に作り直したアメーバサーチについて書かせていただこうかと思います(一番大変だったんですが、一番楽しい開発でした)。 ■以前のアメーバサーチ Lucene使用(RMI機能を使ってました) 検索対象:6000万件ほど(直近3ヶ月~6ヶ月) スケールアップがしにくいつくり Luceneのバージョンアップもむずかしい(バージョンアップ後はRMIは非推奨化予定でした。使えないなと) 「アクセス過多のため・・・・・」と検索できない事が頻発 QPS(一秒辺りの検索数) 50ぐらい(4セット合計で) 急激にアメブロの記事数が増えていた為、明らかにキャパオーバに陥ってしまっていました。 それで・・・・・・・・・ ユーザの方々からおおいにお怒りの声

    『アメーバサーチにApache Solr 1.4をつかってみた』
    oinume
    oinume 2010/12/02
  • 第3回solr勉強会(アメーバにおけるsolrの利用)

    Loading… Flash Player 9 (or above) is needed to view presentations. We have detected that you do not have it on your computer. To install it, go here. 第3回solr勉強会(アメーバにおけるsolrの利用) - Presentation Transcript 第3回 Solr勉強会 株式会社サイバーエージェント 新規開発局 安田 征弘 第3回 Solr勉強会 自己紹介 ・ 安田征弘(やすだ まさひろ) ・ 2008年からアメーバで働く ・ 今まで関わったサービス 2008年 ~ 2010年 - ブログネタ 2010年 ~ 2010年6月 - アメーバサーチ - なう検索 - タレント検索 現在の担当 - アメーバサーチの負荷改善及び機能追加

  • RONDHUIT-REPORT-Vol6

    RONDHUIT REPORT Vol.6 - SOLR 1.4 NEW FEATURES Copyright © RONDHUIT Co.,Ltd. 1 2009 11 1 Solr 1.4 Solr 1.4 Lucene 2.9 Solr 1.3 Lucene 2.4-dev 2.4-dev IndexReader TokenStream N-gram FastVectorHighlighter Lucene 2.9 FastVectorHighlighter Solr 1.4 Solr 1.4 Lucene 2.9.0 2.9.1 2.9.1 2.9.0 BooleanQuery BooleanScorer 2.9.0 OSS Solr Unix OS Unix OS rsync Solr Windows Solr "r" Replication "R" Java Solr 1.4

    oinume
    oinume 2010/03/22
  • Solr って、書き込みの Disk I/O が多くて、リアルタイム検索は不可能なのかしら - kazuhoのメモ置き場

    を読んでいて、pp.266-267 に、以下のような記載があった。 ・Optimize の重要性 コマンドは Solr のインデックスを物理的に最適化するコマンドです。具体的には、Solr では commit のたびに一群 11 個のファイルを作成します。 つまり、細かく commit を繰り返す形で文書の投入や更新を繰り返すと、その分だけインデックスとして多くのファイルを使うようになり、ひいてはファイルディスクリプタが枯渇する事態に陥ります。 仮に枯渇しなくても、多くのファイルを開いて検索に利用することになるため、パフォーマンスに甚大な影響を与えてしまいます。 この事態を回避するため、目安として 5 回程度 commit を行ったら最低 1 回は optimize コマンドを発行するようにしてください。 optimize を行うことで、複数回分に分かれてしまっていたインデックスファイル群

    Solr って、書き込みの Disk I/O が多くて、リアルタイム検索は不可能なのかしら - kazuhoのメモ置き場
    oinume
    oinume 2010/02/26
  • Welcome to Apache Solr

    Solr is the popular, blazing-fast, open source enterprise search platform built on Apache Lucene™. Learn more about Solr. Solr is highly reliable, scalable and fault tolerant, providing distributed indexing, replication and load-balanced querying, automated failover and recovery, centralized configuration and more. Solr powers the search and navigation features of many of the world's largest inter

    Welcome to Apache Solr
  • データベースに入っているデータを Solr に入れる一つの方法 Data Import Request Handler ( DataImportHandler ) - Solr, Python, MacBook Air in Shinagawa Seaside

    ボクは Solr にデータを入れるときは、一度 MySQLのデータベース上で ドキュメントデータを成形してから DataImportHandler を使って Solr にデータを移すというやり方をしています。 DataImportHandler というのは Solr に標準で付いているツールで、データベース以外にも XML やファイル等から データを入れるときに使える便利なツールです。 通常ドキュメントデータは複数の処理の結果を集約して作ることが多いので、フィールド毎のデータのUPDATEがしやすいRDBはその辺便利です。いろんなツールもそろっているし。 いつもの開発パターンはこんな感じです。 「Object Browser ER」というツールを使ってER図を書く。 そこからフォーワードエンジニアリングでDDLを出す。 DDLを使ってMySQLにデータベースとテーブルを作成 各種処理によっ

    oinume
    oinume 2010/02/05
  • 全文検索サーバ: これからSolrを始める人のためのApache Solr概要と便利な情報リスト集

    はじめまして。 プロダクト&サービス事業部 リーダーの久保です。 今日は、当社で利用しているOSSの全文検索アプリケーションであるApache Solrについてご紹介したいと思います。 GoogleでSolrを検索しても、日語圏のコンテンツはまだまだ少ないようです。 当社がSolrを使い始めた昨年は現在よりもさらに少なく、結構苦労しました。 今回はやや雑多な内容となりますが、新しくSolrを使う際に必要と考えられる情報をまとめてみました。 エントリーでは、Solr1.3を対象としています。 Solr1.3が現在の安定版で、Solr1.4-devが開発版となります。 目次 Solrとは 機能一覧 実績/事例 Solrを使ったシステムの開発方法 おすすめする方 データ量/性能とハードウェア マルチコア構成 様々な検索 スケールアウト 検索と更新 Solrを始めるための情報リスト 全

    oinume
    oinume 2009/10/28
  • 1