タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

solrに関するmanholeのブックマーク (3)

  • SolrのAtomicUpdateを50000倍速くした話

    第19回LuceneSolr勉強会で話をさせていただいた内容です 第19回LuceneSolr勉強会 https://solr.doorkeeper.jp/events/53600 SOLR-9592でコミットした、AtomicUpdateの高速化の話についての、詳細を記載しております。 https://issues.apache.org/jira/browse/SOLR-9592 最後の、storedの用途が限定的という話は、別途Solr AdventCalenderで、詳しく書いていますので、そちらも参考にしてください。 [Solr Advent Calender 2016 14日目] SolrでのdocValuesとstoredの使い分け http://qiita.com/takaishi/items/6f08325c2eb3922bf166

    SolrのAtomicUpdateを50000倍速くした話
    manhole
    manhole 2020/06/15
    "新しいものをきっちり使い、その上でさらなる改善をしていくという姿勢"
  • 第11回Solr勉強会を主催しました。#SolrJP

    不定期開催ですが第11回Solr勉強会を主催しました。 今回も大入り90人くらい?の参加者の皆さんがいらっしゃいました。ありがたいことです!(20時時点で最終的に補欠17人でした。) とりあえず、第一報です。このあと懇親会なので。 ということで、帰りの電車でいくつか感想を(忘れちゃうから)。 小林さんの苦労話は細かいですが、結構はまりがちな点を共有していただいたので良かったかなぁと。 Solrのexampleの設定とか、ManifoldCFとかちょっとずつ罠があったりするので、あるあるネタはありがたいと思いますw Cloudera Searchについては、安定の嶋内さんの喋りに圧巻でした。検索だけの視点とは異なる観点についての 話は私には足りないしてんだったりするので参考になります。 なんか、気づいたらMorphlineやスキーマ周りを調べてブログ書くことになっちゃったけど。。。 一つ質問

    第11回Solr勉強会を主催しました。#SolrJP
  • ヒット件数が数十万件を超えるような場合でも使える。新しくインデキシングしたドキュメントを検索結果の上位に表示する2つの方法。 - Solr, Python, MacBook Air in Shinagawa Seaside

    新しくインデキシングされたドキュメントを検索結果の上位に表示したいというニーズは割とよくあると思います。 フレッシュネスブーストと呼ばれる手法です。 Solr の場合 TIMESTAMP などの日付でソートすることもできるのですが Solr はソートがあまり上手ではありません。 時間とシステムリソースを大量に消費します。 ヒット件数が数十万件を超えるような場合にはあまり使いたくありません。 正確にソートされなくても最近インデキシングされたドキュメントが だいたい上位にくればいいのであれば日付でブーストする方法があります。 1つめは クエリタイプが dismax の場合で、BoostQuery を使う方法です。 bq で指定します。 bq=TIMESTAMP:[NOW/DAY-7DAY TO NOW/DAY]^20000 この例では1週間以内にインデキシングされたドキュメントがブーストされま

    ヒット件数が数十万件を超えるような場合でも使える。新しくインデキシングしたドキュメントを検索結果の上位に表示する2つの方法。 - Solr, Python, MacBook Air in Shinagawa Seaside
    manhole
    manhole 2009/05/26
    "NOW"などのキーワードを使える
  • 1