[B! lucene] manholeのブックマーク

Introduction to Apache Lucene

社内の Lucene 勉強会で使った資料です。Apache Lucene https://lucene.apache.org/ の概要について発表しました。サンプルコード: https://github.com/takuyaa/hello-lucene

manhole 2021/04/06

lucene

リンク

第19回LuceneSolr勉強会で話をさせていただいた内容です第19回LuceneSolr勉強会 https://solr.doorkeeper.jp/events/53600 SOLR-9592でコミットした、AtomicUpdateの高速化の話についての、詳細を記載しております。 https://issues.apache.org/jira/browse/SOLR-9592 最後の、storedの用途が限定的という話は、別途Solr AdventCalenderで、詳しく書いていますので、そちらも参考にしてください。 [Solr Advent Calender 2016 14日目] SolrでのdocValuesとstoredの使い分け http://qiita.com/takaishi/it ems/6f08325c2eb3922bf166Read less

manhole 2020/06/15

"新しいものをきっちり使い、その上でさらなる改善をしていくという姿勢"

lucene
solr

リンク

第11回Solr勉強会を主催しました。#SolrJP

不定期開催ですが第11回Solr勉強会を主催しました。今回も大入り90人くらい？の参加者の皆さんがいらっしゃいました。ありがたいことです！（20時時点で最終的に補欠17人でした。）とりあえず、第一報です。このあと懇親会なので。ということで、帰りの電車でいくつか感想を（忘れちゃうから）。小林さんの苦労話は細かいですが、結構はまりがちな点を共有していただいたので良かったかなぁと。 Solrのexampleの設定とか、ManifoldCFとかちょっとずつ罠があったりするので、あるあるネタはありがたいと思いますｗ Cloudera Searchについては、安定の嶋内さんの喋りに圧巻でした。検索だけの視点とは異なる観点についての話は私には足りないしてんだったりするので参考になります。なんか、気づいたらMorphlineやスキーマ周りを調べてブログ書くことになっちゃったけど。。。一つ質問

manhole 2013/07/30

lucene
solr

リンク

Java 7u1 / Java 6u29 の不具合改修の件 | 関口宏司のLuceneブログ

一定期間更新がないため広告を表示しています

manhole 2012/07/03

JVM最適化のバグ

lucene

リンク

ようやく Lucene 2.9.0 がリリース | 関口宏司のLuceneブログ

一定期間更新がないため広告を表示しています

manhole 2011/08/20

2009/09のもの。TokenStream APIが追加に。

lucene

リンク

Tokenがdeprecatedに！（2.9） | 関口宏司のLuceneブログ

一定期間更新がないため広告を表示しています

manhole 2011/08/19

TokenStream API

lucene

リンク

ヒット件数が数十万件を超えるような場合でも使える。新しくインデキシングしたドキュメントを検索結果の上位に表示する２つの方法。 - Solr, Python, MacBook Air in Shinagawa Seaside

新しくインデキシングされたドキュメントを検索結果の上位に表示したいというニーズは割とよくあると思います。フレッシュネスブーストと呼ばれる手法です。 Solr の場合 TIMESTAMP などの日付でソートすることもできるのですが Solr はソートがあまり上手ではありません。時間とシステムリソースを大量に消費します。ヒット件数が数十万件を超えるような場合にはあまり使いたくありません。正確にソートされなくても最近インデキシングされたドキュメントがだいたい上位にくればいいのであれば日付でブーストする方法があります。 1つめはクエリタイプが dismax の場合で、BoostQuery を使う方法です。 bq で指定します。 bq=TIMESTAMP:[NOW/DAY-7DAY TO NOW/DAY]^20000 この例では1週間以内にインデキシングされたドキュメントがブーストされま

manhole 2009/05/26

"NOW"などのキーワードを使える

lucene
solr

リンク

全文検索サーバ: これからSolrを始める人のためのApache Solr概要と便利な情報リスト集

はじめまして。プロダクト&サービス事業部リーダーの久保です。今日は、当社で利用しているOSSの全文検索アプリケーションであるApache Solrについてご紹介したいと思います。 GoogleでSolrを検索しても、日本語圏のコンテンツはまだまだ少ないようです。当社がSolrを使い始めた昨年は現在よりもさらに少なく、結構苦労しました。今回はやや雑多な内容となりますが、新しくSolrを使う際に必要と考えられる情報をまとめてみました。本エントリーでは、Solr1.3を対象としています。 Solr1.3が現在の安定版で、Solr1.4-devが開発版となります。目次 Solrとは機能一覧実績/事例 Solrを使ったシステムの開発方法おすすめする方データ量/性能とハードウェアマルチコア構成様々な検索スケールアウト検索と更新 Solrを始めるための情報リスト全

manhole 2009/05/26

lucene

リンク

livedoor Techブログ : 全文検索エンジン lucene(ルシーン) を使ってみた

こんにちは。検索関連を担当しているやましーです。今回は livedoor で提供しているサービスの中の「検索関連」について書きます。このブログでも過去に何度か取り上げられていますが、livedoor では検索エンジンとして HyperEstraier、lucene、mysql + senna、Namazu、SUFARY などを利用しています。その中で lucene の利用方法や機能拡張について説明します。 lucene とは Apache Lucene は、Java で書かれた高性能で高機能な検索エンジンライブラリです。全文検索を（特にクロスプラットフォームで）必要とするほとんどのアプリケーションに適している技術です。※ 公式サイトから抜粋インデックスの作成 lucene は転置インデックス型の検索エンジンなので、ドキュメントを検索するには、まずインデックスの作

manhole 2008/05/08

リンク

はてなブックマーク

タグ

関連タグで絞り込む (2)

luceneに関するmanholeのブックマーク (9)

お知らせ

今週のはてなブックマーク数ランキング（2024年9月第4週）

今週のはてなブックマーク数ランキング（2024年9月第3週）

今週のはてなブックマーク数ランキング（2024年9月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス