タグ

luceneに関するsyou6162のブックマーク (6)

  • Lucene #Kuromoji のコードを読む会 (辞書ビルダー編) - Speaker Deck

    Transcript Lucene Kuromoji のコードを読む会 (辞書ビルダー編) 2019/10/3 @moco_beta 自己紹介  打田智子  twitter : @moco_beta  所属 : 株式会社 LegalForce R&D チーム / ソフトウェアエンジニア  検索システムに興味があります  趣味でOSS開発をしています  Janome https://github.com/mocobeta/janome  Apache Lucene committer () 趣旨など 主催者 (@moco_beta) が Lucene / Kuromoji のソースコード(辞書周り)を読むうえで,調 べたことをまとめておきたい 素のままで触る機会は少ないかもしれないけれ ど, Lucene のコードを読んでみるのも楽しい よ!というのを伝えたい 仕事ではブラック

    Lucene #Kuromoji のコードを読む会 (辞書ビルダー編) - Speaker Deck
  • Solrの導入資料を公開します - Hatena Developer Blog

    こんにちは、 id:yanbe です。 全文検索エンジンLucene上に構築されたSolrという検索ミドルウェアがあります。拡張性・カスタマイズ性に富み、既存のデータのインポート機能が豊富なのもあって、広く利用されています。 参考: Solr - Wikipedia 国内のウェブサービスでのSolrの採用事例を挙げるとNAVERやCookpad、アメーバなどがありますが、はてなでも以前より一部のサービスでSolrを採用しています。 Solrの公式ドキュメント(英語)はwiki形式で提供されており、網羅的な情報はこちらで手に入ります。また、Solrの基的な使い方を学べるチュートリアルもありますが、「すでにある典型的なLAMP構成のウェブサービスにSolrによる検索機能を組み込む」までには、ここからさらに多くの情報を調べる必要があり、Solrの導入のハードルとなっていると感じました。 そこで

  • 全文検索 JiroSearch オープンソース(GPL) | Lucene

    JiroSearchとは 「JiroSearch」 は、様々な全文検索ニーズに対応できることを目指し、オープンソースとJavaで開発された全文検索エンジンです。 面倒な設定作業やコーディング作業なしに、全文検索機能を導入することが出来るとともに、様々な検索ニーズに合致したカスタマイズを行うことができます。 基的な特徴 Webサイト内の日語全文検索「namazu」と同様のことができます オープンソース(GPLライセンス)ですので、無償で利用することができます Linux, Windowsのサーバ上で動作します インストールして、そのまま利用していただくことができます N-gram形式のインデックス生成型の全文検索として動作します 検索対象ファイルの自動更新を可能にします CSSファイルを直すことで検索結果ページのデザインを変更することができますjspファイルを修正することで、自由に検索結

  • トップページ

    SQL データベース操作言語SQLについて、またRDBMSの持つ機能について詳しく解説します。 DB概要、SQL、テーブル操作、データ操作 ... 特集:replication PostgreSQLのレプリケーションシステムを紹介し、それらの機能を比較していきます。 特集:pgbench PostgreSQLのベンチマークテストに用いられるプログラムである pgbench について解説します。 SQL演習問題 各章に用意された演習問題を集めました。

  • javaworld.jp

    This domain may be for sale!

  • 2006-06-20

    ControllerのメソッドをViewで使うには helper_method XXXXX とConrollerの頭に宣言 NIESに会う。で、検索エンジンについていろいろ語らううちに、 Nutchっていうオープンソースの検索エンジンがあるんだよってのを説明してあげたりしてたら、NutchはJava製という事が判明。それもApacheのサブプロジェクトにいつのまにかなってるし。 ほー。 後で試してみよっと。 前半の復習。 今後の方針について決めた。 んで具体的には 1:コラボレイティブフィルタ 2:LSA という優先順位でやることに。 LSAに関してはSimple PCAという次元圧縮のためのアルゴリズムを教えてもらった。で、これすごいの。高校生でも分かるような単純なアルゴリズムなのに特異値分解するよりずーっと計算量が少なくて、んでもってLSAをやる上では精度もいい。 ( ;∀;) カント

    2006-06-20
  • 1