サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
アメリカ大統領選
www.rondhuit.com
RONDHUIT REPORT Vol.7 – LUCENE/SOLR 3.1 NEW FEATURES Copyright © RONDHUIT Co.,Ltd. 1 2011 3 22 Lucene/Solr 3.1 Solr 1.4 3.1 3 Lucene Solr Lucene Solr Solr Lucene Lucene Solr http://www.slideshare.net/KojiSekiguchi/lu-s olr-20100709 Lucene 3.0 Java 5 3.1 Unicode 4 Analyzer 3.0 3.1 => Lucene Version enum SimpleAnalyzer 3.1 SimpleAnalyzer a = new SimpleAnalyzer(Version.LUCENE_31); deprecated 3.0 @Dep
Solr www.rondhuit.com Apache Lucene/Solr • Apache Lucene – Java • Apache Solr – Lucene • • N-gram • • • – • • • • • • • Fuzzy • Google • Google CharFilter – Reader CharStream +correctOffset(int):int CharReader input:Reader CharFilter input:CharStream correct(int):int BaseCharFilter pcmList: List<OffCorrectMap> getLastCumulativeDiff ():int addOffCorrectMap (int,int):void OffCorrectMap off:int
RONDHUIT REPORT Vol.6 - SOLR 1.4 NEW FEATURES Copyright © RONDHUIT Co.,Ltd. 1 2009 11 1 Solr 1.4 Solr 1.4 Lucene 2.9 Solr 1.3 Lucene 2.4-dev 2.4-dev IndexReader TokenStream N-gram FastVectorHighlighter Lucene 2.9 FastVectorHighlighter Solr 1.4 Solr 1.4 Lucene 2.9.0 2.9.1 2.9.1 2.9.0 BooleanQuery BooleanScorer 2.9.0 OSS Solr Unix OS Unix OS rsync Solr Windows Solr "r" Replication "R" Java Solr 1.4
RONDHUIT REPORT Vol.5 – LUCENE 2.9 NEW FEATURES Copyright © RONDHUIT Co.,Ltd. 1 RONDHUIT REPORT Vol.5 – LUCENE 2.9 NEW FEATURES Copyright © RONDHUIT Co.,Ltd. 2 RONDHUIT REPORT Vol.5 – LUCENE 2.9 NEW FEATURES Copyright © RONDHUIT Co.,Ltd. 3 st Lucene /Solr 100-0005 1-1-3 AIG B1F 03-5288-5927 FAX 03-5288-5928 sales@rondhuit.com http://www.rondhuit.com/
Rails Solr Solr 1.2 rel 1.0 • Rails Solr • Apache Solr 1.2 • Goal/Non-Goal • Goal – Apache Solr 1.2 Solr – Solr – Solr – Solr – Solr • Non-Goal – Solr – Solr – Solr Solr – 1. • • 2. Solr • Solr • Solr • Solr 3. example • example • example • • solr-ruby 4. • schema.xml • ANALYSIS 5. Rails • Rails • – – – UNIX grep SQL like • – – Solr Namazu Senna Google Yahoo! ID a) b) c) AND “ AND • • • • • • •UNI
RONDHUIT REPORT Vol.4 - SOLR 1.3 NEW FEATURES Copyright © RONDHUIT Co.,Ltd. 1 2008 9 17 Apache Solr Solr 1.3.0 1.2.0 1 3 Solr Solr 1.3 5 LinuxWorld Expo/Tokyo 2008 Solr 1.3 Distributed Search Lucene Java Integer.MAX_VALUE 21 Solr 1.3 shard docId Long Long.MAX_VALUE 922 Distributed Search 21 Disk I/O Disk Distributed Search IDF shard Solr 1.3 Distributed Search Google shard Google DataImportHandler
tf0054@r.recruit.co.jp / FIT / z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z ¾ z z ¾ z z ¾ z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z z Internet batch web batch web … 2 /FW DB/NFS 1 (F)
RONDHUIT REPORT Vol.3 - Ludia & Solr - faceted/filtered search comparison Copyright © RONDHUIT Co.,Ltd. 1 2008 5 14 Web 1 [ ] 1 1 2 2 1 2 Web Ludia Apache Solr Solr RONDHUIT REPORT Vol.3 - Ludia & Solr - faceted/filtered search comparison Copyright © RONDHUIT Co.,Ltd. 2 DELL Inspiron 1501 CPU AMD Athlon(TM) 64 X2 TK-53 1GB(512MBx2) DDR2-SDRAM 120GB SATA HDD 5400 100MB Ethernet OS Windows XP Profes
商用検索エンジンは小規模なものは数十万円、大規模なものになると数千万〜数億円ものライセンス費用がかかってきます。しかし、Lucene/Solrはエンタープライズ・レベルの大規模システムに対応できるだけでなく、ライセンス費用が不要です。そのため、浮いたお金を開発費用に充ててアプリケーションの機能の充実化や品質向上を図ったり、ハードウェア費用に充ててバックアップ体制を強化することなどが可能となります。 また、商用検索エンジンの中には高価なハードウェアを必須要件としているものがあり、これも導入時の費用を押し上げる原因となっています。Lucene/Solrはそのような特別なハードウェアを必要としません。 検索エンジンの処理速度で最も重要かつ注目されるのが検索応答時間です。最新の検索エンジンはいずれも「転置索引」を作成して検索を実行する方式のため、単純な検索だと検索処理時間の差があまり出ません。
RailsとSolrによる全文検索のデモ 〜 ロンウイット、OSSの検索エンジンSolrをRailsから使用する デモ構築方法に関するホワイトペーパーをリリース 〜 株式会社ロンウイット(本社:東京都千代田区、代表取締役社長:関口宏司、以下ロンウイット)は本日、「10分で簡単!RailsとSolrの全文検索デモ構築」と題したホワイトペーパーの公開を発表しました。ホワイトペーパーにはオープンソースの検索エンジンApache Solr(以下Solr)を、Ruby on Rails(以下Rails)のアプリケーションから使用するデモの構築方法が掲載されています。 Solrは高性能全文検索ライブラリApache Lucene(以下Lucene)を使って構築された、「検索エンジンサーバ」です。もとはCNET社(http://www.cnet.com/)のために構築された検索エンジンフレームワ
RONDHUIT REPORT Vol.2 - RAILS & SOLR FULL-TEXT SEARCH DEMO Copyright © RONDHUIT Co.,Ltd. 1 2007 10 22 Apache Solr Solr Ruby Solr Apache Lucene CNET CNET Apache Software Foundation Apache Solr http://lucene.apache.org/solr/ Solr API Lucene Powered by Solr http://wiki.apache.org/solr/PublicServers Solr Solr • • HTTP/XML XML Java • Lucene • • • • • • Jetty Solr WEBrick Flare Flare Ruby on Rails Solr
無料のオンラインハンズオンセミナーを開催しています 詳細・お申し込みはこちら 目次 Apache OpenNLP 日本語固有表現抽出モデルファイル livedoor ニュースコーパス 勉強会/セミナー資料 海外カンファレンス参加報告 セキュリティ警告 アーカイブズ Apache OpenNLP 日本語固有表現抽出モデルファイル Apache OpenNLP 1.9.0 以降で利用可能な、日本語固有表現抽出のための学習済みのモデルファイルです。商用利用可能です。 ダウンロード:rondhuit-ja-ner-1.0.0.zip(Apache License) livedoor ニュースコーパス 概要 本コーパスは、NHN Japan株式会社が運営する「livedoor ニュース」のうち、下記のクリエイティブ・コモンズライセンスが適用されるニュース記事を収集し、可能な限りHTMLタグを取り除い
RONDHUIT REPORT Vol.1 - SOLR QUERY PERFORMANCE Copyright © RONDHUIT Co.,Ltd. 1 2007 9 29 Apache Solr Solr Solr Apache Lucene(*1) CNET CNET Apache Software Foundation Lucene (*1) Apache Lucene http://lucene.apache.org/java/docs/index.ht ml Apache Solr http://lucene.apache.org/solr/ Solr API Lucene Powered by Solr http://wiki.apache.org/solr/PublicServers Solr Solr • • HTTP/XML XML Java • Lucene • •
○ロンウイットの「オープンソース・検索エンジン・ソリューション」の中核をなすコンポーネントです。 ○オープンソースの検索エンジン・サーバApache Solrを使用し、数百万件超の文書を高速に全文検索できます。 ○Webクローラにはオープンソース・ソフトウェアのHeritrixを使用します。Lucene/Solr同様、Heritrixもロンウイットがコンサルティングサービスとサポートサービスをご提供しています。 ○クローラ/スパイダが収集した文書をインデックスに登録するSolrプラグインをご提供します。
受付中 問い合わせを60%以上削減!AI技術による革新的FAQソリューションの活用 FAQシステムにセマンティック検索を適用すれば、問い合わせコストを大幅削減できます! 開催日:2024.08.21 14:00-14:45WED 終了 紀伊国屋書店様ご登壇!AIレファレンスサービスの取り組みのご紹介 KandaSearcの導入事例として、図書館のレファレンスサービスへKandaSearchを導入し活用する様子をご紹介いただきます。 開催日:2024.7.17 14:00-14:45WED 終了 独自のAI技術を活用し問い合わせの削減を実現! 独自のAI技術を活用し問い合わせの削減を実現するための最前線のFAQソリューションセミナー 開催日:2024.06.26 13:00-13:40WED
このページを最初にブックマークしてみませんか?
『株式会社ロンウイット - ロンウイットはオープンソースのLucene/Solrを使った高速...』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く