Code Archive Skip to content Google About Google Privacy Terms
Fessとは FessはSourceForge.jpで開発されるオープンソースの全文検索サーバである。Apacheライセンスで提供され、無償で利用することができる。オープンソースの全文検索エンジンにはさまざまなものがあるが、Fessの最大の特徴はインストールから起動までが簡単であり、起動後は管理画面ですばやく検索システムとして構築できることが挙げられる。 そのほかの特徴としては次のことが挙げれる。 OS非依存(Java実行環境があれば利用可能) Webまたはファイルシステム上にあるドキュメントを検索対象にできる MS OfficeやPDFなど多くのファイル形式に対応 携帯端末の表示に対応 (端末ごとに検索表示を最適化) Fessの心臓部分ともいえる検索エンジンにはApache Solrが採用されている。Apache Solrはサーバの構成次第では数億ドキュメントも検索対象とすることができ
今回は実際にLinuxマシン上にSolr/Luceneをインストールします。インデックスにデータを投入した上で,Solr/Luceneに組み込まれている管理機能の画面から検索を実施するところまでを紹介します。 今回の作業で必要になるモジュール類は以下の通りとなります。 - Solr(Luceneは同こん) - Java SDK(1.5以降) - lucene-ja(N-gram解析機能) - sen(形態素解析機能) なお,今回の作業では日本語解析モジュールを導入しますが,その中で形態素解析モジュール用の辞書の作成が必要になります。形態素解析モジュール用の辞書作成作業では以下のモジュールが必要になります。 - ant(1.7以降) - perl(5.0以降) では,導入作業を進めましょう。 (1)Javaのインストール まず,最新のSolr 1.3ではJava 1.5以上のバージョンが必要
Solr勉強会に行ってきました。 ECナビさんの事例の最後の質問付近から参加させていただきました。 Solr(ソーラー) 全文検索エンジンライブラリLuceneをベースに、管理画面やキャッシュ機構を取り入れたアプリケーション。 http://ja.wikipedia.org/wiki/Solr http://lucene.apache.org/solr/ 各事例紹介 ECNavi parasearch商用サーチエンジンを使っている ECTokenizerという独自Tokenizerで型番等のゆれを吸収している WebServer pound リクルート スピーカー 植野さん リクルートの人 開発、テスト MITの人 全社のインフラ 事業 営業、企画は社内 技術は大手SIerさん 全社的なインフラとかはMIT 某サイト (新作hotpepper?がSolrつかってる?) 25-280QPS
やってみた。 Nutchはウェブスパイダーとしてのクロール機能を提供している。内部に分散ファイルシステムたるHadoopを持っていのだが、今回はこれは使わない方法(のようだ)。 - - - - 1. Nutchを<a href="http://hudson.zones.apache.org/hudson/job/Nutch-trunk/">ダウンロード</a>し、解凍する。 tar xzf apache-nutch-1.0.tar.gz 2. Solrの設定を行う Nutchの中にはschema.xmlなどSolrを連携して使うためのサンプルの設定ファイルが含まれています。 a. schema.xmlの配置 apache-nutch-1.0/conf to directory apache-solr-1.3.0/example/solr/conf b. “content”フィールドの設定変
無料のオンラインハンズオンセミナーを開催しています 詳細・お申し込みはこちら 目次 Apache OpenNLP 日本語固有表現抽出モデルファイル livedoor ニュースコーパス 勉強会/セミナー資料 海外カンファレンス参加報告 セキュリティ警告 アーカイブズ Apache OpenNLP 日本語固有表現抽出モデルファイル Apache OpenNLP 1.9.0 以降で利用可能な、日本語固有表現抽出のための学習済みのモデルファイルです。商用利用可能です。 ダウンロード:rondhuit-ja-ner-1.0.0.zip(Apache License) livedoor ニュースコーパス 概要 本コーパスは、NHN Japan株式会社が運営する「livedoor ニュース」のうち、下記のクリエイティブ・コモンズライセンスが適用されるニュース記事を収集し、可能な限りHTMLタグを取り除い
概要 余りPCを活用してhadoopとかsolrの実験環境を作ってみる。 これでやったノウハウを元に、Amazon EC2/S3に環境を作りたいなーなんて思っている次第。 ここはそのための礎を作るプロジェクトです。 資料 プリファードさんとかGooさんが、hadoopを解析してくれました。 hadoop.pdf プリファードのCTOさんが資料を書いてくれています。 http://kzk9.net/blog/2008/08/hadoop_lucene.html 稚内北星大学の人が資料を書いてくれています。 20071225_Amazon_EC2_Hadoop-2.pdf Javaで学ぶ分散処理関係 http://www.atmarkit.co.jp/fjava/special/distributed01/distributed01_1.html solrとかlucene ブログウォッチャーの
Python プログラムが Kill されたので メモリサイズを増やす デフォルトでは 物理メモリの半分だった C:\Users\hoge\.wslconfig [wsl2] memory=56GB swap=0$ free -h total used free shared buff/cache available Mem: 54Gi 519Mi 53Gi 3.0Mi 549Mi 53Gi Swap: 0B 0B 0B $ sudo vi /etc/wsl.conf [network] hostname = WSL Dockerfileの作成 $ vi Dockerfile # python バージョン:3.7.6 FROM python:3.7.6 # 作業ディレクトリ WORKDIR /code # 作業ディレクトリをコンテナにコピー COPY ./code /code # pip
Name Last modified Size Description Parent Directory - Automated test builds solr-2008-11-12.zip 12-Nov-2008 08:25 27M Automated test builds solr-2008-11-13.tgz 13-Nov-2008 08:17 23M Automated test builds solr-2008-11-13.zip 13-Nov-2008 08:17 27M Automated test builds solr-2008-11-14.tgz 14-Nov-2008 08:18 23M Automated test builds solr-2008-11-14.zip 14-Nov-2008 08:18 27M Automated test builds sol
We suggest the following location for your download: https://dlcdn.apache.org/lucene/solr/ Alternate download locations are suggested below. It is essential that you verify the integrity of the downloaded file using the PGP signature ( .asc file) or a hash ( .md5 or .sha* file). HTTP ¶ https://dlcdn.apache.org/lucene/solr/ Backup Sites ¶ https://dlcdn.apache.org/lucene/solr/ Verify the integrity o
Welcome to Solr's new Wiki page. We're currently re-building this site and you are welcome to help. Old Wiki FrontPagePublicServersSupportSolrSecuritySolrPerformanceData / SolrPerformanceFactors / SolrPerformanceProblemsUsingMailingListsMore to come hereWhat will this Wiki be for?We are still figuring out what to use this Wiki space for. Here are some thing we'll not use it for Solr Reference docu
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く