タグ

crawlerに関するdelhicurryのブックマーク (1)

  • Elasticsearch と ManifoldCF

    Apahe Lucene ⇒ 全文検索の部品 Elasticsearch ⇒ 全文検索のサーバー Apahe ManifoldCF ⇒ クローラー CentOS 7.0 上のファイルシステムに PDFExcel, Word を置いて全文検索するまでの記録。 検索対象の文書ファイルを設置 /home/user2/doc/ フォルダを掘り、そこに色々とファイルを置く。 詳しくは 前回のメモ を参照。 ネットワーク穴あけ systemctl stop firewalld.service Elasticsearch を起動 rm -rf elasticsearch-1.2.2 tar xf elasticsearch-1.2.2.tar.gz cd elasticsearch-1.2.2 export _JAVA_OPTIONS="-Djava.net.preferIPv4Stack=tru

    Elasticsearch と ManifoldCF
  • 1