2013年2月4日月曜日 Apache ManifoldCF 1.0.1 + Solr 4.0 の構築 今回は、前回までで構築したManifoldCF + PostgreSQLの上に、Solrを設定します。そして、ファイルサーバのクロールを実装します。 概要 …といっても、下記の設定に従うだけです。 Apache ManifoldCF -セットアップ- | 株式会社ロンウイット Apache ManifoldCF -ファイルサーバのクロール- | 株式会社ロンウイット ただ、上記設定は、solrconfig.xml上のrequestHandlerの設定であるuprefixを"ignored_"から"attr_"に変更しています。 この設定に従うと、全てのフィールドが登録されてしまうので、必要なものだけをSolrに読み込ませる設定へ変更してみます。 クロール対象となるサーバ上のファイ
管理が困難―分散処理の常識はZooKeeperで変わる:ビッグデータ処理の常識をJavaで身につける(8)(1/3 ページ) Hadoopをはじめ、Java言語を使って構築されることが多い「ビッグデータ」処理のためのフレームワーク/ライブラリを紹介しながら、大量データを活用するための技術の常識を身に付けていく連載 分散処理の課題が「管理」なのは常識 複数の計算機上で動作(分散)するアプリケーション、ソフトウェアが多く存在します。分散ソフトウェアは複数の計算機で動作することで大量のデータを扱えたり、高負荷な状況に対処します。本稿では、複数の計算機(クラスタ)で動作する各サーバを「インスタンス」と呼びます。 本連載で紹介した分散Key-Valueデータベースである「HBase」は複数の計算機で動作する代表的なソフトウェアです。両ソフトウェアはともに「Apache ZooKeeper」(以下、Z
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く