AWS Summitに来ていたのですが、TLでは、Cloudera Searchが賑わってました。 ということで、軽くどんなものか読んだり調べたりしたメモを残しとこうかと。 英語力はあやしいので、おかしいとこがあったらツッコミを。 Cloudera Searchとは? CDH4.3に対応したCDHユーザ向けの検索システム(beta版)なのかな? CDHに統合された検索フレームワークなのかな? 基本はLucene/Solr 4.3でHadoopのペタバイトデータを検索することができるようになるみたいです。 どんな仕組み? 次のものを利用しているようです。(GithubのREADMEから。) 使ってるもの Apache Solr(4.3.0+α?) Apache Lucene(Solrつかってるからね) Apache SolrCloud(うーん、Solrに含まれるのに別に出してるのなんで?)