こんにちは!美味しいコーヒーを飲むために、毎朝早くにデスクでコーヒーミル回してます、アナリティクスチームの高柳です。 アナリティクスチームでは、じゃらんnetやホットペッパービューティーをはじめとしたリクルートライフスタイルのサービスに対して、基礎集計やレポーティング、また、データマイニング(データ分析)を活用し、高速にサービスを改善していくというミッションを担っています。 本記事では、データ分析環境としてのApache Spark、特にver 1.4から利用可能になったSparkRを、当チームのAWS上の分析環境に導入検討していたので、その辺について書きたいと思います。 SparkRは、まだリリースから日が浅いことから、日本語の記事が相当に少ないので、この記事がみなさんの"Happy SparkR ライフ"のお役に立つことを願っております。 Apache Spark導入の背景 サービスを
![SparkRをEC2上で動かして分散処理してみる](https://cdn-ak-scissors.b.st-hatena.com/image/square/a9d26699161391bb6fc15730141b8aa50bbf25dd/height=288;version=1;width=512/https%3A%2F%2Fblog.recruit.co.jp%2Frls%2F2015-08-19-sparkr%2Fimg%2Farticle_main.png)