概要 次世代分散処理エンジンとして流行ってますね。Apache Spark。 https://spark.apache.org/ https://github.com/apache/spark モチベーションが下がりかかってるところに、ちょうどアクセスログを解析して〜みたいなことをやろうとしていたので、実際のアクセスログを解析し、アクセス数を集計して、CSVファイルに出力するということを試してみました。 集計とCSV出力 今回は対象のアクセスログから「/hoge」のURIに対して日毎にどれくらいのアクセスがあったかを集計し、その結果をCSV出力してます。 こんな感じの出力結果にしたいです。 import java.io.File import java.text.SimpleDateFormat import scala.util.parsing.combinator._ import o