こんにちは。 前回まででApache Spark & Streamingの概要がわかったので、 とりあえず実際の環境を構築してみよう・・・と思ったら、Apache Spark自体がバージョンアップしていました。 Spark0.8.0になりますね。 なので、とりあえずどんな機能が追加されたかは実際クラスタ組む前に確認しておこう・・・ というので更新内容が何か確認してみます。 更新で大きいものは8点。 1. Monitoring UI and Metricsの追加 SparkのUIにJobダッシュボードとMetricsメニューが追加され、 実行中のジョブや、実行段階の情報が見えるようになったそうです。 その他にもジョブの実行パーセンタイル統計や、GC発生数といった性能情報も見えるようになった模様。 加えて、ジョブ実行あたりのディスクの使用量増加といった情報もわかるそうです。 尚、こういった性能