こんにちは、小澤です。 この記事はHadoop Advent Calendar 18日目のものとなります。 1人でHadoopの話をする Advent Calendar 2016 - Qiita Hadoop Advent Calendar 2016 | シリーズ | Developers.IO 前回はSparkのDataset APIについて紹介させていただきました。 今回はみんな大好きな機械学習ライブラリである、Spark MLlibについて書かせていただきます。 なお、MLlibを使ってどのようなことができるかにフォーカスさせていただきますので、機械学習に関する詳細は割愛します。 具体的には以下の内容については説明しません。 特徴抽出で行っている操作の具体的なアルゴリズム 実際に行っている学習および予測の具体的なアルゴリズム 評価に使っている手法の具体的な内容 評価時に使用している指