出典:ITpro 2015年 9月 29日 (記事は執筆時の情報に基づいており、現在では異なる場合があります) オープンソースフレームワークであるApache Spark、およびそのエコシステム(周辺ソフトウエア)であるMLlibを活用することで、高速かつ柔軟な機械学習処理を実現できる。本稿では、Apache Sparkを用いた機械学習の特徴や歴史を紹介する。 Apache Sparkとは? 本稿では、「ポストHadoop」の最右翼と言われているApache Sparkのエコシステムである、MLlibライブラリを用いた機械学習システムについて説明する。 オープンソースソフトウエアであるApache Sparkは、2014年2月にApacheのトップレベルプロジェクトに昇格したほか、ビッグデータ分野のリーディングカンパニーである米クラウデラがサポートを行うなど、安定的な発展が見込まれている。
![[4]Apache Spark/MLlibの歴史と特徴を学ぶ](https://cdn-ak-scissors.b.st-hatena.com/image/square/380b9ab78bd5fd1cf0097a08bfc6d28350ac4c65/height=288;version=1;width=512/https%3A%2F%2Factive.nikkeibp.co.jp%2Fatclact%2Factive%2F15%2F111200135%2F111600005%2Fzu1.jpg)