皆さんはじめまして、海外旅行に行っていた石井です。旅行中にひどくお腹を壊し、外国の病院にかかるという貴重な経験ができました。 さて、今回はjubatusというソフトウェアの入門記事を書いてみたいと思います。 jubatusとは株式会社Preferred InfrastructureとNTTソフトウェアイノベーションセンタが共同開発したOSSで、大規模データに対してリアルタイム性のある機械学習が行えるソフトウェアです。弊社でもつい最近、hadoop, mahoutを利用したバッチによる機械学習から、jubatusを利用したリアルタイムな機械学習を行うようにしました。 今回は簡単なクライアント – サーバー型のリアルタイムリコメンダーをjubatusを使って作ってみたいと思います。データはMovieLensが公開しているデータを使わせていただきます。 MovieLens | GroupLens