TL;DR: Pure Java 実装な XGBoost 互換の予測専用モジュール xgboost-predictor を基に、Apache Spark 上で お手軽 に XGBoost の予測モデルをロードしたり予測を実現するモジュール xgboost-predictor-spark を作りましたよ、というお話です。 (xgboost-predictor のバージョン 0.2.0 リリースノートを兼ねています) 背景 DMLC が提供する勾配ブースティングツリーの実装 XGBoost では、JVM 環境向けに XGBoost4J なるパッケージが公式提供されています。この XGBoost4J には、Java / Scala 向けのインタフェースだけではなく、 Apache Spark / MLlib の Spark ML API にだいたい準拠したモジュール XGBoost4J-Spar
![Apache Spark 上で XGBoost の予測モデルを手軽に扱いたい!](https://cdn-ak-scissors.b.st-hatena.com/image/square/6472c89707ac865575051b971eeb4ccc7f52a7a7/height=288;version=1;width=512/https%3A%2F%2Fk11i.biz%2Fimages%2F2017%2F03%2F11%2Fheader.jpg)