タグ

ブックマーク / puyokw.hatenablog.com (2)

  • xgboost package のR とpython の違い - puyokwの日記

    python と xgboost で検索をかけられている方も多く見受けられるので、R とほぼ重複した内容になりますが、記事にまとめておきます。python のxgboost のインストール方法はgithub を参考にされると良いと思います。github.com R とpython のxgboost を使う際に感じる違い R の利点 視覚化(visualization) が強い 自動化が簡単 early stopping が簡単に使える python の利点 ハイパーパラメータのチューニングに hyperopt package が使用できる 現状として、R のpackage を使う方がメリットが大きいと思います。 まず、R の方から見ていきます。python でも主要な機能は実装されていますが、変数重要度を求めたときの視覚化が未実装で(計画はあるみたいです)、変数との対応も分かりにくいです。

    xgboost package のR とpython の違い - puyokwの日記
    tsu-nera
    tsu-nera 2017/12/02
  • カテゴリー変数に embedding layer を用いたNeural Net - puyokwの日記

    kaggle のRossmann の3 位のNeokami Inc(entron)さんの用いた手法が面白かったので、その概要の紹介などをしていきたいと思います。 まず手法の名前は、"Entity Embeddings of Categorical Variables" で、 [1604.06737] Entity Embeddings of Categorical Variables 論文にもなっています。コードはGithub にありますので、興味のある方はご覧ください。 github.com (これはPython3 を用いて書かれています。) embedding layer を用いた他のコンペでの有力なsolution。 kaggle のtaxi コンペ: Taxi Trajectory Winners’ Interview: 1st place, Team ? | No Free Hu

    カテゴリー変数に embedding layer を用いたNeural Net - puyokwの日記
  • 1