タグ

ブックマーク / puyokw.hatenablog.com (2)

  • 次元削除 ( t-SNE ) - puyokwの日記

    今回は、kaggle のOtto Group Production Classification Challenge の上位の方々が次元削除の手法としてt-SNE(t-distributed stochastic neighbor embedding) を使用されていたので調べてみようと思いました。個人的には、pca(主成分分析) ぐらいしか思い付かなかったのですが、それぞれ比較しながら見ていきます。 t-sne の詳細についてこちらを参考にするといいかと思います。 http://jmlr.org/papers/volume9/vandermaaten08a/vandermaaten08a.pdf こちらに書かれているようにt-SNE は高次元のものを2 または3 次元に写像するように作られています。とりあえず、R のtsne package を試してみます。(あとでより高速なRtsne

    次元削除 ( t-SNE ) - puyokwの日記
  • 最近、流行のxgboost - puyokwの日記

    kaggle で Description - Otto Group Product Classification Challenge | Kaggle に参加していますが、こちらのフォーラムで Achieve 0.50776 on the leaderboard in a minute with XGBoost - Otto Group Product Classification Challenge | Kaggle というタイトルのものがありました。xgboost についてはこちらが参考になると思います。 ブースティング決定木の概念: http://homes.cs.washington.edu/~tqchen/pdf/BoostedTree.pdf 概念と使い方: Gradient Boosting Decision Treeでの特徴選択 in R | 分析のおはなし。 変数のこと:

    最近、流行のxgboost - puyokwの日記
  • 1