タグ

2016年7月20日のブックマーク (3件)

  • Regurarized Greedy Forest - puyokwの日記

    最近、決定木ベースの手法ではxgboost が主流となってきています。実際、xgboost やrandomForest は手軽に結構良い精度が出るので、まずはじめに試すとしたらこのあたりの手法かなと思います。 Regurarized Greedy Forest (以下、RGF と略す)は、C++ で書かれていることとトレーニングに時間がかかるため、あまり普及はしていないように感じます。ただ精度に関してはxgboost より良いことも多い印象があります。 Regularized greedy forest (RGF) in C++ こちらからダウンロードすることができます。RGF の使い方やアルゴリズムについては付属のpdf に詳しく書かれています。アルゴリズムについては時間があるときに追記しようと思います。 コンペでの使用状況 metric とloss の目安 使用上の注意点 パラメータ

    Regurarized Greedy Forest - puyokwの日記
    turuhashi
    turuhashi 2016/07/20
    決定木
  • Gradient Encoding

    Learn new data visualization techniques. Perform complex data analysis. Publish your findings in a compelling document. All in the same tool.

    Gradient Encoding
    turuhashi
    turuhashi 2016/07/20
    水準ごとに色を変える折れ線グラフ
  • 統計検定準1級を取るための勉強法|Colorless Green Ideas

    はじめに この記事では、統計質保証推進協会が主催している統計検定の準1級を取るための勉強法について、私自身の経験も交えながら紹介していきたいと思う。なお、私は2016年6月に統計検定の準1級を受け、7月に無事合格通知を受け取った。 統計検定とは 統計検定とは、2011年から始まった「統計に関する知識や活用力を評価する全国統一試験」 [1] である。この試験は級別に分かれており、高校程度の統計を問う3級や、大学の基礎科目としての統計学を問う2級などが設定されている。 準1級の特徴 準1級の出題範囲は広いので効率的に勉強しよう [2] 2015年からは、2級よりやや発展的な内容を問う統計検定準1級の試験が年に1回実施されるようになった。この級の出題範囲は、1つ下の2級の出題範囲に比べてかなり広い。このため、合格に向けての勉強に当たっては、広い範囲の内容をうまく処理していくことが重要であろう。

    統計検定準1級を取るための勉強法|Colorless Green Ideas