タグ

データマイニングに関するtakuya0411のブックマーク (2)

  • データマイニング予測の仕組み|JRA-VAN広場|競馬情報ならJRA-VAN

    はじめての方へ 競馬ソフトを開発したい方へ JRA-VAN では、皆様の馬券購入の参考になるように、データマイニング予測として、レース結果を事前に予測しています。 世の中には、気象予測、経済予測、株価予測など、さまざまな予測がコンピュータにより行われています。競馬の世界でも、スピード指数、レーティング指数などさまざまな数式や指数が、勝敗予測のために用いられていますが、それらの中のひとつがJRA-VANのデータマイニング予測です。 2008年1月以降予測の仕組みについて以下の改修を行っております。文では改修後の仕組みについてご説明します。 予測モデルの細分化 2008年1月から距離別レースクラス別に予測モデルを分割 2009年1月から上記に2歳戦・3歳戦に限定した予測モデルを追加 従来の走破速度予測モデルに加え、競走馬の勝敗を予測するモデルを追加 予測のためのデータとして坂路調教データを追

  • Random Forestで計算できる特徴量の重要度 - なにメモ

    (pixabay.comより) 1.背景とか Random Forest[1]とは、ランダムさがもつ利点を活用し、大量に作った決定木を効率よく学習させるという機械学習手法の一種です。SVMなどの既存の手法に比べて、特徴量の重要度が学習とともに計算できること、学習が早いこと、過学習が起きにくいこと(追記注釈1)などの利点が挙げられます。Kinectの姿勢推定に使われているらしいです。 最近、Random Forestをカジュアルに使う例が多く(特にうちの研究室)、一部パラメータやら出力やらがわからない人も多いと思います。使い方はTJOさんの資料[2]を読んでもらえれば理解できると思うし、詳細は波部先生の資料[3]をよんでもらえればわかると思います。 それで、いろいろな日語の資料をいくら読んでも、Random Forestがもつ特徴の1つである、特徴量の重要度の詳細に関してはほとんどノータッ

    Random Forestで計算できる特徴量の重要度 - なにメモ
  • 1