hohoho_ho2005のブックマーク - はてなブックマーク

Mahoutでランダムフォレストを試してみた
「ビッグデータ」もう何度も耳にした用語ではないでしょうか？では、具体的にどのように活用すれば良いのでしょう。メディアプランの方法論で言えばDiscoveryやLook-alikeがありますがとにかくデータに触れてみて、分析をしてみる事が新たな発見の近道だと思います。ということでMahoutでRandom Forestを試してみました。 ■環境・Hadoop ・Pig ・Mahout-0.7 ■Random Forestとは多数の決定木を用いた集団学習により、他の分類(SVMなど)と比べ高精度の分類・予測（回帰）を実現する機械学習アルゴリズム。ようは多数の決定木を作成して、それぞれの決定木が出した答えを多数決して、最も支持が多かったクラスに分類する手法です。質問に「YES」か「NO」で答える診断テストが複数あって、その中で 1番多く当てはまった診断結果を最終の解にするイメ
hohoho_ho2005 2013/03/02
リンク
1

はてなブックマーク