New Cloudera research: The State of Enterprise AI and Modern Data Architectures Read the report
あんちべのすべらない話〜俺のツイートがこんなにウケないはずがない〜 View more presentations from AntiBayesian自分のtweetがウケるか滑るかをpostする前にrandomForestで判別してみよう! LTは制限時間10分だったため、詳細は意図的に省きました。本記事では皆さんにも実践頂けるよう、学習データの作り方についてスライドより詳しく説明したいと思います。 ●そもそも「学習する」とは?今回の目的は、自分のツイートがfav(面白い), non(普通)のどちらになるか分類することです。そのためには「favになるツイートはどのような特徴を持っているか?」を明らかにしなければなりません。特徴が明らかになっていれば、・このツイートはfavの特徴を強く持っている→favに分類・このツイートはfavの特徴を殆ど持っていない→nonに分類というモデルを作成可能
1. 決定木 樹木モデルによる分類木(決定木)は、計算の速さ、結果の読みやすさ、説明のしやすさなどから多くの分野で応用されている。 決定木は多くのアルゴリズムが提案されている。WEKAには、10種類の樹木に関するアルゴリズムが実装されている。しかし、その中ではデータ形式に特化したものもある。データのへの制約が少ないのはJ48、NBTree、RandomForest、RandomTree、REPTreeなどである。 先月号で、すでに説明したとおり、J48はC4.5のWEKAバージョンである。 NBTreeは、ナイーブベイズの分類器(naive Bayes classifiers)のアプローチで決定木を生成するアルゴリズムで、Ron Kohavi によって提案された(参考文献[4])。 RandomForestは、ブートストラップというリサンプリングの方法でサブデータを作成し、それぞれのサブデ
Random Forests Leo Breiman and Adele Cutler Random Forests(tm) is a trademark of Leo Breiman and Adele Cutler and is licensed exclusively to Salford Systems for the commercial release of the software. Our trademarks also include RF(tm), RandomForests(tm), RandomForest(tm) and Random Forest(tm). Contents Introduction Overview Features of random forests Remarks How Random Forests wo
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く