タグ

ブックマーク / d.hatena.ne.jp/AntiBayesian (1)

  • Rによるtwitterテキストマイニング 〜テキストに対する学習とは〜 - あんちべ!

    あんちべのすべらない話〜俺のツイートがこんなにウケないはずがない〜 View more presentations from AntiBayesian自分のtweetがウケるか滑るかをpostする前にrandomForestで判別してみよう! LTは制限時間10分だったため、詳細は意図的に省きました。記事では皆さんにも実践頂けるよう、学習データの作り方についてスライドより詳しく説明したいと思います。 ●そもそも「学習する」とは?今回の目的は、自分のツイートがfav(面白い), non(普通)のどちらになるか分類することです。そのためには「favになるツイートはどのような特徴を持っているか?」を明らかにしなければなりません。特徴が明らかになっていれば、・このツイートはfavの特徴を強く持っている→favに分類・このツイートはfavの特徴を殆ど持っていない→nonに分類というモデルを作成可能

  • 1