タグ

ブックマーク / antibayesian.hateblo.jp (1)

  • Rによるtwitterテキストマイニング 〜テキストに対する学習とは〜 - あんちべ!

    あんちべのすべらない話〜俺のツイートがこんなにウケないはずがない〜 View more presentations from AntiBayesian 自分のtweetがウケるか滑るかをpostする前にrandomForestで判別してみよう! LTは制限時間10分だったため、詳細は意図的に省きました。 記事では皆さんにも実践頂けるよう、学習データの作り方についてスライドより詳しく説明したいと思います。 ●そもそも「学習する」とは? 今回の目的は、自分のツイートがfav(面白い), non(普通)のどちらになるか分類することです。 そのためには「favになるツイートはどのような特徴を持っているか?」を明らかにしなければなりません。 特徴が明らかになっていれば、 ・このツイートはfavの特徴を強く持っている→favに分類 ・このツイートはfavの特徴を殆ど持っていない→nonに分類 という

    Rによるtwitterテキストマイニング 〜テキストに対する学習とは〜 - あんちべ!
  • 1