ブックマーク / shuyo.hatenablog.com (1)

  • ツイートの表現を正規化(Cooooooooooooooollllllllllllll => cool) - 木曜不足

    EMNLP 2011 でひときわ目を引くタイトル "Cooooooooooooooollllllllllllll!!!!!!!!!!!!!! Using Word Lengthening to Detect Sentiment in Microblogs" (Brody & Diakopoulos) は、twitter 上での表現を評判分析に使う話。 Cooooooooooooooollllllllllllll のような文字を必要以上に繰り返す twitter でよくみる表現に注目して、このような表現が意見や評価を述べるときによく使われるという点を主張しているのがポイント。 まあ直感的にもうなずける分析だと思う。 論文の中では、そのためにまず Cooooooooooooooollllllllllllll -> cool のように正規化を行っている。 提案されている手法がとてもシンプルでおも

    ツイートの表現を正規化(Cooooooooooooooollllllllllllll => cool) - 木曜不足
    ApexCypher
    ApexCypher 2011/09/14
    ツイート分析
  • 1