タグ

ブックマーク / qiita.com/chike0905 (1)

  • Twitterでテキスト検索するときにRTを除外する方法 - Qiita

    twitterからtweetの収集する際、普通にGetSearchを叩くと、RTされたツイートはそれぞれRTに対してidが振られ、別々のツイートとして認識されてしまうため、検索結果に複数同じテキストのtweetが出てきてしまう。 テキスト分析をするにしては不都合なのでRTされたツイートを一つのツイートとして検索するためにはクエリにexclude:retweetsをつけることで除外できる。 In [1]: tweet = Api.GetSearch("湘南藤沢キャンパス") In [2]: for a in tweet: print "ID: "+str(a.id) print "text: \""+a.text+ "\"" ...: ID: 739627160470704128 text: "I'm at 慶應義塾大学 湘南藤沢キャンパス (SFC) - @keio_univ_pr in

    Twitterでテキスト検索するときにRTを除外する方法 - Qiita
  • 1