はじめに 大学の研究で機械学習を用いて文章生成を行うために、大量のテキストデータが欲しかったのでそのコーパスとしてツイートを集めました。 Developerアカウントの作成後ツイート取得まで、色々手こずったので備忘録として書いておきます。 ※初めて記事書くので読みづらいところあればごめんなさい、、、、。 Twitter API Twitter APIにはSandbox、Premium、Enterpriseの3種類があり、それぞれ使える機能も異なります。詳細については割愛します。(Pricing)。 今回はPremiumのFull-Archiveを利用しました。 Search API Full-Archive Full-Archiveは2004年以降のツイート全てが取得できます。 一度のリクエストで500ツイートまで取得でき、さらに1ヶ月あたりに最高で2500リクエストできるので最大で125