AIの研究者や開発者にとって機械学習用の公開データを見つけるのは困難な作業かもしれませんが、オープンソースの一つとしてTwitterデータを利用することもできます。数々の教育機関や研究チーム、個人の研究者などがTwitterから抽出されたツイートのデータを公開しています。感情分析、モデレーション、その他の自然言語処理の活用事例に至るまで、Twitterデータは様々な機械学習アルゴリズムの開発に利用されています。 以下にTwitter解析に利用できる、公開されているTwitterデータセットを20件まとめました。 TwitterデータセットApple Twitterセンチメント: 大手IT企業Appleに関するツイートから構成されるデータセット。ハッシュタグ #AAPL や @apple などを含むツイートがAppleに対する感情に応じてポジティブ、ネガティブ、ニュートラルに分類されている。
![人間参加型(human-in-the-loop)機械学習とは?](https://cdn-ak-scissors.b.st-hatena.com/image/square/c33c902dd3e2eeae553888ddbc62b671384b3243/height=288;version=1;width=512/https%3A%2F%2Flionbridge.ai%2Fwp-content%2Fuploads%2F2019%2F07%2F2019-07-31_20-best-twitter-datasets-hero.jpg)