はじめにみなさまこんにちは。 データ分析に力を入れている会社でも、大量に蓄積されているテキストデータから有用な情報を抽出する「テキストマイニング」はなかなかハードルの高い分野ではないでしょうか? この連載では実際に Twitter でつぶやかれている話題の分析を行うことで、テキストマイニング行う際に必要になる技術・手法を解説したいと思います。 具体的には以下の内容を予定しています。1回目: fluentd による Tweet データ収集2回目: 単純集計によるテキストマイニング3回目: 機械学習によるTweet分類今回は以前の連載記事 【特別連載】さぁ、社内でデータ分析を始めよう!(第2回:新しくログを作成してみる) で解説した fluentd を利用して、対象となるテキストデータを Twitter から収集してみたいと思います。 具体的には Twitter Streaming API を