Apache Flume 1.5.0 で Twitter Source が入ったので、Twitter から簡単にデータを取得することができる。(注: Experimental のため利用には十分注意すること) この記事ではMac上で簡単に試すための方法を紹介する。 環境 Flume バージョン: CDH 5.4.2 (1.5.0 ベース) OS: Mac OS X 10.10.3 準備 ファイルのダウンロード Cloudera のリポジトリからFlumeのtar.gzを取得する。 最新版へのリンク 適当な場所に Flume を設置し、展開する。私は ~/lib/flume にしている。 次に avro-tools をインストールする。 Twitter API キーとアクセストークンの取得 https://apps.twitter.com/ から取得する。取得の仕方はググってください。 以下