こちらを参考に、Apache SparkのSpark Streamingを使用した、リアルタイムのTwitter構文解析処理を試した手順を纏めます。実行環境は次の通りです。 ・CentOS 7.5 ・Apache Spark 2.3.1 ・Scala 2.12.6 ・kuromoji 0.7.7 ・Spark Streaming Twitter 2.10 rev 1.1.0 ・Twitter4J 3.0.3 Twitter解析 実行結果 「iPhone6」が含まれるTweet中に出現する単語と、その頻度をカウント Apache Spark、Scala、sbtのインストールは、こちらの手順で実施しました。 kuromojiのインストール SPARK_HOMEへのkuromoji(日本語形態素解析エンジン)のダウンロードと展開 # cd /usr/local/lib/spark # wget
