タグ

ブックマーク / kurochan-note.hatenablog.jp (1)

  • rubyで自分のツイートデータから頻出語を見つける - くろの雑記帳

    ふと自分のツイートデータを使って頻出語リストを作ってみたいなと思ったのでやってみました。 環境 Mac OS X 10.9.1 (Mavericks) ruby 2.0.0 必要なものをインストールする MeCab MeCab(めかぶ)とはオープンソースの形態素解析エンジンで、これを使うと、文字列を単語ごとに区切ることができます。 (例: 「今日はいい天気ですね」→「今日 | は | いい | 天気 | です | ね」) mecab用の辞書ファイルとともにインストールします。 $ brew install mecab-ipadic mecab gem 'natto' MeCabをrubyから使うために、今回は'natto'というgemを使います。 $ gem install natto ツイートデータをダウンロードする Twitterの設定画面の下のほうに、全ツイート履歴のダウンロードをリ

    rubyで自分のツイートデータから頻出語を見つける - くろの雑記帳
    tuto0621
    tuto0621 2014/02/21
  • 1