タグ

ブックマーク / qiita.com/rmecab (1)

  • ウェブスクレイピングと形態素解析 - Qiita

    rvest パッケージを使ってWEBから文字列を取得し、これをデータフレームにして RMeCab の doDF() で解析する。 前提 MeCab がインストールされた環境。OSXでのMeCabのインストールについては https://sites.google.com/site/rmecab/home/install を参照。 さら R がインストールされており、追加で以下のパッケージが導入されている。 install.packages(c("dplyr", "rvest", "wordcloud", "igraph"), depend = TRUE) install.packages("RMeCab", repos = "http://rmecab.jp/R")

    ウェブスクレイピングと形態素解析 - Qiita
    rti7743
    rti7743 2017/05/05
    ブログの本文抽出はgoogleadが貼ってある場所を使うのが最強!!っていう意見を10年ぐらい前に聞いたことがあるんだけど、最近はどうなんだろう?
  • 1