タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

PythonとvisualizationとtextMiningに関するs-fengのブックマーク (2)

  • WordCloudとpyLDAvisによるLDAの可視化について

    表題の通り、潜在ディリクレ配分法(LDA; Latent Dirichlet Allocation)によるトピックモデルを学習させて、WordCloud・pyLDAvisで可視化までやってみます。 データセットの用意 今回は日語でやってみたかったので、以下のlivedoorニュースコーパスを利用させていただきました。 - https://www.rondhuit.com/download.html語のコーパスとしては定番ですね。 ダウンロードしてきた圧縮ファイルを解凍して、各ドキュメントのパスを読み込んでおきます。 import glob import numpy as np import pandas as pd from tqdm import tqdm np.random.seed(0) text_paths = glob.glob('livedoor-news-corpus

    WordCloudとpyLDAvisによるLDAの可視化について
  • 機械学習手法を用いてブログの文章を分析・可視化(テキストマイニング) - karaage. [からあげ]

    自分のブログのテキストを分析・可視化してみたい 以前自分のブログの分析を「内部リンク」や「はてブ情報」の観点で行ってみました。 ただ、目的無く分析してしまったので、結局イマイチどう活用してよいかよく分からない結果しか得られませんでした。 そんな前回の反省を全く活かすことなく、また何の目的もなくブログを分析してみることにしました。今回は以前から興味のあった機械学習を用いたブログの文章の分析・可視化(テキストマイニングと呼ばれるらしいです)にチャレンジしてみることにしました。どちらかというとテキストマイニングが主で、使用する素材(学習データ)に困ったので仕方なく自分のブログを使ってみたというのが正直なところです。 ネットでコピペすりゃ簡単にできるだろと思っていたのですが、自分のやりたいことするのはそれなりに大変だったので、知見としてやり方とどんなことが分かるのかを残しておきます。 ブログのテキ

    機械学習手法を用いてブログの文章を分析・可視化(テキストマイニング) - karaage. [からあげ]
  • 1