teddy-gのブックマーク - はてなブックマーク

ワードクラウド
はじめにワードクラウド（word cloud）とは頻出語を頻度に比例する大きさで雲のように並べたものです。英語のワードクラウドは wordcloud ライブラリで簡単に描けます。あらかじめ pip install wordcloud などとしてインストールしておきます。テキストとしては何でもいいのですが、ここでは WordCloud() の説明文（docstring）を用いてみます： from wordcloud import WordCloud text = WordCloud.__doc__ wc = WordCloud(width=480, height=320) wc.generate(text) wc.to_file('wc1.png') 日本語はこのように簡単にはいきません。まずは単語に分解しなければなりません（形態素解析）。そのためのツールとして、昔から有名なMeCab（
teddy-g 2020/03/05
WordCloudの基本。

python

wordcloud
リンク
Python 3 インストール
ここでは Python 3 の最新版を一つだけインストールする方法を解説します。複数の Python を切り替えて使う方法は、例えばこちらの解説をご参照ください。最新のものは Python 3.12 です。この後にさらに小数点が付いて 3.12.x のようなバージョン番号になります。3.12 が出た当初はまだ対応していないライブラリがあったのですが、3.12.2 くらいの時点でほぼすべてのライブラリが対応しましたので、ここでは 3.12.x の最新のものをインストールすることにします。なお、Status of Python versions にあるように、現在3.8以上のバージョンがサポートされています。インストールしないで Google Colaboratory で使う方法については実行のページに移しました。ライブラリ名のタイポ（綴り間違い）を狙ってマルウェアをインストールさせる
teddy-g 2020/03/01
このページも役に立った。その内Python3環境は綺麗にする。

mac

python3
リンク
主成分分析と因子分析
ここではデータとして2022年度全国学力・学習状況調査の結果を使う： df = read.csv("http://okumuralab.org/~okumura/python/data/atest2022.csv") 頭の部分だけ表示してみる： head(df) 小国小算小理中国中数中理 1 64.44456 61.07105 62.87208 68.59639 48.93763 48.96912 2 67.81161 63.19436 65.83762 69.13618 51.55864 48.98470 3 66.98455 61.59387 63.19816 69.80850 48.52725 47.56724 4 63.68711 60.15438 61.49521 69.14642 48.57422 49.72042 5 70.78273 66.45425 70.614
teddy-g 2015/12/07
Rでとりあえずこの通りやったらPCAとFAはできるという。

R

bigdata

pca

analysis

analytics
リンク
1

はてなブックマーク

タグ

ブックマーク / okumuralab.org/~okumura (3)

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

ブックマーク / okumuralab.org/~okumura (3)

ワードクラウド

Python 3 インストール

主成分分析と因子分析

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス