タグ

ブックマーク / okumuralab.org/~okumura (3)

  • ワードクラウド

    はじめに ワードクラウド(word cloud)とは頻出語を頻度に比例する大きさで雲のように並べたものです。 英語のワードクラウドは wordcloud ライブラリで簡単に描けます。あらかじめ pip install wordcloud などとしてインストールしておきます。テキストとしては何でもいいのですが、ここでは WordCloud() の説明文(docstring)を用いてみます: from wordcloud import WordCloud text = WordCloud.__doc__ wc = WordCloud(width=480, height=320) wc.generate(text) wc.to_file('wc1.png') 日語はこのように簡単にはいきません。まずは単語に分解しなければなりません(形態素解析)。そのためのツールとして、昔から有名なMeCab(

    teddy-g
    teddy-g 2020/03/05
    WordCloudの基本。
  • Python 3 インストール

    ここでは Python 3 の最新版を一つだけインストールする方法を解説します。複数の Python を切り替えて使う方法は、例えばこちらの解説をご参照ください。 最新のものは Python 3.12 です。この後にさらに小数点が付いて 3.12.x のようなバージョン番号になります。3.12 が出た当初はまだ対応していないライブラリがあったのですが、3.12.2 くらいの時点でほぼすべてのライブラリが対応しましたので、ここでは 3.12.x の最新のものをインストールすることにします。 なお、Status of Python versions にあるように、現在3.8以上のバージョンがサポートされています。 インストールしないで Google Colaboratory で使う方法については実行のページに移しました。 ライブラリ名のタイポ(綴り間違い)を狙ってマルウェアをインストールさせる

    teddy-g
    teddy-g 2020/03/01
    このページも役に立った。その内Python3環境は綺麗にする。
  • 主成分分析と因子分析

    ここではデータとして2022年度全国学力・学習状況調査の結果を使う: df = read.csv("http://okumuralab.org/~okumura/python/data/atest2022.csv") 頭の部分だけ表示してみる: head(df) 小国 小算 小理 中国 中数 中理 1 64.44456 61.07105 62.87208 68.59639 48.93763 48.96912 2 67.81161 63.19436 65.83762 69.13618 51.55864 48.98470 3 66.98455 61.59387 63.19816 69.80850 48.52725 47.56724 4 63.68711 60.15438 61.49521 69.14642 48.57422 49.72042 5 70.78273 66.45425 70.614

    teddy-g
    teddy-g 2015/12/07
    Rでとりあえずこの通りやったらPCAとFAはできるという。
  • 1

公式Twitter

  • @HatenaBookmark

    リリース、障害情報などのサービスのお知らせ

  • @hatebu

    最新の人気エントリーの配信