タグ

Excelとrに関するmkawanoのブックマーク (2)

  • Rによるデータクリーニング実践――政府統計からのグラフ作成を例として|Colorless Green Ideas

    データクリーニングが繁雑な作業であることを示すために、政府の統計データから日の男のみの高校と女のみの高校の数の推移をグラフ化する事例を紹介する。クリーニングの作業にはR言語を用い、複数のファイルを統合し、整然データに変え、グラフを作成する。 はじめに データクリーニングは、データ分析の際に非常に重要なプロセスの1つであるが、データ分析の教科書では必ずしも十分に扱われていない。そこで、現実のデータクリーニングがどのように行われるかについて、一事例を紹介したいと思う。具体的には、統計処理に適したプログラミング言語のRを用いて、粗悪なデータから簡単な折れ線グラフが作成できる程度のきれいなデータにするまでのデータクリーニングを実施していく。 記事の対象読者 記事は、既存のデータに対して自らの手でデータ分析を実施している人、または実施しようと考えている人を主な対象にしている。データ分析の際にど

    Rによるデータクリーニング実践――政府統計からのグラフ作成を例として|Colorless Green Ideas
  • とある弁当屋の統計技師(データサイエンティスト)

    Rの基礎 コンソール Rはコンソールと呼ばれるウィンドウに命令を入力してEnterキーを押すと,指定された命令が実行されます. 命令はプロンプトと呼ばれる ">" 記号の右に入力します. 例:足し算掛け算 > 1 + (2 * 3) - (4 / 5) [1] 6.2 数値などの前後にあるスペースは省いても問題ありませんが,空白を挟む方が読みやすくなります. 変数 代入 Rではデータに名前をつけて登録します.これを変数と言います.変数を登録するには <- という記号を使います.データに名前を付ける操作を代入といいます. 例:8 という数字を x という名前で登録します.名前は何でもいいのですが,数字で始まってはいけません. x <- 8 例:1, 2, 3, 4, 5 という5つの数字を x2 という名前で登録します.連続する整数は「:」を間に挟んで指定することができます. x2 <- 1

  • 1