タグ

データフレームに関するh1saoのブックマーク (2)

  • データフレームの特徴をもっと早く掴みたい ~ ハドリーへの挑戦 - cucumber flesh

    探索的なデータ分析 (Explore Data Analysis: EDA)を行う際は、データの要約や欠損の有無の確認、可視化が欠かせない作業となります。 特に可視化は、データのもつ性質や関係を表現するのに大変役立ちます。一方で、可視化に用いた図はコードとは別に保存する必要があったり、作図のためのコードを書いたりと、面倒な側面もあります。 … きちんとした作図は面倒だけどデータの性質や欠損について把握したい。そんな時にはコンソール上での可視化を試しましょう。そのためのパッケージをHadley Wickhamが開発しています。 https://github.com/hadley/precis Rにはそもそも、オブジェクトの情報を要約してくれるsummary()関数があるのですが、この precisパッケージは、それを置き換えるような設計を目指しているそうです。早速使ってみましょう。 # gi

    データフレームの特徴をもっと早く掴みたい ~ ハドリーへの挑戦 - cucumber flesh
  • Rプログラム (TAKENAKA's Web Page)

    この文書の最終的な目標は,いくつものデータセットを一括処理するためのプログラムを 書くことですが,そのまえに,ひとつのデータファイルを読み込んでの処理を ごくごく簡単に練習してみます. 練習用ディレクトリとデータファイルの用意 すでに前のページの練習のためにディレクトリは作ってあるかもしれません. それならそれを使いましょう.まだ作ってないなら,さっそく用意してください. 名前はなんでもけっこうです. そのディレクトリの中に,最初に使う練習用データ len_width.txt を入れます. >データファイル len_width.txt クリックするとそのまま内容が表示される場合,全体をコピーしてから エディタの新規文書に貼りつけるとか,「対象をファイルに保存」「リンク先を保存」 (ブラウザによる)というようなメニュー項目を選ぶとかしてみてください. このファイルに,以下のように3列のデータ

  • 1