タグ

ブックマーク / qiita.com/gigamori (2)

  • Rでデータ読み込みから前処理までのTips - Qiita

    Rでテキストファイルの読み込みからデータ加工の流れ(前処理)で覚えておくとかなり便利、あるいはよくハマるポイントを中心に。 細かい知識が多いのだがまとまったものがなかったのでまとめてみた。 ありがちなハマりを回避して作業効率を上げるために。 データの読み込み データファイルの読み込み プロジェクトごとにワーキングディレクトリをセットするといい CSVファイルの読み込み read.csv()はヘッダありが前提。 文字コード fileEncoding="文字コード名"で指定できる。Windowsで作ったCSVを読み込む際、BOMが付いていることがあるのでfileEncoding="UTF-8-BOM"とする 文字列の扱い 文字列が自動的にfactor型になるので、不都合な場合はstringsAsFactors=Fを指定する 欠損値の扱い 欠損値が空欄であったり、データベースからエクスポートした

    Rでデータ読み込みから前処理までのTips - Qiita
  • Rのこれだけ覚えておけばいいdata.tableの使い方 - Qiita

    library(data.table) data.tableは簡単に言うとサイズの大きいデータフレーム。 確かに高速。慣れると大規模データはこれなくして扱えない。 データフレームと扱い方が大きく異なるが、これだけ抑えておけば十分ということをまとめた。 data.tableには行名がない dplyrとセットで使うことが多いので、同時に呼び出しておくといい ただしtidyr(集計用ライブラリ)までは使わなくていい

    Rのこれだけ覚えておけばいいdata.tableの使い方 - Qiita
  • 1