Rでテキストファイルの読み込みからデータ加工の流れ(前処理)で覚えておくとかなり便利、あるいはよくハマるポイントを中心に。 細かい知識が多いのだがまとまったものがなかったのでまとめてみた。 ありがちなハマりを回避して作業効率を上げるために。 データの読み込み データファイルの読み込み プロジェクトごとにワーキングディレクトリをセットするといい CSVファイルの読み込み read.csv()はヘッダありが前提。 文字コード fileEncoding="文字コード名"で指定できる。Windowsで作ったCSVを読み込む際、BOMが付いていることがあるのでfileEncoding="UTF-8-BOM"とする 文字列の扱い 文字列が自動的にfactor型になるので、不都合な場合はstringsAsFactors=Fを指定する 欠損値の扱い 欠損値が空欄であったり、データベースからエクスポートした
![Rでデータ読み込みから前処理までのTips - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/87cec76480e6db4591140ddbe83a66b41a97b0a3/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Farticle-ogp-background-412672c5f0600ab9a64263b751f1bc81.png%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTk3MiZoPTM3OCZ0eHQ9UiVFMyU4MSVBNyVFMyU4MyU4NyVFMyU4MyVCQyVFMyU4MiVCRiVFOCVBQSVBRCVFMyU4MSVCRiVFOCVCRSVCQyVFMyU4MSVCRiVFMyU4MSU4QiVFMyU4MiU4OSVFNSU4OSU4RCVFNSU4NyVBNiVFNyU5MCU4NiVFMyU4MSVCRSVFMyU4MSVBNyVFMyU4MSVBRVRpcHMmdHh0LWFsaWduPWxlZnQlMkN0b3AmdHh0LWNvbG9yPSUyMzIxMjEyMSZ0eHQtZm9udD1IaXJhZ2lubyUyMFNhbnMlMjBXNiZ0eHQtc2l6ZT01NiZzPTQ0NmYxNDY1MDgzZGNjYjdiNmFiZWY4ZDM2MmIxY2I3%26mark-x%3D142%26mark-y%3D57%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZoPTc2Jnc9NzcwJnR4dD0lNDBnaWdhbW9yaSZ0eHQtY29sb3I9JTIzMjEyMTIxJnR4dC1mb250PUhpcmFnaW5vJTIwU2FucyUyMFc2JnR4dC1zaXplPTM2JnR4dC1hbGlnbj1sZWZ0JTJDdG9wJnM9MDlkNjRkNTJjNDBlZDVmNGYyNjQ4ZjY5ODNkNmJhMmI%26blend-x%3D142%26blend-y%3D486%26blend-mode%3Dnormal%26s%3D4c6ebf0ffc29166f26fdd6240545ba6c)