本webサイトは,技術書典12にて頒布したがんばらないデータ加工 Rによるくり返し作業入門 前編のオンラインバージョン こちらは随時updateされていく予定 概要 本書の目的 データ加工での面倒な作業をRとRStudioで手軽に実行できるようになるための基礎知識を紹介 本書の内容 Rのモダンな方法を使い,データ加工の過程(例:前処理、データクリーニング、データクレンジング、データラングリングなど)で用いる基本関数の紹介 実際は核心の部分に入る前の準備段階までにとどまる。タイトルに「前編」とあるのはその理由による 基本的にデータフレーム(1.6参照)の形になったきれいな構造を想定しているが,ここで解説した技術に熟達することで,その他のデータ形式や汚いデータ構造にも立ち向かえるようになる 執筆動機 本書を書こうと思ったのは拙既刊書『Rで読むExcelファイル』と同じく,「RとRStudioを
freee人事労務の品質改善を専任で活動している keik です。 freee人事労務ではアプリケーション開発の自動テスト環境として CircleCI を利用しています。すべてのコードの変更は GitHub 上の Pull Request を経由して行われますが、Pull Request のマージ条件の一つとして自動テストをパスすることを求めるようにしています。 つまり、どんな些細な変更であっても、急ぎの変更であっても、リリースするためには基本的には自動テストの結果を待つ必要があります。一方で、コードベースは日々成長しており、それに比例して自動テストの実行時間も長くなっています。 ここに、ゆっくりと、ジレンマが生じはじめます。 品質を高める目的の自動テストだが、実行時間が長いと品質のボトルネックになりうる。 具体的には以下のようなシナリオが考えられます。 些細な改善が億劫になる(自動テスト
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く