2014年は研究の再現性ということが非常に話題になった年だったと思います。ソフトウェア開発の世界の技術であるバージョン管理システムが、データ分析のコードの管理と再現性の確保にも非常に便利だと思ったので簡単なまとめです。分析のコードは書くけどバージョン管理になじみがない研究者やwannabe(私とか)を対象にしています。 "ほんとは簡単?SourceTreeでGitを始めよう!" (http://naichilab.blogspot.jp/2014/01/gitsourcetreegit.html ) "サルでもわかるGit入門" (http://www.backlog.jp/git-guide/intro/intro1_1.html ) というわかりやすい記事を参照しながら、データ分析の文脈で解説します。 とりあえずファイル名でバージョン管理 データハンドリングや解析のコードを変更するにあ