今学期から、某政治学トップジャーナルのRAとして働いている。 主な仕事は、採択されたペーパーで報告されている統計分析の結果が再現(reproduce)できるかを確認することである。1 そのため他人が書いたRやStataのコードを見る機会が多いが、再現性や可読性の高いコードの書き方について、いろいろと学ぶところが多い。 そこで、これまでに得た教訓を以下にまとめておこうと思う。 1. 途中で変数やオブジェクトを削除しない データの前処理をしたり異なる種類の複数の分析をする際、分析ファイル内で変数やオブジェクトを削除してしまうケースをよく見るが、これはできるだけやめた方がいい。 後から元の変数の情報や前に行った分析の結果を参照できなくなってしまい、大変不便である。 2. ペーパーで報告されている全ての数値情報に関するコードを公開する 当たり前のように聞こえるかもしれないが、例えば記述統計に関する