データが与えられた時にはまず可視化をします。そのデータがどのような仕組み(メカニズム)で作られてそうなったかを考えるために必須のプロセスです。しかしながら、どんな可視化がベストかははじめの段階では分からず、とにかくプロットしまくることになります。そのとっかかりに僕がよく使うのが散布図行列(scatter matrix,scatter plot matrix)です。 今回は3つほど紹介します。 ●1. {corrplot}パッケージの corrplot()関数 5行目で相関係数行列を作ってそれを渡しておしまいです。相関係数行列の作り方は各自の自由です。上記ではSpearmanの順位相関係数を使っていますがMICとかでもいいと思います。 このcorrplotのデメリットとしましては散布図は表示できない点です。散布図行列と言っておきながらすみません。説明変数が100個以上あるときなどは散布図を描
![[R] 散布図行列 (corrplot, pairs, GGally)](https://cdn-ak-scissors.b.st-hatena.com/image/square/544ad8f52d5de7a03d0d9639628d7c68838b5dfc/height=288;version=1;width=512/http%3A%2F%2Fblog-imgs-67-origin.fc2.com%2Fh%2Fe%2Fa%2Fheartruptcy%2F201404_ggpairs2s.png)