はじめに ビジネスにおいて予測モデルを作成する際,ユーザにとっての解釈しやすさを優先して,線形モデルや決定木のような比較的単純なモデルを使わざるを得ないという場合は結構多いのではないだろうか. しかし,せっかくデータ分析業をやっている身としては,仕事でももっと色々なモデルを活用したいというのが人情であろう.まあそういう個人的欲求は置いておくにしても,単純なモデルを使う際に気を付けないといけない事柄というのが色々ある. 説明変数と目的変数の関係は線形か? 予測に効くのはどの変数か? 変数間の交互作用を見逃していないか? 等々. さて,ここで複雑なモデルであれば非線形性や交互作用も自動的に取り入れてくれるのになあ,と思ったところで発想を転換してみたい.つまり,最終的な予測モデルは単純なものを使うとしても,上記のような問題を検討するための探索的データ分析の段階で,より複雑なモデルを活用できるので
![edarf パッケージ:ランダムフォレストで探索的データ分析 - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/9d63399c5b81dd9295f01fd348359c838c36cfa2/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Farticle-ogp-background-9f5428127621718a910c8b63951390ad.png%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTkxNiZoPTMzNiZ0eHQ9ZWRhcmYlMjAlRTMlODMlOTElRTMlODMlODMlRTMlODIlQjElRTMlODMlQkMlRTMlODIlQjglRUYlQkMlOUElRTMlODMlQTklRTMlODMlQjMlRTMlODMlODAlRTMlODMlQTAlRTMlODMlOTUlRTMlODIlQTklRTMlODMlQUMlRTMlODIlQjklRTMlODMlODglRTMlODElQTclRTYlOEUlQTIlRTclQjQlQTIlRTclOUElODQlRTMlODMlODclRTMlODMlQkMlRTMlODIlQkYlRTUlODglODYlRTYlOUUlOTAmdHh0LWNvbG9yPSUyMzIxMjEyMSZ0eHQtZm9udD1IaXJhZ2lubyUyMFNhbnMlMjBXNiZ0eHQtc2l6ZT01NiZ0eHQtY2xpcD1lbGxpcHNpcyZ0eHQtYWxpZ249bGVmdCUyQ3RvcCZzPTIxOWJkZTVmZmM2NWU1MDlmNjEzMTM2NWU1MTBlZTYy%26mark-x%3D142%26mark-y%3D112%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTYxNiZ0eHQ9JTQwbmFrYW1pY2hpJnR4dC1jb2xvcj0lMjMyMTIxMjEmdHh0LWZvbnQ9SGlyYWdpbm8lMjBTYW5zJTIwVzYmdHh0LXNpemU9MzYmdHh0LWFsaWduPWxlZnQlMkN0b3Amcz0xMjNjMTYzZDc2NTI2ZWRiYWNlOGExNjkzZDVjODAwMA%26blend-x%3D142%26blend-y%3D491%26blend-mode%3Dnormal%26s%3D1be54626173962d4a76b20ad81772fea)