どうも。最近 Coursera で機械学習のコースを受講している @QUANON です。 概要 教師あり学習のデータセットには、 トレーニングセット (training set) バリデーションセット (validation set) 使用しない場合もある。 テストセット (test set) があります。しかし、バリデーションセットとテストセットの違いが未だによく分からない、あるいは、なぜテストセットだけでなくバリデーションセットも必要なのかがピンと来ていないので、調べてみました。 バリデーションセットの役割 トレーニングセットを使って分類器を訓練した後で、その分類器のハイパーパラメータをチューニングするために使用します。様々なハイパーパラメータについて、同じトレーニングセットを使って訓練した後で、さらに同じバリデーションセットを使ってそのパフォーマンスを計測します。そして、最もパフォー
![なぜ教師あり学習でバリデーションセットとテストセットを分ける必要があるのか? - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/eba72bdef9bd3ce6a1e46e0d4309b198c6cf891b/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Farticle-ogp-background-412672c5f0600ab9a64263b751f1bc81.png%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTk3MiZoPTM3OCZ0eHQ9JUUzJTgxJUFBJUUzJTgxJTlDJUU2JTk1JTk5JUU1JUI4JUFCJUUzJTgxJTgyJUUzJTgyJThBJUU1JUFEJUE2JUU3JUJGJTkyJUUzJTgxJUE3JUUzJTgzJTkwJUUzJTgzJUFBJUUzJTgzJTg3JUUzJTgzJUJDJUUzJTgyJUI3JUUzJTgzJUE3JUUzJTgzJUIzJUUzJTgyJUJCJUUzJTgzJTgzJUUzJTgzJTg4JUUzJTgxJUE4JUUzJTgzJTg2JUUzJTgyJUI5JUUzJTgzJTg4JUUzJTgyJUJCJUUzJTgzJTgzJUUzJTgzJTg4JUUzJTgyJTkyJUU1JTg4JTg2JUUzJTgxJTkxJUUzJTgyJThCJUU1JUJGJTg1JUU4JUE2JTgxJUUzJTgxJThDJUUzJTgxJTgyJUUzJTgyJThCJUUzJTgxJUFFJUUzJTgxJThCJUVGJUJDJTlGJnR4dC1hbGlnbj1sZWZ0JTJDdG9wJnR4dC1jb2xvcj0lMjMyMTIxMjEmdHh0LWZvbnQ9SGlyYWdpbm8lMjBTYW5zJTIwVzYmdHh0LXNpemU9NTYmcz00NDg1OTViMjc3MTI3ODNlMTMwY2VkMmZjMDkwNTBkYw%26mark-x%3D142%26mark-y%3D57%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZoPTc2Jnc9NzcwJnR4dD0lNDBRVUFOT04mdHh0LWNvbG9yPSUyMzIxMjEyMSZ0eHQtZm9udD1IaXJhZ2lubyUyMFNhbnMlMjBXNiZ0eHQtc2l6ZT0zNiZ0eHQtYWxpZ249bGVmdCUyQ3RvcCZzPWFmODhiZTE3NGIwZTQyNTI1MzRkOGQ5NDMxNmQwYzFl%26blend-x%3D142%26blend-y%3D486%26blend-mode%3Dnormal%26s%3Ded7955a08bb7bd20203eb6b24b139b0f)