概要 機械学習におけるモデルの開発を行う際に、基本的にデータセットをいくつかのグループに分割して検証を行います。 具体的には trainデータ、validationデータ、testデータ という3つのグループに分けられることが多くあります。 また、扱うデータセットや検証の目的によっては trainvalデータ というグループを作ることもあります。 本記事では、上記のグループそれぞれについて解説を行います。 train, validation, test のそれぞれの意味と用途 一般的に、収集したデータセットは train, validation, test の3グループに分割されることが多いです。 trainデータ trainデータはその名の通り、学習に用いるデータセットを指します。 よって、モデルの学習(重みの更新)はこのデータセットのみを基に行われます。 validationデータ v
![データセットの分ける時の train, validation, trainval, test それぞれの意味](https://cdn-ak-scissors.b.st-hatena.com/image/square/60c15b086057f1f0fb0e9b2267b84e79c857c91b/height=288;version=1;width=512/https%3A%2F%2Fwp.nakanishi.pro%2Fwp-content%2Fuploads%2F2020%2F11%2Fdateset.jpg)