タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

DVCに関するkidotakaのブックマーク (1)

  • Data Version Control(DVC)でデータ分析のモデル作成を再現可能にする - Qiita

    Data Version Control(DVC)とは? データ分析機械学習のコードを書いているときに遭遇する以下のような問題を解決してくれるツールです。 データセットの管理がつらい 例えば、Gitのリポジトリで大きい容量のデータセットを管理することは不便になりがち Githubには1ファイルのサイズ上限100MBで、それ以上はpushできない(https://help.github.com/articles/what-is-my-disk-quota/) 実験条件が微妙に異なるときのバージョン管理 ハイパパラメータ、前処理、データセットが異なるときバージョン管理は煩雑になりがち 実験を再現できるようにする工夫が必要 データセット、スクリプト、各種パラメータなどがそろっていないとモデル作成が再現できない 中間生成ファイルが階層的にあり、最終的にモデルが生成されるといった時の再現性の担保

    Data Version Control(DVC)でデータ分析のモデル作成を再現可能にする - Qiita
  • 1