DataLoaderクラスの概要 DataLoaderクラスは、PytorchのDatasetクラスを用いて、データをロードしてミニバッチを作成してくれるクラスです。非常に単純なクラスに見えるのですが、ドキュメントを見る感じだと、引数が多くて、意外に奥が深そうです。 本記事では、DataLoaderのマルチプロセスの処理など、実行速度に関係する部分を解説していきます。 DataLoaderでデータをロードする場合、データセットをどこか(Datasetの実装によるが主にディスク)からロードして、色々な処理をして、ミニバッチを作成する処理の流れがよくあるパターンです。DataLoaderがミニバッチを作成するとき、Dataset内でされる処理の多さによっては、結構長い処理がなされます。そのため、DataLoaderには、num_workersという引数を設定できるようになっていて、設定したワー