はじめに 今回はPyTrochでCUDAを使った場合のプロファイル取得について調べたことのまとめです。 今回は主に自分の学習コードのどのあたりに時間がかかっているのか?という観点を調べることを目的としたプロファイルの取得方法について説明します。 CUDAの関数自体の高速化するために取得するようなプロファイルについては今回は言及しません。ご了承ください。 PyTorchにおけるプロファイラ PyTorchのコードのCUDAのプロファイルを取得する場合、以下の二つのパターンが考えられます。 PyTorchが提供しているプロファイラを利用する CUDAが提供しているプロファイラを利用する 今回はそれぞれについて説明します。 PyTorchが提供しているプロファイラについて PyTorchは主に以下のプロファイル取得方法があります。 torch.autograd.profiler.profile