タグ

ブックマーク / qiita.com/shu65 (2)

  • PyTorchでGPU関係のプロファイルを取得する - Qiita

    はじめに 今回はPyTrochでCUDAを使った場合のプロファイル取得について調べたことのまとめです。 今回は主に自分の学習コードのどのあたりに時間がかかっているのか?という観点を調べることを目的としたプロファイルの取得方法について説明します。 CUDAの関数自体の高速化するために取得するようなプロファイルについては今回は言及しません。ご了承ください。 PyTorchにおけるプロファイラ PyTorchのコードのCUDAのプロファイルを取得する場合、以下の二つのパターンが考えられます。 PyTorchが提供しているプロファイラを利用する CUDAが提供しているプロファイラを利用する 今回はそれぞれについて説明します。 PyTorchが提供しているプロファイラについて PyTorchは主に以下のプロファイル取得方法があります。 torch.autograd.profiler.profile

    PyTorchでGPU関係のプロファイルを取得する - Qiita
    dann
    dann 2020/12/27
  • NVIDIA Nsight Systemsを使ってCUDAのプロファイリングをやってみる - Qiita

    CUDAのプロファイラとして長らくnvprofとnvvpをが使われてきたと思いますが、最近これらのツールのドキュメントの最初のほうに以下のように書かれています。 Note that Visual Profiler and nvprof will be deprecated in a future CUDA release. It is recommended to use next-generation tools NVIDIA Nsight Compute for GPU profiling and NVIDIA Nsight Systems for GPU and CPU sampling and tracing. 参考:https://docs.nvidia.com/cuda/profiler-users-guide/index.html というわけで、そろそろ私も「移行するかー」と

    NVIDIA Nsight Systemsを使ってCUDAのプロファイリングをやってみる - Qiita
    dann
    dann 2019/05/20
  • 1