タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

PythonとkernelとGPUに関するslay-tのブックマーク (2)

  • PyTorchでGPUの計算時間を正しく計測する - まったり勉強ノート

    測定結果 結果として、間違った測定方法だとCPUGPUを比較すると「1883倍速くなりました!」という主張をしてしまうことになります。ちなみにGPUで1000倍なんて数字が出てきたら確実にどこか間違えています。実際、今回のケースでは当は「約59倍速くなりました!」というのが正しい結果になります。 torch.cuda.synchronize()とtorch.cuda.Eventを使った場合の違い 今回torch.cuda.synchronize()とtorch.cuda.Event の2種類を紹介しました。場合によっては使い分けをしたほうがいいのでこの二つの違いを説明していきます。 torch.cuda.synchronize() を利用した場合、簡単なので測定しやすいのでいいので、ぱっと測定したい場合はこちらの方法が楽でよいかと思います。ただ、こちらの方法はkernel関数の発行と測

  • CuPyのElementwiseKernelで楽にGPUの恩恵を受ける - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? Powered by DLHacks はじめまして、マンボウです。普段は信号処理や画像解析をやっています。 唐突ですが、PythonからピンポイントにCUDAの機能を利用できるCuPyのElementwiseKernelを紹介します。 CUDAと言っても恐れることはなく、「C++の記法をなんとなく理解している」レベルの人でも簡単に利用できます。 はじめに Pythonは書きやすく読みやすいので私は好きです。 しかし、膨大な信号や大量の画像をPythonで扱っていると、どうしても速度が気になりだします。 かといって、全てをC++やCUDA

    CuPyのElementwiseKernelで楽にGPUの恩恵を受ける - Qiita
  • 1