エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
【CUDAプログラミング】PyTorch C++/CUDA APIを使って躓いたところ&解決策集 - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
【CUDAプログラミング】PyTorch C++/CUDA APIを使って躓いたところ&解決策集 - Qiita
はじめに 前回記事の続きという位置づけの記事です. 前回記事でPyTorchのCUDAエクステンションの基本的... はじめに 前回記事の続きという位置づけの記事です. 前回記事でPyTorchのCUDAエクステンションの基本的な使い方を紹介しました.本記事ではより発展的な処理をしたい人たちに向けて,単なる足し算以上の複雑な処理をするために知っておきたいことまとめます.扱う内容は以下です. __device__修飾子 CUDA関数内での変数の型変換(float → scalar_t) torch::Tensor型変数の形の取得方法 CUDAテンソルの生成方法 テンソルのcontigous化 CUDAカーネルから呼びだせる関数を定義したい CUDAではあらかじめ定義した関数をカーネルから呼び出すことができます.ただし,ここで定義する関数はスカラーテンソル同士の演算という想定です.例えば,シグモイド関数は以下のように定義します. template <typename scalar_t> __device__