エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
CUDA(スレッド、スレッドブロック、グリッド)
GPUがもつ多数の演算コアを活用してその能力を引き出すためには避けて通ることができない、カーネル実行... GPUがもつ多数の演算コアを活用してその能力を引き出すためには避けて通ることができない、カーネル実行環境について説明します。 スレッドとスレッドブロック カーネルとして記述した__global__付き関数をホスト側から呼び出すと、 この関数はGPU上で複数のスレッドとなって並列動作します。 ここで並列動作させたいスレッドの数は、ホスト側からカーネル関数を呼び出す際に指定することになります。 例えば512個のkernel_funcスレッドを生成して並列実行させたい場合、次のようにホスト側のコードを記述します。 kernel_func<<<1, 512>>>(カーネル引数1,カーネル引数2, ...); ホスト側からカーネル関数を呼び出す際に付加する<<<>>>内の2つ目のパラメータで動作させたいスレッド数512を指定しています。 では、この<<<>>>の1つ目のパラメータは何でしょう。 <<