高速演算記第3回「チューニング技法その１　ＣＵＤＡプログラミングガイドからピックアップ」 | G-DEP

テクノロジーカテゴリーの変更を依頼記事元:

www.gdep.jp

7 usersがブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

高速演算記第3回「チューニング技法その１　ＣＵＤＡプログラミングガイドからピックアップ」 | G-DEP

今回はFermi解説から一旦はずれ、実際にプログラムを開発する際のチューニングポイントを紹介したいと思... 今回はFermi解説から一旦はずれ、実際にプログラムを開発する際のチューニングポイントを紹介したいと思います。CPUで実行していたコードをそのままGPU上で動作させても速度向上が得られない場合は以下の点を確認してみてはいかがでしょうか。まずはじめに基本機能のおさらいをしたいと思います。前回からご紹介している通り、Fermi内部ではマルチプロセッサと呼ばれる実行ユニットが複数存在しています。各実行ユニットは１つのスケジューラと、32個の演算コアから構成され、スレッドを２サイクルあたり２ワープ処理することが可能となっています。32スレッドをワープと呼ばれる１つの単位として扱い、GPU上でスレッドを実行する上で扱いやすい単位とされています。また、少し粗い単位として複数スレッドをブロックとして扱うことが可能です。１ブロック内の最低スレッド数はありませんので、１スレッドのブロックを構成することも

ブックマークしたユーザー

ariel012012/01/27
jack09092010/12/31
Nao_u2010/12/23
uarm2010/12/19
aont2010/11/25

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx