エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
高速演算記 第25回 「Kepler解説その2 〜Kepler世代の新機能〜」 | G-DEP
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
高速演算記 第25回 「Kepler解説その2 〜Kepler世代の新機能〜」 | G-DEP
前回の記事ではサンプルプログラムを通じてK20の優れた性能を見ました。今回は具体的なカーネルを例に挙... 前回の記事ではサンプルプログラムを通じてK20の優れた性能を見ました。今回は具体的なカーネルを例に挙げて、K20のハイパフォーマンス性と新機能を利用したチューニング例をご紹介します。今回扱うカーネルは疎行列-ベクトル積 y=Ax、いわゆるSpMVです。疎行列とはその成分のほとんどが零の行列の事で、SpMVでは疎行列の非零要素だけを取り出して上手く処理する事が、メモリアクセスと省メモリの観点から重要となります。なお、本記事で扱うRead-OnlyデータキャッシュとWarp Shuffle命令を利用したSpMVのK20向けチューニングは、2013年1月に開催されたNVIDIA Manufacturing Day 2013にてプロメテック・ソフトウェア社の北岡氏が講演内で紹介されたものです。 SpMVのCUDAでの実装例のいくつかは、有名な論文『Efficient Sparse Matrix-V