エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
CUDAで二次元配列の転置は高効率にできないと言ったな!あれは嘘だ! | さかな前線
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
CUDAで二次元配列の転置は高効率にできないと言ったな!あれは嘘だ! | さかな前線
というかんじになりました. GTX 670では,そもそも速度差があんまりなくて,conflictの影響も比較的少... というかんじになりました. GTX 670では,そもそも速度差があんまりなくて,conflictの影響も比較的少ない. GTX 580では,かなり効果は顕著で,conflictもけっこう効く.と言ったところでしょうか. GTX 670ってFLOPSではGTX 580とは比べ物にならないほど速いし,メモリ速度も192GB/sで同じなのに,実アプリでは逆転してこの差.悲しい・・・. 全体コード CUDA 4.1以降とOpenCV 2.3以降を想定してます. 時間計測の関係でカーネルの終了を同期的に待ったり,関数を細かく分けたりとかごちゃごちゃしたことをしてます. main.cpp #include <iostream> #include <opencv2/opencv.hpp> void initialize(int _w, int _h); void send(unsigned *h_src