cudaHostAllocで確保したWriteCombineメモリへのアクセスは、普通のメモリへのアクセスと比較するとかなり遅いです。 条件にもよりますが、数十倍〜数百倍の速度差が発生することもあります。 #include <stdio.h> static inline unsigned int rdtsc() { unsigned int hi, lo; __asm__ __volatile__("rdtsc" :"=a"(lo), "=d"(hi)); (void)hi; return lo; } int main() { void *p, *dst; unsigned int begin, end; size_t size = 10*1024*1024; int nloop = 2; dst = malloc(size); cudaHostAlloc(&p, size, cudaHo
[あとで] MMX SSE 3D NOW!のプログラミング (http://pc12.2ch.net/test/read.cgi/tech/1085749218/) MMX SSE 3D NOW!のプログラミング 1 :デフォルトの名無しさん:04/05/28 22:00 どうぞ 2 :デフォルトの名無しさん:04/05/28 22:02 2get >>3どうぞ 3 :デフォルトの名無しさん:04/05/28 22:07 2get >>3どうぞ 4 :デフォルトの名無しさん:04/05/28 22:36 またこの手のスレか またこの手のスレか 5 :デフォルトの名無しさん:04/05/28 23:37 VC++6.0SP6用のProcessor Pack早くだせよヴォケ 6 :デフォルトの名無しさん:04/05/29 05:13 速くしろよ 7 :デフォルトの名無しさん:04/05/29
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く