CUDAにはclock()という組み込み関数が用意されています。 これを使ってプログラムの時間を計測してみましょう。 clock()関数 clock()関数は、デバイスプログラムの経過時間を返す関数です。 単位は将来変更される可能性がありますが、今のところシェーダクロック単位になっているようです。 関数を呼ぶだけで簡単に使えるので、ちょっとした処理の時間を計測するのに便利です。 1 #include <stdio.h> 2 3 __global__ void 4 calc_clock(int *clock_data, float *out, 5 float *in1, float *in2) 6 { 7 int tx = threadIdx.x; 8 unsigned int begin,end; 9 10 begin = clock(); // 開始時間 11 out[tx] = in