タグ

CUDAに関するwnoguchi0727のブックマーク (2)

  • CUDAを使ったGPUプログラミング超入門 - Qiita

    [ゼロから始めるGPU Computing] (http://www.gdep.jp/page/index/market) http://www.gdep.jp/page/view/248 一般的に数倍~100倍以上の速度と言われている 補足:なぜ演算性能が高いのか? GPUでは、CPUに搭載されている分岐予測・投機実行 アウトオブオーダーが簡素化されており、その分、コア数を増やすことができる。 分岐予測・投機実行とは? 条件分岐した際の処理を前もって実行しておくこと。 過去の実行履歴から実行される可能性の高い命令を実行しておく。 [イメージ] arr = [1, 3, 5, 7, 8]; for (elm as arr){ if(elm % 2 == 1){ echo "odd"; //奇数が続くためCPUは事前にこの処理を予測し実行しておく }else{ echo "even"; //

    CUDAを使ったGPUプログラミング超入門 - Qiita
  • 「数字6桁パスワードのMD5ハッシュ値の総当たり」CUDAを使うと0.20秒まではやくなったよ - Qiita

    に入っていました。 結果 C言語版のループを抜けるまでの時間を計測しました。 C言語:4.91秒 CUDA:0.20秒 高速化できましたね^ ^。 ただ、個人的にはもう少し早くなるかと思っていました。今回はCUDAに移植しただけであまり最適化的なことはやっていないので、そこらへんもやればもう少し早くなるのではないかと思います。 CUDA化手順 かなり雑です。 一応コードはこれです。 そのうちきれいにしたい... CUDAは基的にC言語の拡張のようなものなのです。なので、 「数字6桁パスワードのMD5ハッシュ値の総当たり」OpenMPを使うと0.70秒までキタの「Cで実装してみた」とhttp://openwall.info/wiki/people/solar/software/public-domain-source-code/md5 で公開されているC実装をもとにCUDA化していきます。

    「数字6桁パスワードのMD5ハッシュ値の総当たり」CUDAを使うと0.20秒まではやくなったよ - Qiita
  • 1