タグ

cudaに関するzyxwvのブックマーク (4)

  • CPUとGPUのマルチスレッディングの違いについて - arutema47's blog

    "Locality is efficiency, Efficiency is power, Power is performance, Performance is King", Bill Dally マルチスレッディングとは? CPUGPUのマルチスレッディングの違いをブログにまとめていたけど例によって誰も興味なさそう— arutema47 (@arutema47) 2021年8月16日 つぶやいたら読みたい方が多そうだったので完成させました。 マルチスレッディングとはメモリ遅延を隠蔽しスループットを上げるハードウェアのテクニックです。 ただCPUGPUで使われ方がかなり異なるため、その違いについて考えてみる記事です。 (SIMDについて並列プログラミングの観点から触れるべきでしたが、時間無いマルチスレッディングに注目するため初版では省きました。) 記事について 記事はCPUとG

    CPUとGPUのマルチスレッディングの違いについて - arutema47's blog
    zyxwv
    zyxwv 2022/02/11
    GPU のコア数とスレッド数の違い。スレッド数はコア1つが同時に流せる処理の数。メモリIO待ちになったスレッドはすぐに切り替えてコアの使用率を最大にする。
  • Compiling a basic OpenCV + Cuda program on linux

    zyxwv
    zyxwv 2016/05/06
    pkg-config でオプションが指定できる “g++ threshold.cpp -o threshold `pkg-config --cflags --libs opencv` -lopencv_gpu ”
  • CUDAのインストールパスまとめ - Qiita

    ポイント CUDA Linuxは/usr/local/cudaにあるものと思えば良い。lib64なのに注意。libcuda.soは/usr/lib64に入るが、これは最初から探してくれる Macも/usr/local/cudaにシンボリックリンクが貼られるのと、libcuda.dylibはここに入る。libなのに注意 cuDNN v2はフラットになる。 v3はCUDAのディレクトリ構成を意識した作りになっている CUDA 7.5 Ubuntu 14.04 [Linux] -> [x86_64] -> [Ubuntu] -> [14.04] -> [deb(loca)] cuda-repo-ubuntu1404-7-5-local_7.5-18_amd64.deb + usr + lib64 | + libcuda.so + local + cuda --> cuda-7.5 + cuda-

    CUDAのインストールパスまとめ - Qiita
    zyxwv
    zyxwv 2016/01/04
    cuDNN のインストール先
  • GPGPU(GPUプログラミング概要)

    ホスト側とGPUボードは PCI バスを通してデータの交換を行います。 GPU内に転送速度は非常に速いが、メモリ・アクセスの遅延(レイテンシ)の大きな「デバイスメモリ」を有します。現在の実装では、数 GB オーダーの容量を有します。 デバイスメモリとGPUの演算装置(「Streaming Multiprocessor (SM)」と言う。あるいは単に Multiprocessor と言うこともある。)の間に、ソフトウェアで管理できるキャッシュ(Shared Memory)とハードウェアで制御できる L1/L2キャッシュ(Fermi以降)が存在する。 Streaming Multiprocessor (SM) は、演算器の集まり(クラスタ)であり、この演算器の最小単位は、Streaming Processor(SP)、あるいは CUDA coreと称される。一つの SM の中に 8個の SP

  • 1