タグ

CUDAに関するR2Mのブックマーク (3)

  • Tensorコアを使ってみた - Fixstars Tech Blog /proc/cpuinfo

    このブログは、株式会社フィックスターズのエンジニアが、あらゆるテーマについて自由に書いているブログです。 アルバイトの大友です。 TensorコアのWMMA APIを使っている人があまりいなかったため、6月中はインターンとして、7月からはアルバイトとしてその使い方や性能を調べていました。 この記事はその成果をまとめたものです。 Tensorコアを使うことでFP16のSIMD計算(f16x2)に比べ密行列積を5倍程度高速化できました。 Tensorコアとは NVIDIA Voltaアーキテクチャから採用されたTensorコアは2つの$4 \times 4$のFP16行列の積を1サイクルで計算し、その累積和をFP16/FP32で取ることができる計算ユニットです。 cuBLAS, cuDNNなどのライブラリではCUDA 9からTensorコアを利用できます。 WMMA APIを用いた行列積計算

    Tensorコアを使ってみた - Fixstars Tech Blog /proc/cpuinfo
  • CUDA 10 Features Revealed: Turing, CUDA Graphs and More | NVIDIA Developer Blog

    CUDA 10 Features Revealed: Turing, CUDA Graphs, and More For the last eleven years, NVIDIA’s CUDA development platform has unleashed the power of GPUs for general purpose processing in a wide variety of applications. These include: high performance computing (HPC), data center applications, and content creation workflows. Most recently, artificial intelligence systems and applications ranging from

    CUDA 10 Features Revealed: Turing, CUDA Graphs and More | NVIDIA Developer Blog
    R2M
    R2M 2018/09/28
  • CUDAをRadeonで動かす(導入編) - Fixstars Tech Blog /proc/cpuinfo

    このブログは、株式会社フィックスターズのエンジニアが、あらゆるテーマについて自由に書いているブログです。 みなさん、今日も元気にGPGPUしていますか? 去年(SC15)の話ですが、「RadeonでCUDAが使えるようにするよ!」とAMDが発表したニュースを覚えている方いらっしゃいますでしょうか。Boltzmann Initiativeの話です。 あれからしばらく時が流れ、機は熟しました。「CUDAはNVIDIA専用」そんな時期は今は昔。そう、CUDAをAMDGPUであるRadeonで動かすことに成功しました!! ので、ここではその方法と、その時に使ったコードを紹介したいと思います。 予めお断りしておくと、表題にもある通り、今回は導入編ということで「動くことを確認する」までになります。 そのうち時間を見つけて「性能測定編」もやってみたいと思いますが、ぜひこれを読んだ方、ぜひ性能測定してみ

    CUDAをRadeonで動かす(導入編) - Fixstars Tech Blog /proc/cpuinfo
    R2M
    R2M 2016/08/02
  • 1