タグ

CUDAに関するkojosanのブックマーク (5)

  • NVIDIA、最上位GPUアクセラレータ「Tesla K40」を発表

    11月17日(米国時間)からコロラド州デンバーで開催されているスーパーコンピュータ(スパコン)最大の学会「SC13」において、NVIDIAは科学技術計算用の「Tesla K40アクセラレータ」を発表した。 NVIDIAの「Tesla K20/K20X」は多くのスパコンで計算アクセラレータとして採用されており、Intersect360の調査では、NVIDIA GPUのアクセラレータ市場でのシェアは85%に上っている。今回発表のK40は、このK20の上位製品となる。 K40はK20に比べて、AMBERのベンチマークでは3割程度性能が上がり、メモリも12GBと倍増している。また、チップ温度の余裕を使ってクロックを上げるGPUブーストを装備している。 K40は、コア数が2688から2880に増加している。K20Xに使用されているGK110 GPUチップは、192個のコアを持つSMXというユニットを

    NVIDIA、最上位GPUアクセラレータ「Tesla K40」を発表
    kojosan
    kojosan 2013/11/20
    K40もいいけど、CUDA6のUnified Memoryはおもしろそう。
  • Modern GPU

    © 2013, NVIDIA CORPORATION. All rights reserved. Code and text by Sean Baxter, NVIDIA Research. (Click here for license. Click here for contact information.) Modern GPU is code and commentary intended to promote new and productive ways of thinking about GPU computing. This project is a library, an algorithms book, a tutorial, and a best-practices guide. If you are new to CUDA, start here. If you'r

    kojosan
    kojosan 2013/05/21
    CUDAを使った各種アルゴリズムの実装ガイド
  • LLVM meets GPU again! - Qiita

    この記事はGPGPU Advent Calendarの8日目の記事です。 LLVM meets GPU again! CUDA4.1以降のnvccは、Compute Capability 2.0以上のコードを生成する際にLLVM IRのサブセットであるNVVMを経由して最適化等を行ってから、NVIDIAの規定する中間表現であるPTXへの変換を行なっています。今年に入ってこの成果がLLVM家にマージされ、バージョン3.2で正式にお目見えすることになりました。LLVM 3.2の正式リリースは2012/12/16と一週間ほど先に予定されていますが、リポジトリにはすでに3.2用のブランチが切られています。今回は一足先にLLVM 3.2を使用して、LLVM IRからPTXを生成してみましょう! 歴史的な経緯 今回LLVMにマージされたNVIDIAの実装したPTXバックエンドはNVPTXと呼ばれてい

    LLVM meets GPU again! - Qiita
  • Google Code Archive - Long-term storage for Google Code Project Hosting.

    Code Archive Skip to content Google About Google Privacy Terms

  • GPUを手っ取り早く活用するためのライブラリ、ArrayFireのご紹介 - パラレルに恋して

    この記事は GPGPU Advent Calender の1日目の記事です 参加者募集中です。マジで。 GPGPU Advent Calendar人いなさすぎじゃね?大丈夫? とものすごいいろんな方からご心配いただきましたが大丈夫じゃないです まぁ、それがある意味でGPGPUの現状なのではないかという気がしていて、盛り上げていくためにいろいろやりたいですね、というところです。 さて、1日目は、「GPUを手っ取り早く活用するためのライブラリ、ArrayFireのご紹介」をしたいと思います はじめに GPGPUもだいぶ普及してきたとはいえ、耳にするのはやはり敷居の高さです 「CUDAとかOpenCLとか難しいでしょ?」という話はよく聞きますし、そのたびに「まぁそうですねぇ……」と返すのが様式美というかなんというか 難しい要因として、 ホスト、デバイスプログラムという二つのプログラムを書く必要が

    GPUを手っ取り早く活用するためのライブラリ、ArrayFireのご紹介 - パラレルに恋して
  • 1