Download source - 566.79 KB Introduction I take an existing image blurring algorithm, developed by Mario Klingemann, to demonstrate the way to do image blurring with CUDA. Please visit http://incubator.quasimondo.com for more details about the stack blurring algorithm. I reckon that Stack Blur is already the fastest blur with a good looking algorithm. In this sample, there are some minor code chan
ここではGPGPU向け統合環境の一つ、NVIDIAのCUDA(Compute unified device architecture)を使って、大規模並列計算を行ってみる。 NVIDIAによれば、並列度の高い処理ではCPUと比べておよそ10倍以上の速さで処理できるという。 なお、CUDA環境をインストールすると、自動的にOpenCLも使えるようになる。OpenCLに関しては別項を参照。 目次 CUDAのインストール(Linux編) - LinuxにCUDA環境をインストール CUDAのインストール(Windows編) - Windows XPにCUDA環境をインストール CUDAのインストール(Mac OS X編) - Mac OS XにCUDA環境をインストール 初めてのプログラム - とりあえずCUDAでのプログラムに慣れてみます 拡散方程式を解く - より実用的な処理の一例として拡散
NVIDIAは、業界標準の線形代数ライブラリ「LAPACK」をCUDA対応GPUに最適化、実装した「CULA」のベータ版の提供を、EM Photonicsが開始したことを明らかにした。 LAPACKはすでに数値物理学、構造力学、電子設計オートメーションなどのさまざまな分野で活用されているが、CULAを用いることにより、NVIDIAのGPU「Tesla」の性能を引き出すことが可能となり、クアッドコアCPU1個での処理に比べて最大10倍の処理性能向上を実現することが可能になるとしている。 スーパーコンピュータとしていち早くGPUコンピューティングを搭載した東京工業大学のTSUBAMEで知られる松岡聡教授は、CULAのリリースに対し、「TSUBAMEに代表されるマルチコアCPUとメニーコアGPUによるハイブリッドシステムは、ハイパフォーマンス・コンピューティング・アーキテクチャの進化の方向性とし
Kun Zhou Cheung Kong Professor Director, State Key Lab of CAD&CG Zhejiang University Email: kunzhou at acm dot org I am a Cheung Kong Professor of computer science at Zhejiang University. I received my PhD degree from Zhejiang University. After graduation I spent six years with Microsoft Research Asia, and was a lead researcher of the graphics group before moving back to Zhejiang University. I was
OpenGL de プログラミング トップページページ一覧メンバー編集 CUDA 最終更新: mikk_ni3_92 2008年05月01日(木) 18:30:11履歴 Tweet 現在地 >> メニュー >> CUDA CUDA(改訂中...) CUDA編00(インストール、各種設定) CUDA編01(CUTIL) CUDA編02(CUDAの概念、プログラミングの仕方) CUDA編03(エミュレーションモード) CUDA編04(CUTILと画像) CUDA編05(テクスチャ、線形メモリとcuArray) CUDA編06? :旧ページ(cuda1.0あたりのもの) 内容 設定関係 CUDA::VS2005で使う >> CUDA::VS2005で使う::その2 CUDA::EmulationMode CUDA::VS2005::ハイライト (キーワードに色をつける) 簡単な解説など CUDA
id:ColMuskaと組んで出たGPU Challengeが終わったので忘れないうちにCUDAプログラミングのメモを書き残しておこう。内容は保証できないけど。 基本的には本家CUDAのProgramming Guideを見ればいい。Runtime/Driver APIを参照するときはReference Manualを見ればリストが載ってる。 CUDA Toolkit 10.1 Update 1 Download | NVIDIA Developer 日本語ならここが結構丁寧に説明されてる。 http://journal.mycom.co.jp/special/2008/cuda/index.html CUDAの用語がごっちゃになって結構めんどい。 スレッド関連 カーネル GPUに投げる関数。カーネル関数と関係あるのかね? スレッドブロック スレッドのまとまり。1次元あたり512スレッドの
Accelerate Your Applications Learn using step-by-step instructions, video tutorials and code samples. Accelerated Computing with C/C++ Accelerate Applications on GPUs with OpenACC Directives Accelerated Numerical Analysis Tools with GPUs Drop-in Acceleration on GPUs with Libraries GPU Accelerated Computing with Python Teaching Resources Get the latest educational slides, hands-on exercises and acc
CUDA BLAS CUDAのツールキットには、CUDA BLASという最適化された演算ライブラリが付属している。BLASはBasic Linear Algebra Subprogramsの略称で、ベクトルと行列を扱う線形計算ルーチンを集めたものである。ベクトルと行列の演算は多くの科学技術計算で必要とされ、その性能が計算時間に大きく影響するので、各社とも自社のハードウェアにチューニングしたBLASを開発して性能をアピールしており、このCUDA BLASはCUDA用に最高性能を出すようにチューニングされたBLASである。 SDKのsimpleBLASプロジェクトを使って、matrixMulに換えて、このCUDA BLASに含まれているsgemm(単精度の行列積)を使ってみた。sgemmは、行列A、Bに対して、C=αAB+β*C(α、βはスカラ値)を計算する機能を持ち、かつ、行列A、Bそれぞれ
CUDA対応のメモ 既存のコードを初めてCUDA対応する場合、意外と面倒が多い。 スクラッチの場合はサンプルプロジェクトから作ればよいが、そうでない場合、.cuをコンパイルするにはどうするかといったところから引っかかる。どれも大したことではなく基本的なことだが、戸惑うことが多い。やはりCUDA対応はそれなりに時間がかかる。 1. http://developer.download.nvidia.com/compute/cuda/2.0-Beta2/docs/CUDA_2_Quickstart_Guide.pdf に沿ってCUDA SDKをセットアップ。 2. サンプルがコンパイルできないので、Direct3D SDKもセットアップ。 http://www.microsoft.com/downloads/details.aspx?FamilyID=4b78a58a-e672-4b83-a28
Copyright (C) Mainichi Communications Inc. All rights reserved. 掲載記事の無断転載を禁じます
GPUを用いてデータ処理を行うCUDAや、CPU自体がソフトウェアパイプラインを持つLarrabeeがそろそろ一般の人々にも登場しそう雰囲気になってきました。 後藤弘茂のWeekly海外ニュース - CPUとGPUの境界がなくなる時代が始まる2009年のプロセッサ 簡単に説明するとCUDAはもともとグラフィックパイプライン用に最適化されたGPUを用いて、グラフィックだけではなくデータのストリーミング処理を行うフレームワークで、LarrabeeはCPU自体が強力なベクトル計算ユニットを持ってCPUだけでグラフィックのソフトウェアパイプラインを実現することを可能とするIntelの新しいCPUです。もちろん、これらの技術はエンジニアにとっては極めておもしろいものですし、特にゲームにおいては、グラフィックのみならずAIなどの計算に大活躍するとおもうのですが、さて、一般のPCでこれらの技術、CPUを
最近、GPUの計算性能の高さからGPGPU(General Purpose Computation on Graphics Processing Unit)とかGPUコンピューティングとか言われる、GPUを科学技術計算処理に利用する研究が盛んになっている。また、GPUを製造するNVIDIAは、科学技術計算を3Dグラフィックスに続く新市場として捉えており、Teslaという科学技術計算用の製品を発売し、GPU上のプログラム開発環境としてCUDA(Compute Unified Device Architecture)を公開している。但し、NVIDIAのDavid Kirkチーフサイエンティストは最近、"GPGPU is dead, GPU Computing is the future for affordable supercomputing"と題した講演を行っており、同社はGPGPUという
CUDA Zone CUDA® is a parallel computing platform and programming model developed by NVIDIA for general computing on graphical processing units (GPUs). With CUDA, developers are able to dramatically speed up computing applications by harnessing the power of GPUs. In GPU-accelerated applications, the sequential part of the workload runs on the CPU – which is optimized for single-threaded performance
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く