本チュートリアルは、高性能マイクロプロセッサ「Cell Broadband Engine (以下、Cell)」のプログラミングチュートリアルです。Cellアーキテクチャの概要、Cellプログラミングの基本的な手法について解説します。 本チュートリアルは、大きく4つの章で構成されています。すべての章を学習することで、Cellプログラミングの基本的な知識を習得できます。初めて学習される方は、まず「序章 チュートリアル全体概要」を参照してください。
ここではGPGPU向け統合環境の一つ、NVIDIAのCUDA(Compute unified device architecture)を使って、大規模並列計算を行ってみる。 NVIDIAによれば、並列度の高い処理ではCPUと比べておよそ10倍以上の速さで処理できるという。 なお、CUDA環境をインストールすると、自動的にOpenCLも使えるようになる。OpenCLに関しては別項を参照。 目次 CUDAのインストール(Linux編) - LinuxにCUDA環境をインストール CUDAのインストール(Windows編) - Windows XPにCUDA環境をインストール CUDAのインストール(Mac OS X編) - Mac OS XにCUDA環境をインストール 初めてのプログラム - とりあえずCUDAでのプログラムに慣れてみます 拡散方程式を解く - より実用的な処理の一例として拡散
この間のインタプリタをはじめから・・・で問題がありご指摘を受けました。 ですので次回より修正を行い、今回は GPGPU を使った計算についてやりたいと思います。 今回 nVidia の GeForce 8800 GTX というボードが手に入りましたので、専用の言語 (現在 GF8x 系のみで動作可能) であるCUDAを利用したいと思います。 CPUからの命令でGPUメモリのGPUのデータ領域のメモリを確保 CPUからGPUへメモリ内容をコピー GPUで演算処理、エラーの有無をチェック GPUからCPUへ出力用メモリ内容をコピー という流れで処理を行います。 注意しなければならない点としてGPUからCPUにメモリ内容をコピーする際、GPU内部で出力用メモリに書き出しが行われなかった場合、前回の出力結果とまったく同じものが出てきます。 (再起動してもフラッシュされない場合もありました。)
インストール CUDA 1.0 がリリースされた。 あいかわらず、Windows Vista はサポートされていないが。 早速インストールする。 http://developer.nvidia.com/object/cuda.html から Windows Display Driver version 162.01 for CUDA Toolkit version 1.0 CUDA Toolkit version 1.0 for Windows XP (32-bit) CUDA SDK version 1.0 for Windows XP (32-bit) をダウンロードして、この順序でインストールする。 Toolkitは C:\CUDA に、SDKは C:\Program Files\NVIDIA Corporation\NVIDIA CUDA SDK にインストールされる。 ドキュメン
GPUによる肌色認識処理の 高速化に関する一手法 高橋 誠史 河原塚 有希彦 宮田 一乘 北陸先端科学技術大学院大学 NICOGRAPH 2004.05.21 本発表のアウトライン はじめに 本手法の優位点 本手法提案の動機 背景 本手法が可能になった背景 ピクセルシェーダの命令数の 変遷 結果と考察 CPUとGPUでの速度比較 GPUに向く画像処理 GPUに向かない画像処理 応用例 ViewFrame まとめ 実装 実装手順 ピクセルシェーダでのL*a*b 色空間変換 肌色認識処理 はじめに 本発表では,近年急速に進歩したプログラム 可能なグラフィックスハードウェア(GPU)を用 いて,高速に動画像中の肌色領域を抜き出す 手法を提案する. 本手法の優位点 GPUはピクセル処理を並列計算が出来るので画像 処理でCPUより高速. 動画像の解析をCPUで行わないためアプリケー
慶應義塾大学教授で工学博士の中村維男氏。IEEEのフェローを務めるほか、英ロンドン大学インペリアル校教授兼フェロー、米スタンフォード大学客員教授、東北大学名誉教授などを兼任する。HPC Open Forumで新たに立ち上がったGPUコンピューティング分科会長に就任 「GPUは、CPUに比べると、ちょっと知能は落ちる。しかし、いったん走り出せばイノシシのように50倍ぐらいの速さで走る」。並列処理コンピューティングの第1人者として知られる中村維男教授はGPU(グラフィックス・プロセッシング・ユニット)の特性をそう説明する。GPUは条件分岐が入る処理などは苦手だが、単純な計算処理の並列化では大きな力を発揮する。 こうしたGPUの特性から、これまでベクトル型の並列コンピュータやCPUのクラスタ構成で実現してきたHPC(ハイパフォーマンスコンピュータ)、いわゆるスパコンで、GPU(グラフィックス・プ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く