NVIDIAは2010年3月にDirectX 11世代のプログラマブルシェーダ5.0(Shader Model5.0:SM5.0)対応GPUを発表し、翌4月にはデリバリが開始された。DirectX 11世代SM5.0対応GPUとしては、ATIが先行して市場投入を果たしており、NVIDIAは出遅れた感は否めないが、とにかく、GPU強豪メーカー2社からの製品が市場に出揃ったことはユーザーとしては喜ばしい状況だと言えよう。 今回は、強豪2社の製品が出揃ったこのタイミングにて、両者のアーキテクチャを見比べて、細かく考察しておきたいと思う。 DirectX 11世代SM5.0対応GPUが出揃う Windows7が2009年10月に発売され、このタイミングにシンクロする形でWindows環境下のマルチメディアコンポーネントAPIであるDirectXの最新版、DirectX 11もリリースされた。危ぶま
David Kirk氏,「3ステップで取り組むGPGPU」を提唱 ライター:西川善司 会場の様子 2010年7月16日,NVIDIAは,東京都内のラフォーレミュージアム六本木にて,同社のGPGPU技術にフォーカスしたカンファレンス「GPUコンピューティング2010」(以下,GPUC2010)を開催した。 GPGPUとはGeneral Purpose GPUの略で,簡単にいえば,「GPUの演算性能を3Dグラフィックスだけではなく汎用目的に流用する技術」のこと。そしてGPUコンピューティングは,最近のNVIDIAが好んで使うキーワードで,実質的には「GPUコンピューティング=GPGPU」という理解でOKだ。本稿ではとくに意識せず,同義的に両キーワードを用いる。 ――余談ながらに続けると,NVIDIAはかつて,ワークステーション用GPUであるQuadroシリーズにフォーカスした“グラフィックス寄
GPU Gems 2 GPU Gems 2 is now available, right here, online. You can purchase a beautifully printed version of this book, and others in the series, at a 30% discount courtesy of InformIT and Addison-Wesley. Please visit our Recent Documents page to see all the latest whitepapers and conference presentations that can help you with your projects. Chapter 22. Fast Prefiltered Lines Eric Chan Massachus
前編では,「GPGPU」という概念が起こった経緯や,それがPCゲームにも無関係なものではなさそうだということが,何となく分かってもらえたと思う。 後編となる今回は,GPGPUを実現するプラットフォームの現状,そして動向を整理してみたい。 最初期のGPGPUでは,「GPGPUのための開発プラットフォーム」が用意されていなかった。そのため,GPUを3Dグラフィックス処理以外で使うに当たっても,DirectXなりOpenGLなりといった,標準的な3DグラフィックスAPIとその関連ライブラリを“普通に”利用し,グラフィックスを描画するプロセスを活用しなければならなかったのだ。 具体的には, 処理したい入力データをテクスチャに入れ込む シェーダプログラムで演算を実行する 演算結果をフレームバッファ(=レンダーターゲットへ出力する
「GPGPU」(General Purpose GPU,汎用GPU)というキーワードについて,正確に説明できる人はどれくらいいるだろうか? 「ああ,GPUを使ってビデオのトランスコードが速くなるヤツね」と認識している人や,科学技術計算のような,普通にPCを使ううえでは無関係のモノと認識している人も多そうだ。しかしこれらの説明は,たまたま一般ユーザーにとって分かりやすかったり,先行して採用されていたりするから強く訴求されているというだけで,別に,トランスコードや科学技術計算専用の技術ではない。 GPGPUは,実は3Dゲームにおいても無関係ではないのだ。 本連載,2009年明けて第1回となる今回は,今年,業界全体が一丸となって本格対応を進めてくると見られる,GPGPUをテーマにしてみたいと思う。 GPU(Graphics Processing Unit)はもともと,3Dグラフィックスを描画する
This list contains general information about graphics processing units (GPUs) and video cards from Nvidia, based on official specifications. In addition some Nvidia motherboards come with integrated onboard GPUs. Limited/Special/Collectors' Editions or AIB versions are not included. The fields in the table listed below describe the following: Model – The marketing name for the processor, assigned
モジラが、JavaScriptをGPUのパワーを借りて高速化する試みを行っています。FirefoxのJetpackプロジェクトに協力しているメンバーがブログにポストしたエントリ「Elevating JavaScript Performance Through GPU Power」で、その可能性と方法について触れています。また1つ、JavaScriptの可能性が広がるかもしれません。 Mozilla Labs » jetpack » Blog Archive » Elevating JavaScript Performance Through GPU Power Webでは高精細な動画や音声などがやり取りされるようになり、またセカンドライフのような3次元表示など、Webブラウザ上で行われる情報処理は高度化しています。 今後はさらに動画の加工や音声認識のような高度なアプリケーション、あるいはW
iPad搭載プロセッサ「A4」 AppleがiPadを発表して以降、そこに搭載された謎のプロセッサ「A4」に関係者の注目が集まっている。例えばVentureBeatでは、ジャーナリストやアナリストではなく、現場のエンジニアや元Apple関係者のコメントを集めて、その実体解明に乗り出している。 VentureBeatのA4に関する話題は「Apple’s A4 chip: Engineers correct stupid journalist」と「How Apple’s A4 chip lets iPad run cooler, save battery life」という2つの記事に見ることができる。どちらも、予測だけのジャーナリストの話ではなく、現場のエンジニアから意見を請おうという企画だ。だが怪しい情報ソースや思いつきに近い話もあり、必ずしも信頼に足る情報かという部分には目をつむってほしい
●倍精度浮動小数点演算の4つのポイント NVIDIAは、CUDAとG80アーキテクチャによって、ハイパフォーマンスコンピューティング(HPC)である程度の成功の足がかりを掴んだ。そうしたNVIDIAにとって、倍精度浮動小数点演算のサポートは、欠かせない要素だ。HPCのアプリケーションでは、倍精度が必要となる局面があるからだ。GPUコンピューティング向けのTesla製品では、倍精度演算はカギとなると言ってもいい。「これまでも、倍精度の壁によって移植できなかったアプリケーションがかなりあった」とNVIDIAは必要性を強調する。 問題は、現状のリアルタイムグラフィックスでは、単精度(32-bit)までの浮動小数点演算しか必要とされないこと。そのため、これまでのGPUは単精度演算ユニットしか実装しておらず、GPUでの倍精度演算のサポートには、いくつかのポイントと疑問点がある。 (1)IEEE 75
●迫るIntelのLarrabeeに対抗して急ぐNVIDIAのCUDA戦略 Intelは、データ並列+タスク並列型プロセッサである「Larrabee(ララビー)」の準備を進めている。今夏にアーキテクチャの概要を明らかにし、来年(2009年)には製品投入の予定だ。Intelは、当初Larrabeeをハイパフォーマンスコンピューティング(HPC)向けと説明していたが、実際にはグラフィックス製品として投入する。これは、NVIDIAがグラフィックスカードとしてボリュームを出荷することで、汎用コンピューティングにも使うことができるプロセッサを普及させている戦略を踏襲するものだ。 Intelは、じつはLarrabee戦略の当初から、グラフィックス製品として普及させる計画だった。つまり、グラフィックス製品へと戦略を切り替えたのではなく、当初からグラフィックスとして売る計画だった。しかし、GPUベンダーを
K&F Computing Research(KFCR社)は、GPU等のSIMD型ハードウェアアクセラレータ向けCコンパイラ「Goose」をリリースした。標準価格はパーソナルエディションで99,750円、インスティテューショナルエディションで498,750円。いずれの製品にもコンパイラ本体のソースコード(rubyで記述)が付属。価格には1年間の無償バージョンアップと技術サポートを含んでいる。 Gooseは、GPUを含む各種アクセラレータのAPIやアーキテクチャを、アプリケーションプログラムに対して隠蔽する。そのためPC等の汎用計算機向けにC言語で記述されたプログラムを、ソースコードをほとんど変更することなくアクセラレータ上で動作させられる。 あえてC言語の言語仕様を完全にはサポートせず、ドメイン特化型のコンパイラとなっている。SIMD型アクセラレータ上での実行に適した文法記述のみを処理し、
昨今、キーワードとしてはよく耳にする「OpenCL」。 SIGGRAPH ASIA 2009、会期初日には、そのOpenCL基本情報およびその最新事情をまとめたチュートリアル的セッション「OpenCL:Parallel Programming for Computing and Graphics」が開催された。 OpenCLのプログラミングモデル OpenCLの現状について講演したAMDのOffice of the CTO、Justin Hensley氏 OpenCLは現在ver.1.0が現行バージョンで、アップルのMac OS X Snow Leopardはこれをシステムに統合している。Windows環境下向けとしてはNVIDIAがリリース版、AMDがベータ版をリリースしているという状況だ。早速次世代版の規格策定も進んでおり、OpenCL 1.1は2010年のSIGGRAPH 2010の
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く