atomic命令はいわゆるRead-Modify-Writeの命令です。 要するに、1命令でメモリの読み込みと変更と書き込みを行う命令です。複数のスレッドやプロセスが協調して動作するときに、同じメモリアドレスを同じタイミングで触ってしまうと、一部の計算結果が反映されないという問題が発生します。並列処理の基本問題であるため多くの本やサイトで解説されていると思いますが、例えば100回加算したはずなのに50回しか反映されていないみたいな問題が生じるわけです。複数のスレッドが非同期に読み書きをするとよく起きるので困りものです。 というわけで、Read-Modify-Writeは並列プログラミングにおける必須アイテムです。当然ながら並列実行できないので、使いすぎるとパフォーマンスが落ちます。それでもバグを防ぐ意味では使いまくった方が良かったりするので難しいところです。 CUDA1.0仕様ではatom
■後藤弘茂のWeekly海外ニュース■ NVIDIAの1TFLOPS GPU 「GeForce GTX 280」がついに登場 ●GPUコンピューティング用Tesla T10Pでは1TFLOPS NVIDIAが、新たなハイエンドGPU「GeForce GTX 200(GT200)」シリーズを発表した。GT200アーキテクチャの最大の特徴は、1TFLOPSの浮動小数点演算(単精度)パフォーマンスを達成すること。グラフィクス製品「GeForce GTX 280」は1TFLOPSを切るが、同じチップを使うGPUコンピューティング向け製品「Tesla(テスラ) T10P」プロセッサは1.5GHz動作で1TFLOPSを超える。1Uラックに4TFLOPSが収まる。スーパーコンピュータの世界だったTFLOPSレベルパフォーマンスに、フルプログラマブルGPUがついに到達した。 GT200は、アーキテクチャ的
インストール CUDA 1.0 がリリースされた。 あいかわらず、Windows Vista はサポートされていないが。 早速インストールする。 http://developer.nvidia.com/object/cuda.html から Windows Display Driver version 162.01 for CUDA Toolkit version 1.0 CUDA Toolkit version 1.0 for Windows XP (32-bit) CUDA SDK version 1.0 for Windows XP (32-bit) をダウンロードして、この順序でインストールする。 Toolkitは C:\CUDA に、SDKは C:\Program Files\NVIDIA Corporation\NVIDIA CUDA SDK にインストールされる。 ドキュメン
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く