タグ

GPUに関するswordheartのブックマーク (4)

  • [GTC 2016]西川善司の3DGE:Teslaとして登場した新世代GPU「Pascal」,その詳細に迫る

    [GTC 2016]西川善司の3DGE:Teslaとして登場した新世代GPU「Pascal」,その詳細に迫る ライター:西川善司 NVIDIAが,同社主催のGPU関連学術会議「GPU Technology Conference 2016」(以下,GTC 2016)で,「Pascal」(パスカル)世代初となるGPU「Tesla P100」を発表した。その概要は2016年4月6日掲載の速報記事でお伝えしたとおりだが,NVIDIAは発表の後,Pascalに関する技術解説セッション「Inside Pascal」を実施したので,稿ではその内容を中心に,Pascalのアーキテクチャと,第1弾となるTesla P100なるプロセッサがどのようなGPUなのかを解説していきたい。 Tesla P100の製品イメージ 明らかになったTesla P100「GP100」の基仕様 Tesla P100が採用する

    [GTC 2016]西川善司の3DGE:Teslaとして登場した新世代GPU「Pascal」,その詳細に迫る
  • ChainerやTensorFlowでGPUを使うと毎回結果が変わる理由と対策 (まとめ) - Qiita

    結論から ChainerやTensorFlowなどの機械学習(特にDeepLearning)フレームワークでGPUを使うと、誤差程度ではあるものの演算結果が毎回変わってしまいます。(非決定的な演算) 「乱数使ってるから当たり前でしょ」って話ではなく、乱数種を指定してもGPU内部での演算順序が非決定的であるためGPU演算の結果は安定しません。 浮動小数点演算なので誤差が出るのは当然だが、その誤差が安定しない(非決定的)なのが気になるところです。 Chainerでは環境変数(CHAINER_CUDNN)の指定またはConvolution2Dなどへのパラメータ追加で事象を回避可能。 TensorFlowについてはGoogle社曰く「EigenライブラリまたはcuDNNの仕様によるとのこと」であり現状では対応策無し。(詳細は次の記事に記載のIssuesを参照のこと) 尚、Caffeでも同様の事象

    ChainerやTensorFlowでGPUを使うと毎回結果が変わる理由と対策 (まとめ) - Qiita
  • 【後藤弘茂のWeekly海外ニュース】NVIDIAのGT200とAMDのRV770のどちらが優れているのか

    ●それぞれ利点があるGT200とRV770の両アーキテクチャ NVIDIAの新フラッグシップGPU「GeForce GTX 200(GT200)」ファミリと、AMD(旧ATI)の新フラッグシップGPU「ATI Radeon HD 4800(RV770)」ファミリ。両GPUは、1TFLPOS前後のコンピューティングパフォーマンスを謳いながらも、そのアーキテクチャには大きな違いがある。部分的には、ほぼ対照的と言っていい設計思想の違いが見られる。 一言で言えば、GT200は汎用コンピューティングにも適したアーキテクチャを目指して、その結果として高いグラフィックスパフォーマンスも実現した。一方、RV770はグラフィックスに最適化した結果、汎用コンピューティングでも威力を発揮するコンピューティングパフォーマンスを得た。GT200は汎用コンピューティングでの高効率のトレードオフとして、制御系のユニット

  • 西川善司の3Dゲームファンのためのグラフィックス講座

    【10月2日】 「任天堂カンファレンス 2008.秋」レポートその1 ハード編 「自分専用DS」を目指した「ニンテンドーDSi」 「任天堂カンファレンス 2008.秋」レポートその2 ソフト編 年末年始も磐石? 「Wii Music」ではとたけけ登場!? 「任天堂カンファレンス2008秋」 主要タイトル・ファーストインプレッション 「ニンテンドーDSi」を一足先に体験!! 他 任天堂、スクリーンショット集〜DS編 「マリオ&ルイージRPG3!!! (仮)」、「メイドイン俺」、「立体ピクロス (仮称)」など 任天堂、スクリーンショット集〜Wii編 「罪と罰2 (仮称)」、「Punch-Out!!」、「街へいこうよ どうぶつの森」など 任天堂、「ニンテンドーDSi」を発表 30万画素カメラ付、SDカードスロット付で11月1日発売 【速報版】 佐藤カフジの「PCゲーミ

  • 1