"Locality is efficiency, Efficiency is power, Power is performance, Performance is King", Bill Dally マルチスレッディングとは? CPUとGPUのマルチスレッディングの違いをブログにまとめていたけど例によって誰も興味なさそう— arutema47 (@arutema47) 2021年8月16日 つぶやいたら読みたい方が多そうだったので完成させました。 マルチスレッディングとはメモリ遅延を隠蔽しスループットを上げるハードウェアのテクニックです。 ただCPUとGPUで使われ方がかなり異なるため、その違いについて考えてみる記事です。 (SIMDについて並列プログラミングの観点から触れるべきでしたが、時間無いマルチスレッディングに注目するため初版では省きました。) 本記事について 本記事はCPUとG
AMD,GPUとCPUで同じプログラムが動く「HSA」の最新動向を公表。Javaへの対応計画も明らかに ライター:塩田紳二 米国時間2013年8月25日から27日まで,米国カリフォルニア州のスタンフォード大学にて,半導体やデバイス関連の学術イベント「Hot Chips」が開催されている。AMDはここで,同社が提唱するGPUコンピューティングフレームワーク「HSA」(Heterogeneous System Architecture)の取り組みと成果について発表するという。 それに先立ち,報道関係者を対象とした電話会議で,その概要が説明されたので,今回はその概要をレポートしてみたい。 CPUとGPUを同じプログラムで扱えるようにするHSAは OpenCLのよりよい実行環境を目指す HSAとはGPUコンピューティングを容易にするための仕組みであり,CPUやGPUといったハードウェアと,その上で
要点となるであろう部分だけ日本語でまとめておく。Lee et al. (2010) 1. Introduction この論文の要点は以下の3つ。 過去に多数存在した、GPUは100倍から100倍もの性能を持つと主張する論文の内容を再検討した。検討において、CPUとGPU両方を最適化した。その結果、GPUは平均2.5倍の性能をCPU比で持つことがわかった。つまり、CPUとGPUは同じ土俵(ballpark)にあるものなのだ。 並列化(並行化、の方が良いのかな)の手段にkernel(ここではアプリケーション、プログラムといった意味らしい)の実効性能がどのように依存するかを、系統的に分類してまとめた。 CPUとGPUの性能の違いを分析し、アーキテクチャの中で、性能に影響を与える主要な部分を特定した。 2. The workload: throughput computing kernels 14
この記事は GPGPU Advent Calender の二日目の記事です。 二日目の内容がコレかよ!というみなさんのつっこみが本編です。以下の内容はオマケとなります。 http://pcl.intel-research.net/publications/isca319-lee.pdf 時は2010年…くーだ使えば100倍とか1000倍とか速くなるんでしょ?なんでCPUそんな遅いの?などと、世界中でボロクソに言われたIntelは、ついにブチ切れて、「お前らは全員間違ってる!俺がその間違いを正してやる!」という内容の論文をISCAに投稿するのだった… という事情だったのかどうかは知らないですが、内容としては、↓このグラフが全てを物語っていて、 「GPUだと100倍速いとか言うけど、あれはCPUのコードを最適化してないからで、CPUも最適化すれば、平均たったの2.5倍しか速くならない」、という
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く