タグ

simdとcpuに関するdannのブックマーク (3)

  • Debunking the 100X GPU vs. CPU Myth (訳:GPUなら100倍速いという神話を覆す) - 2012-12-02 - J

    この記事は GPGPU Advent Calender の二日目の記事です。 二日目の内容がコレかよ!というみなさんのつっこみが編です。以下の内容はオマケとなります。 http://pcl.intel-research.net/publications/isca319-lee.pdf 時は2010年…くーだ使えば100倍とか1000倍とか速くなるんでしょ?なんでCPUそんな遅いの?などと、世界中でボロクソに言われたIntelは、ついにブチ切れて、「お前らは全員間違ってる!俺がその間違いを正してやる!」という内容の論文をISCAに投稿するのだった… という事情だったのかどうかは知らないですが、内容としては、↓このグラフが全てを物語っていて、 「GPUだと100倍速いとか言うけど、あれはCPUのコードを最適化してないからで、CPUも最適化すれば、平均たったの2.5倍しか速くならない」、という

    Debunking the 100X GPU vs. CPU Myth (訳:GPUなら100倍速いという神話を覆す) - 2012-12-02 - J
    dann
    dann 2012/12/02
  • 動画系のSIMD最適化

    茂木 和洋 @ まるも製作所 まるも製作所の中の人をしてます 就職活動の一環として大学4年の夏に MPEG-2デコーダを作っていたら某企業に 拾ってもらえました 就職先の上司の縁で、通信系の研究所に飛 ばされて、H.264/AVCのエンコーダを 作ったりしてました 現在はファブレスLSIメーカに転職してオ リジナルのCODECを作ってたりします 動画CODECのプログラム的特徴 SIMDとは x86/x64のSIMD SIMDの使い方 SIMDに向く処理/向かない処理 動画CODECでのSIMD活用例 SIMDコードTips 4x4/8x8/16x16のブロック単位処理が主流 画素毎に独立に同じ処理を行うことが多い 個々の処理はそれほど重くないが、処理対 象が多い 8bit or 16bit の整数演算がほぼ全て 4x4/8x8/16x16のブロック単位処理

  • Enhanced Intel SpeedStep® Technology and Demand-Based Switching on Linux* - Intel® Software Network

    Using Intel.com Search You can easily search the entire Intel.com site in several ways. Brand Name: Core i9 Document Number: 123456 Code Name: Emerald Rapids Special Operators: “Ice Lake”, Ice AND Lake, Ice OR Lake, Ice* Quick Links You can also try the quick links below to see results for most popular searches. Product Information Support Drivers & Software

    Enhanced Intel SpeedStep® Technology and Demand-Based Switching on Linux* - Intel® Software Network
  • 1