並び順

ブックマーク数

期間指定

  • から
  • まで

321 - 360 件 / 5192件

新着順 人気順

GPUの検索結果321 - 360 件 / 5192件

  • BlenderはOS Xを放棄する?「OS XのGPUドライバにはApple以外修正できないOpenCLの不具合がある」としてLuxRenderの開発チームがTim Cook氏へ公開状を送る。

    OpenCLの不具合 今回 OpenCLの不具合を指摘しているのは3Dグラフィックツール「Blender」の元開発者で現在Blender財団の会長を務めるオランダのTon Roosendaalさんや、Paolo Cicconeさんで内容は「我々はOS XのOpenCL GPUドライバが壊れておりレンダリングできないことを発見しました。同じシーンをWindowsやLinuxをインストールした全く同じハードウェア(Mac)で、レンダリングした場合美しく出力されるので、これはAMDやnVidiaのソフトやGPUの不具合ではなくOS Xのドライバの問題です。OS XのOpenCLはOSの一部となっておりApple以外このドライバーをアップデート出来ません。AppleはOpenCL不具合のプライオリティを新しい絵文字より低く扱っているようだ」というもので、 We have found out tha

      BlenderはOS Xを放棄する?「OS XのGPUドライバにはApple以外修正できないOpenCLの不具合がある」としてLuxRenderの開発チームがTim Cook氏へ公開状を送る。
    • TPU VS GPU(日本語版)

      はじめに(この記事の英語版はTPU VS GPU(English Edition)にあります。) Machine Learning部門の江間見です。ストックマークでは、自然言語処理技術の研究開発を行っています。 昨今、大規模データでニューラルネットワークを訓練し良い結果を得ようとするならば、深層学習モデルの訓練にかかる時間の膨大さに誰もが悩まされたことがあるかと思います。さらに、深層学習モデルはハードウェアのリソースを多く必要とします。 深層学習モデルの学習では、計算の特性上、CPU(Central Processing Unit)より GPU(Graphics Processing Unit)が高速であるため、GPUが推奨されます。しかし、GPU以外の選択肢として、TPU(Tensor Processing Unit)があります。 そこで、本記事では、自然言語処理のタスクで深層学習モデル

        TPU VS GPU(日本語版)
      • Metaが大規模言語モデル「LLaMA」を発表、GPT-3に匹敵する性能ながら単体のGPUでも動作可能

        MetaのAI研究組織であるMeta AI Researchが、大規模言語モデル「LLaMA(Large Language Model Meta AI)」を2023年2月24日に発表しました。Meta AI Researchによれば、LLaMAはOpenAIのGPT-3よりもパラメーター数がずっと小さく、単体GPUでも動作可能でありながら、ベンチマークテストの一部ではGPT-3を上回ったとのことです。 LLaMA: Open and Efficient Foundation Language Models - Meta Research https://research.facebook.com/publications/llama-open-and-efficient-foundation-language-models/ Meta unveils a new large languag

          Metaが大規模言語モデル「LLaMA」を発表、GPT-3に匹敵する性能ながら単体のGPUでも動作可能
        • [GTC 2018]NVIDIA,8万1920基のCUDA Coreを統合した“世界最大のGPU”「DGX-2」発表。新開発の「NVSwitch」で16基のTeslaを相互接続

          [GTC 2018]NVIDIA,8万1920基のCUDA Coreを統合した“世界最大のGPU”「DGX-2」発表。新開発の「NVSwitch」で16基のTeslaを相互接続 編集部:佐々山薫郁 北米時間2018年3月27日,NVIDIAのJensen Huang(ジェンスン・フアン)CEOは,自社イベントである「GPU Technology Conference 2018」2日めの基調講演で,8万1920基のCUDA Coreからなる“世界最大のGPU”を発表した。 “世界最大のGPU”(“The World’s Largest GPU”)をHuang氏は発表した ただし,残念ながら(?)これは単体GPUではない。Huang氏は基調講演で,VoltaアーキテクチャのGPU「GV100」を採用しつつ従来比2倍の容量となる32GBものHBM2メモリを組み合わせた新GPUモジュール「Tesl

            [GTC 2018]NVIDIA,8万1920基のCUDA Coreを統合した“世界最大のGPU”「DGX-2」発表。新開発の「NVSwitch」で16基のTeslaを相互接続
          • UbuntuでCPU/GPUの温度を監視するためのツール4選

            稼働中のPCやサーバのCPU/GPU温度を監視することは、マシンの状態を把握する上で極めて重要である。CPUなどの精密なパーツは、指定された制限値を超える温度で実行されていると、寿命が極端に短かくなったり、熱暴走を起こして停止したりしてしまう可能性がある。それを防止するには、いち早く冷却機能が正常に動作しているかを確認し、故障の原因を突き止めなければならない。TecMint.comは「4 Useful Tools to Monitor CPU and GPU Temperature in Ubuntu」において、UbuntuにおいてCPUやGPUの温度を監視するために便利な4つのツールのインストール方法を紹介している。以下、そのポイントをまとめてみた。 Glances Glances - An Eye on your system GlanceはPythonで記述されたシステム監視ツールで

              UbuntuでCPU/GPUの温度を監視するためのツール4選
            • 【Hothotレビュー】 Ryzen搭載でGPU性能が格段に向上した「Surface Laptop 3 15型」の実力は?

                【Hothotレビュー】 Ryzen搭載でGPU性能が格段に向上した「Surface Laptop 3 15型」の実力は?
              • 「デスクトップをスパコンにする」新GPUは時代を変えるか | WIRED VISION

                「デスクトップをスパコンにする」新GPUは時代を変えるか 2008年6月23日 IT コメント: トラックバック (0) Bryan Gardiner 米NVIDIA社の新しい『GeForce GTX 280』は、並列接続して使用でき、きわめて大きな並列処理能力を実現する。この写真では、1枚のマザーボードに3個のグラフィックカードが設置してある。 Image: NVIDIA パソコン向けグラフィックチップ・メーカーの最大手2社が、6月第3週、新しい最上位製品を発表した。これらのグラフィックカードに使われている新しいチップは、ビデオゲームの動きを良くするだけにはとどまらず、普通のデスクトップをスーパーコンピューター並みに変えてしまうだろう——プログラマーたちが、このチップの強力に並列化されたアーキテクチャーの活用法を見出すことができれば。 グラフィック業界で長い経歴を持ち、米Jon Pedd

                • gstore_fdw: GPUメモリをSQLで読み書き、そして…。 - KaiGaiの俺メモ

                  昨年、PGconf.ASIAで発表したPL/CUDAによる創薬ワークロードの高速化実験のテーマであるが、 kaigai.hatenablog.com 実測したベンチマークを見ると、奇妙な傾向が見てとれる。 このワークロードにおける計算量は「Qの行数×Dの行数」であるので、Dの行数が同じ1000万行であるならば、Qの行数が1000のケース(22.6s)に比べ、Qの行数が10のケース(13.4s)の実行時間はもっと顕著に短時間でなければならない。 計算量が1/100なのに、実行時間は半分弱にしかなっていない。 実はこれは、化合物同志の類似度を計算するための時間だけでなく、PL/CUDA関数に与える引数をセットアップするための時間に12秒程度を要しており、アムダールの法則を引用するまでもなく、類似度の計算を高速化するだけでは処理速度はこれ以上伸びないのである。 PL/CUDA関数の引数として行列

                    gstore_fdw: GPUメモリをSQLで読み書き、そして…。 - KaiGaiの俺メモ
                  • NVLink BridgeでGPUを繋いでも1GPUにはなりません | HPCシステムズ Tech Blog

                    『NVLink Bridgeで複数GPUを繋いだら、それらが1GPUとして扱えるようになるんでしょ?』という誤解をされているお客様をしばしばお見受けいたします。こちらの記事では、それが誤解であること、また、SLIやUnified Memoryといった関連する情報についても整理して解説いたします。間違った期待を抱いて失敗しないように、正しい理解を深めていきましょう。 GPUのメモリ空間は他デバイスから隔絶されています GPU上には演算するためのプロセッサと、データを一時的に置いておくためのメモリ(VRAM)が搭載されています。GPUのメモリを、CUDAで書かれたプログラムから利用するには、cudaMallocでメモリ領域を確保し、cudaMemcpyを使ってホスト(CPU側)のメモリとデータの送受信を行い、GPU上で演算kernelとする関数(以下、GPU-Kernel)を呼び出し、最後にc

                      NVLink BridgeでGPUを繋いでも1GPUにはなりません | HPCシステムズ Tech Blog
                    • 【Hothotレビュー】 IntelミドルレンジGPUのお手並み拝見!発売前のArc 770とA750をベンチマークテスト

                        【Hothotレビュー】 IntelミドルレンジGPUのお手並み拝見!発売前のArc 770とA750をベンチマークテスト
                      • 東工大、世界初のGPU採用スパコンに進化した「TSUBAME 1.2」を解説

                        東工大、世界初のGPU採用スパコンに進化した「TSUBAME 1.2」を解説 ~NVIDIA CEOフアン氏は特別講演を実施 12月2日 開催 米NVIDIAの創業者兼最高経営責任者(CEO)であるジェンスン・フアン氏が2日来日し、東京工業大学の講堂で学生に向けて「エンジニアの未来を語ろう」と題した講演を行なった。 今回、フアン氏が講演したのは、同校が運営するスーパーコンピュータ「TSUBAME」がこの11月に、世界最大規模となる680基のTeslaを組み込こむことアップグレードされ、77.48TFLOPSというピーク性能を実現するに至ったことが関係している。講演に先立って、Tesla採用の経緯についての記者説明会が行なわれたので、まずはその内容からお伝えする。 ●GPUによるアクセラレーションを用いた初のスパコン 2006年4月に運用が始まったTSUBAMEは、デュアルコアOpteron

                        • 【レビュー】 Kaveriにおける動画再生の画質改善効果を検証する ~GPUによって画質が異なるのか

                          • 「MacBook Pro」用外付けGPU「Blackmagic eGPU」、Appleストアで8万9800円で発売

                            米AMDのRadeon Pro 580、Thunderbolt 3×2、HDMI 2.0×1、USB 3.1×4を搭載。同日Appleが発表した新型「MacBook Pro」をはじめとするハイエンドPCに接続し、動画編集や3Dゲーム、VRコンテンツ再生などを支援する。 同社のプロ向け動画編集アプリ「DaVinci Resolve 15」のユーザーは、Blackmagic eGPUを利用することでリアルタイムエフェクト、ノード数の多い色補正、フィルムグレインなどの編集性能を向上できるという。 関連記事 新型「MacBook Pro」発売 最大6コア、「True Tone」搭載 米Appleが、新型「MacBook Pro」を発売した。色温度を自動調節する「True Toneディスプレイ」を新たに採用した。 「Blackmagic Pocket Cinema Camera 4K」が日本初公開

                              「MacBook Pro」用外付けGPU「Blackmagic eGPU」、Appleストアで8万9800円で発売
                            • サーバレスGPUにModalがいいぞ!

                              GPUを使いたいこと、あると思います。 ただしご家庭に強いGPUはないこともあるでしょうし、かといってGPU搭載したインスタンスを立て続けているととてつもないお金がかかります。 そんなあなたにサーバレスGPU、使った秒数分だけ課金が発生するので、いきなりすごい金額がかかることにはならず手軽にGPUを使ったプログラミングが始められます。 私は今の所ModalとRunPodを試したのですが、ModalのDXが良すぎるため今回イントロ記事を書く筆を取りました。 始めにざっくりいいところを述べると 一つのファイルで完結する。 RunPodとの比較だと「RunPodではDockerのイメージを自前でビルドしてどこかしらのregistryにpush、都度タグを付け替えてRunPodの方にも反映」みたいなのが必要だったがModalでは全部要らない ローカルパッケージをちょろっとした関数で送れたり、テキス

                                サーバレスGPUにModalがいいぞ!
                              • ゲームに不可欠な「GPU」の働きや性能に関して知っておくべきこと

                                高解像度の3DゲームなどのPCゲームを楽しむために「グラフィックボード(ビデオカード)」はかかせません。このグラフィックボードに搭載される専用チップ「Graphics Processing Unit(GPU)」が一体どのような働きをしているのかを、ExtremeTechが分かりやすく解説しています。 How Graphics Cards Work - ExtremeTech https://www.extremetech.com/gaming/269335-how-graphics-cards-work ◆CPUとGPU コンピューターの演算を行うハードウェアとしてCPUが知られています。ゲームに大切なGPUを理解するために、より一般的なCPUと比較するところからExtremeTechは説明を始めています。 「3Dなどの映像を描画するのにCPUを使えないのか?」という素朴な疑問について、答

                                  ゲームに不可欠な「GPU」の働きや性能に関して知っておくべきこと
                                • pythonでGPUとMCMC(とR) - xiangze's sparse blog

                                  GPUでモンテカルロ法の計算をしたくなったりした場合には普通CUDA,OpenCLを使うことになります。 C++でプログラミングする必要があるのですが、変数の確保、解放などで記述が長くなりがちです。pythonを用いると記述を簡潔にできるところが多いらしいので関連するライブラリを紹介します。 実務的にはPyMCからTheanoが呼べるらしいのでそれを使用するのが良さそうですが、現段階では実装されていない機能もあります。 @beroberoさん http://heartruptcy.blog.fc2.com/blog-entry-152.html id:breakbeeさん http://breakbee.hatenablog.jp/entry/2014/05/20/121722 がインストール、実行に関して解説されているのでここでは実装面を少し説明します。というか備忘録です。 PyCUDA

                                    pythonでGPUとMCMC(とR) - xiangze's sparse blog
                                  • Pythonのように書けてGPU上で並列処理できる新プログラミング言語「Bend」、2D画像→3Dを高精度生成するGoogle「CAT3D」など重要論文5本を解説(生成AIウィークリー) | テクノエッジ TechnoEdge

                                    2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第47回目は、生成AI最新論文の概要5つを紹介します。 生成AI論文ピックアップ GPU上でネイティブ動作する並列処理が可能な新プログラミング言語「Bend」とランタイムシステム「HVM2」 2D画像から3Dコンテンツを生成する「CAT3D」をGoogleが開発 大規模言語モデルは追加学習や新知識で幻覚生成が増加。Googleなどが調査 画像とテキストを使った長文生成が得意なAIモデル「Chameleon」をMetaが開発 Transformerを超える「Mamba」は視覚認識タスクに必要か? 開発した「MambaOut」モデルで検証 GPU上でネイティブ動作する並列

                                      Pythonのように書けてGPU上で並列処理できる新プログラミング言語「Bend」、2D画像→3Dを高精度生成するGoogle「CAT3D」など重要論文5本を解説(生成AIウィークリー) | テクノエッジ TechnoEdge
                                    • 【2ch】ニュー速クオリティ:ついにインテル内蔵GPUの新ドライバが覚醒 40%の性能向上 HAWX2は15→79fpsに大幅向上

                                      1 名無しさん@涙目です。(山形県) 2011/09/04(日) 01:45:30.27 ID:YZDmnb4y0 ?PLT(12067) ポイント特典 769+1 :Socket774 [sage] :2011/09/03(土) 20:34:52.83 ID:vniOepSc (3/9) ってネタかと思ったらまじかよ Intelの新グラフィックドライバは40%性能向上するらしい Intel: new graphics drivers will make your games run 40% faster http://games.kitguru.net/pc-gaming/maksims-smolaks/intel-new-graphics-drivers-will-make-your-games-run-40-faster/ 772 :Socket774 [sage] :2

                                      • ニンテンドー3DSのGPUに「PICA 200」が採用 純国産の固定機能シェーダー対応GPU

                                        • 【後藤弘茂のWeekly海外ニュース】 GPUの進化に対応したMicrosoftの次世代API「DirectX 12」の背景

                                          • AI/機械学習にコンテナは必要か?――4人のスペシャリストが語るGPUコンテナの未来

                                            2018年11月8日に行われ盛況のうちに幕を閉じた「Red Hat Forum 2018 Tokyo」。そのセッションの一つとして開催されたのがパネルディスカッション「AI/マシンラーニング開発基盤を支える技術 ~Kubernetesが創るGPUコンテナの未来~」だ。エヌビディア(NVIDIA)、Preferred Networks(PFN)、日本ヒューレット・パッカード(HPE)、レッドハットという各分野のエキスパートが、AI、マシンラーニング(機械学習)、ディープラーニング(深層学習)において、コンテナがどのような効果をもたらすのか、現在の課題や今後の展望を語った。 登壇者は以下の通り。モデレーターは@IT編集部 エグゼクティブエディターの三木泉(以下、三木)が務めた。今回はTwitterのハッシュタグ「#RHF_TECH」を使って会場からリアルタイムで質問も募った。 登壇者 大村伸吾

                                              AI/機械学習にコンテナは必要か?――4人のスペシャリストが語るGPUコンテナの未来
                                            • CPU・GPU・ストレージの性能をワンクリックで測定できるフリーソフト「CrystalMark Retro」レビュー、CrystalDiskMark作者の新作で簡単操作でPCの性能を測定可能

                                              CPUやGPU、ストレージの性能を簡単に測定できるベンチマークソフト「CrystalMark Retro」が2024年3月31日にリリースされました。CrystalMark Retroはストレージベンチマークソフト「CrystalDiskMark」やストレージ管理ソフト「CrystalDiskInfo」といった定番ソフトの作者であるhiyohiyo氏の新作ということで、CrystalMark Retroも定番ソフトに仲間入りしそうな気配を感じます。そんなCrystalMark RetroをダウンロードしてPCの性能を測定するまでの手順を確認してみました。 CrystalMark Retro - Crystal Dew World [ja] https://crystalmark.info/ja/software/crystalmarkretro/ CrystalMark Retroをダウン

                                                CPU・GPU・ストレージの性能をワンクリックで測定できるフリーソフト「CrystalMark Retro」レビュー、CrystalDiskMark作者の新作で簡単操作でPCの性能を測定可能
                                              • NVIDIA H100 for AI & ML Workloads | Cloud GPU Platform | Paperspace

                                                Paperspace is now part of DigitalOcean, and we've got a new look to match!

                                                  NVIDIA H100 for AI & ML Workloads | Cloud GPU Platform | Paperspace
                                                • 新製品レビュー:Adobe Lightroom CC GPU対応、フィルターブラシ、顔認識…定番写真ソフトがさらに進化

                                                    新製品レビュー:Adobe Lightroom CC GPU対応、フィルターブラシ、顔認識…定番写真ソフトがさらに進化
                                                  • PhotoshopのGPU/OpenGLって使ってる? 僕が使ってるお気に入り機能まとめ / Maka-Veli .com

                                                    メモリ食いますしグラボによっては使えないそうですが、皆さんGPU/OpenGLって使ってますか?僕は一応使ってます。使いこなせてないと思いますが。けっこう便利な小技が揃ってるので、個人的に気に入った機能をまとめました。使った事無い方は是非一度お試しください。 それと、3Dが出来るのは大きいかもしれないですね。使い方によっては面白い装飾が作れます。 が、3Dに関しては知識不足の為、省きます。 CS4から、あるいはCS5から導入された物が散らばってますが、 僕の環境が5.5なので5.5前提で書いていきます。ちなみにWinですが、Macも部分併記。 それと、恐らくCS6は微妙にどこか違うはず。6での追加機能も特に調べて無いです。 なんだよCS6書けよとご不満の方、CS6買って!CC1年でも良いです。ぜひ! フリップ スマホ的な感じで、するするーっと動くようになります。 [Spac

                                                    • 走行動画を説明するLLMを作成し、80台のGPUで分散並列学習させた話

                                                      3行でまとめると LLM分散学習ハッカソンに参加し、Vision-Languageモデルの一つであるBLIP2のHuggingFaceモデルを拡張して動画からテキスト生成するVideoBLIPを作成しました。ソースコードはGithubで公開しています。 運転映像に対する説明文章を学習に用いてVideoBLIPの学習を行い、運転映像を説明するモデルを作成しました。(以下のように運転映像に対して説明文が出力されます) 学習を高速化するためにマルチノードで学習を行えるようにし、実際にABCIのGPU80台を使って分散学習を行い、4GPUで行った場合の20倍の計算速度が実現できました(Strong Scaling!) 分散並列学習にはDeepSpeedを用いました。 はじめに Brain Researchチームで自動運転AIを開発している棚橋です。Brain Researchチームではレベル5の完

                                                        走行動画を説明するLLMを作成し、80台のGPUで分散並列学習させた話
                                                      • NVIDIAのGPU不足が解消され余剰在庫が発生

                                                        新型コロナウイルス感染症のパンデミックによる工場閉鎖や仮想通貨のマイニング需要などが重なり、2021年はGPUの価格が激しく高騰しました。しかし、2022年1月にはGPUの価格が下落に転じたという報道がなされ、2022年4月には正常な価格に近づいていると伝えられており、価格が次第に安定し始めたことがうかがえます。このような状況の中、NVIDIAはGPUに余剰在庫が生じていることを明らかにしました。 NVIDIA Corporation (NVDA) CEO Jensen Huang on Q2 2023 Results - Earnings Call Transcript | Seeking Alpha https://seekingalpha.com/article/4536856-nvidia-corporation-nvda-ceo-jensen-huang-on-q2-2023-r

                                                          NVIDIAのGPU不足が解消され余剰在庫が発生
                                                        • AppleのAI研究チームがAIモデル「Depth Pro」をリリース、単一の画像を使用して標準GPUで225万ピクセルの3D深度マップを0.3秒で生成できる

                                                          機械が深度(奥行き)を認識する方法を大幅に進歩させるモデル「Depth Pro」をAppleのAI研究チームがリリースしました。他の方法では見落とされがちな「髪の毛」や「草木」といった細かいディテールを持った物体の深度も正確に認識可能で、高解像度の深度マップをわずか0.3秒で生成することが可能な点が特徴。自動運転車などリアルタイムで深度を推定するシステムに応用可能だと期待されています。 [2410.02073] Depth Pro: Sharp Monocular Metric Depth in Less Than a Second https://arxiv.org/abs/2410.02073 GitHub - apple/ml-depth-pro: Depth Pro: Sharp Monocular Metric Depth in Less Than a Second. https

                                                            AppleのAI研究チームがAIモデル「Depth Pro」をリリース、単一の画像を使用して標準GPUで225万ピクセルの3D深度マップを0.3秒で生成できる
                                                          • ムーアの法則を打ち破るNVIDIA GPUの次の一手は“1パッケージでマルチGPU” - PC Watch

                                                              ムーアの法則を打ち破るNVIDIA GPUの次の一手は“1パッケージでマルチGPU” - PC Watch
                                                            • Intel vs. AMDガチ比較! ゲームのfpsは、配信負荷はどうだ!? ~第3世代Ryzen×GPUの最適タッグを検討する

                                                                Intel vs. AMDガチ比較! ゲームのfpsは、配信負荷はどうだ!? ~第3世代Ryzen×GPUの最適タッグを検討する
                                                              • 【後藤弘茂のWeekly海外ニュース】 NVIDIAが次世代GPUアーキテクチャ「Kepler」のベールを剥いだ

                                                                • Ryzen 6000モバイル版で遂にGPUにてこ入れ。Zen3+とRDNA2で性能大幅引き上げ

                                                                    Ryzen 6000モバイル版で遂にGPUにてこ入れ。Zen3+とRDNA2で性能大幅引き上げ
                                                                  • DDR4はDDR3より本当に高性能?意外と知られていない「メモリの実性能」 内蔵GPUや暗号化の実行速度、消費電力などをチェック text by 坂本はじめ

                                                                      DDR4はDDR3より本当に高性能?意外と知られていない「メモリの実性能」 内蔵GPUや暗号化の実行速度、消費電力などをチェック text by 坂本はじめ
                                                                    • AMD、Zen 3アーキテクチャに刷新したGPU内蔵の「Ryzen 5000G」

                                                                        AMD、Zen 3アーキテクチャに刷新したGPU内蔵の「Ryzen 5000G」
                                                                      • GPUでビデオをエンコード・デコード ~Linuxで普及の「VA-API」がWindowsで利用可能に/Windows 10 November 2019 Update/Windows 11以降で

                                                                          GPUでビデオをエンコード・デコード ~Linuxで普及の「VA-API」がWindowsで利用可能に/Windows 10 November 2019 Update/Windows 11以降で
                                                                        • 2値化CNN on FPGAでGPUとガチンコバトル(公開版)

                                                                          TensorFlow User Group HW部(2017年2月27日)で使ったスライドです。講演後、一部加筆・修正しています。Read less

                                                                            2値化CNN on FPGAでGPUとガチンコバトル(公開版)
                                                                          • [GDC 2024]CPUを使わずにGPUが自発的に描画するパイプライン「Work Graph」がDirectX 12に正式採用

                                                                            [GDC 2024]CPUを使わずにGPUが自発的に描画するパイプライン「Work Graph」がDirectX 12に正式採用 ライター:西川善司 セッションタイトルを訳すなら,「ようこそ,未来のGPUプログラミングモデル『GPU Work Graph』へ」 米国時間2024年3月18日に行われたGDC 2024の技術セッション「Advanced Graphics Summit: GPU Work Graphs: Welcome to the Future of GPU Programming」において,AMDとMicrosoftは共同で,DirectX 12の新機能「Work Graph」を発表した(関連リンク)。本稿では,Work Graphとは何で,どのような利点をもたらすのかを解説したい。 セッションを担当したMicrosoftのShawn Hargreaves氏(Dev Man

                                                                              [GDC 2024]CPUを使わずにGPUが自発的に描画するパイプライン「Work Graph」がDirectX 12に正式採用
                                                                            • 【後藤弘茂のWeekly海外ニュース】 AMD 7年振りの新GPUアーキテクチャ「Navi」は、10年を見据えたゲーム向けRDNAを搭載

                                                                                【後藤弘茂のWeekly海外ニュース】 AMD 7年振りの新GPUアーキテクチャ「Navi」は、10年を見据えたゲーム向けRDNAを搭載
                                                                              • LoRA のもう一つの大きなメリット、GPUメモリ共有しつつ別のタスク処理モデルへ即時に切り替える方法 - A Day in the Life

                                                                                低ランク行列を追加することで、大元のモデルを維持しつつ少ないコストで学習できる LoRA(Low-Rank Adaptation of Large Language Models)。先日、日本語でも大規模パラメータモデル cyberagent/open-calm-7b や rinna/japanese-gpt-neox-3.6b 等々がリリースされたり、HuggingFaceからはtransformersでLoRAを簡単に実現できるライブラリ、peft がリリースされたことで、試したことがある方も多いと思います。 ただ、LoRAのメリットについて主に学習の話が殆どで、もう一つの大きなメリットであるLLMのベースモデルのメモリを共有しつつ、複数のタスクをこなす方法の紹介は見かけたことがなかったので、それをpeftで行う方法についてのお話です。 なお、LoRAとは何か?というお話は、輪講資料

                                                                                  LoRA のもう一つの大きなメリット、GPUメモリ共有しつつ別のタスク処理モデルへ即時に切り替える方法 - A Day in the Life
                                                                                • 【後藤弘茂のWeekly海外ニュース】 NVIDIAが次世代GPUアーキテクチャ「Fermi」を発表