並び順

ブックマーク数

期間指定

  • から
  • まで

321 - 345 件 / 345件

新着順 人気順

GPUの検索結果321 - 345 件 / 345件

  • NVIDIA GPUの性能比較

    AIスタートアップ株式会社Deepreneur(ディープレナー)の澤田です。 弊社で実施したNVIDIA GPUの性能比較に関するサーベイを公開します! 概要 NVIDIAは、データセンター、ワークステーション、そしてコンシューマー向けのグラフィックスアクセラレータを提供していることで知られる企業です。各GPUモデルにおける性能には差があります。そこで、NVIDIAのGPUに関するサーベイを実施し、最先端のGPUをどれほど把握しているのかを詳細に解説します。 NVIDIAのGPUモデル NVIDIAは、Geforce、Quadro、Titan、Teslaの4つのカテゴリーでGPUモデルを提供しています。それぞれの違いは、用途や性能、バッファーなどです。以下に、最新のTeslaシリーズにおける性能比較を示します。 GPUモデル Tensor Cores数 CUDAコア数 メモリ容量 メモリバ

      NVIDIA GPUの性能比較
    • Meta、ザッカーバーグ氏が語る「GPU」に投資する理由と“AIの失敗”

      関連キーワード 人工知能 | データセンター | GPU | 機械学習 | 経営 「Facebook」や「WhatsApp」「Instagram」などのサービスを運営しているMeta Platformsは、2023年の通期決算で、前年比16%以上の増加となる1349億ドルの売り上げを計上した。同年第4四半期(9~12月)と同年通期の業績は、人工知能(AI)技術とデータセンターインフラへの投資に力を入れる同社の姿勢を表している。その背景には、同社が経験した“AIインフラ構築の失敗”がある。同社CEOマーク・ザッカーバーグ氏が考える、「GPU」(グラフィックス処理装置)の増強を含めた今後の投資戦略とは何か。 Metaが経験した“AIインフラの失敗” 併せて読みたいお薦め記事 Metaの戦略 メタバース損失続きのMeta、CPUを見限って「GPU」積極採用へ その真意は? メタバースは「死んだ」

        Meta、ザッカーバーグ氏が語る「GPU」に投資する理由と“AIの失敗”
      • 野火 城@AI on X: "■AI花咲かじいさん ~危険なGPU交換~(1/7) https://t.co/VnAWxOuBBW"

        • NVIDIA GeForce RTX 4070 SuperではAD103 GPUと16GBのVRAMを搭載。GDDR6化した安価なRTX 4070も計画中。

          NVIDIAがRTX 4080と同じGPUを備えたGeForce RTX 4070 Superを計画中、VRAMは16GBに増強。一方でGDDR6化にスペックダウンした安価なRTX 4070も計画中 NVIDIAについてはGeForce RTX 4000シリーズの発売から1年が経とうとしている事から、モデルライフ中間のリフレッシュモデルの投入が検討されています。 NVIDIAがGeForce RTX 4000シリーズSuperを準備中。GeForce RTX 4070 Ti Superなども計画? その検討内容のリークとしてGeForce RTX 4080 Super、RTX 4070 Ti Super、RTX 4070 Superなどハイエンドモデルを中心に、リフレッシュモデルである『Superバージョン』に関する情報が出ていましたが、今回この中でGeForce RTX 4070 Sup

            NVIDIA GeForce RTX 4070 SuperではAD103 GPUと16GBのVRAMを搭載。GDDR6化した安価なRTX 4070も計画中。
          • Core Ultra / Meteor lake、実際のところどうなの?- マルチ性能、電池持ち、GPUで大きな進歩

            筆者は、初代Core UltraことMeteor lakeについて、以前にいくつかの記事を書いていました。その中で、いくつかの性能予想を行っていました。列挙するとおおむね以下の通りです。 2023/3/8 年末商戦の目玉?Intel次世代Meteor lakeは 電池持ち改善に期待 2023/9/25 省電力性をアピールするMeteor lake(次期 Core Ultra) ⮞ シングルスレッド性能は変わらないか、省電力モードでは改善することがある ⮞ “U”や”P”の後継はコア数増加によってマルチスレッド性能が+30~50%になる ⮞ “H”の後継はマルチスレッド性能+20%程度になる ⮞ 内蔵GPU性能は1.3~2.0倍となり、Z1 Extremeに匹敵する水準になる ⮞ 15-28Wの主力製品では実用的負荷での電池持ちが2~4割程度伸びる 発売後しばらくたってMeteor lake

              Core Ultra / Meteor lake、実際のところどうなの?- マルチ性能、電池持ち、GPUで大きな進歩
            • NVIDIAが性能を向上しつつ値下げしたGPU「RTX 4080 SUPER」「RTX 4070 Ti SUPER」「RTX 4070 SUPER」を発表

              NVIDIAのGPU「RTX 40」シリーズに、前モデルから高速化を果たした「SUPER」モデルが加わることが明らかにされました。新規モデルは「RTX 4080 SUPER」「RTX 4070 Ti SUPER」「RTX 4070 SUPER」の3種類です。 GeForce At CES 2024: SUPER GPUs, 14 New RTX Games, Accelerating Gen AI, G-SYNC Innovations, RTX Remix Open Beta, Twitch Enhanced Broadcasting & More | GeForce News | NVIDIA https://www.nvidia.com/en-us/geforce/news/geforce-rtx-ces-2024-announcements/ GeForce RTX 40 SUPE

                NVIDIAが性能を向上しつつ値下げしたGPU「RTX 4080 SUPER」「RTX 4070 Ti SUPER」「RTX 4070 SUPER」を発表
              • Rebuild: 374: OpenAI Is Nothing Without GPU (らんぶる)

                らんぶるさんをゲストに迎えて、OpenAI について話しました。 Show Notes らんぶる: OpenAIと信仰体系 OpenAI announces leadership transition Greg Brockman: "After learning today’s news, this is the message I sent to the OpenAI team" Sam Altman: "first and last time i ever wear one of these" OpenAI board in discussions with Sam Altman to return as CEO Microsoft CEO Satya Nadella on the OpenAI Debacle - On with Kara Swisher Ilya Sutskever

                  Rebuild: 374: OpenAI Is Nothing Without GPU (らんぶる)
                • GitHub - philipturner/metal-benchmarks: Apple GPU microarchitecture

                  You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                    GitHub - philipturner/metal-benchmarks: Apple GPU microarchitecture
                  • 次世代の高速計算。CPU NumPy のコードを GPU CuPy コードに自動変換。 - Qiita

                    ショートストーリー: 「コードの彼方」 東京の繁忙な街並みを見下ろす高層ビルの一室で、若きプログラマ、翔太が熱心に作業していた。彼のモニターには、NumPyで書かれたコードが表示されている。スクリーンに映し出される数式とデータは、彼の心の中で複雑なパズルのように組み合わさっている。 翔太は、日々の仕事に加えて、自身のプロジェクトにも取り組んでいた。それは、計算処理を高速化するためにNumPyで書かれた数値計算コードをCuPyに変換するというものだ。彼の目標は、GPUの力を借りて計算を爆速で処理することだった。夜も更け、東京の街はネオンの光に包まれていたが、翔太はキーボードに向かい続けた。 「ループを含むコードが多いなぁ…。これをCuPyでどのように変換し、最適化すれば良いのか…。」翔太はつぶやいた。彼のモニターには、次のようなNumPyのコードが表示されている。 import numpy

                      次世代の高速計算。CPU NumPy のコードを GPU CuPy コードに自動変換。 - Qiita
                    • レノボがAIワークロード向けとなるAMD MI300X搭載GPUサーバを発表

                      レノボ・エンタープライズ・ソリューションズは5月14日、AMD MI300X搭載GPUサーバ「ThinkSystem SR685a V3」を発表した。 生成AIや大規模言語モデル(LLM)など演算負荷の高いAIワークロード向けとなるGPUサーバーで、第4世代AMD EPYCプロセッサとAMD Instinct MI300X GPUの搭載に対応。最大1.5TBのHBM3メモリをサポート、GPU I/O帯域幅は最大1TB/sを実現している。 この他、AMD EPYC 8004プロセッサを搭載したAzure Stack HCIエッジサーバ「Lenovo ThinkAgile MX455 V3 Edge Premier Solution」、第4世代AMD EPYCプロセッサを1期島歳するサーバノート「Lenovo ThinkSystem SD535 V3」も合わせて発表を行った。 関連記事 Len

                        レノボがAIワークロード向けとなるAMD MI300X搭載GPUサーバを発表
                      • 米Dell、GPUサーバ「PowerEdge XE9680」にGaudi 3 AIアクセラレーター搭載モデル

                        米Dell Technoligiesはこのほど、Intel製AIアクセラレーターを搭載したGPUサーバ「PowerEdge XE9680」の発表を行った。 プロセッサとして最大56コアの第4世代Xeonスケーラブル・プロセッサを2基搭載する高性能GPUサーバで、Tensorコア64基と128GB HBMe2メモリを搭載するIntel Gaudi 3 AIアクセラレーターを搭載しているのが特徴。Gaudi 3専用メディアデコーダーはAIビジョンアプリ向けに設計されており、エンタープライズAIアプリケーションのパフォーマンス向上を行えるとしている。 関連記事 企業は生成AIのビジネス活用をどう考えるべきか 生成AI開発基盤を提供するデルの取り組み デル・テクノロジーズが、報道関係者向けに生成AI関連の勉強会を実施した。そこで出た生成AIの取り組みをまとめた。 デル、従来比2.9倍のAI推論を実

                          米Dell、GPUサーバ「PowerEdge XE9680」にGaudi 3 AIアクセラレーター搭載モデル
                        • 【急展開】NVIDIAの天下が終わる? MSFTが発表したAIモデル「BitNet」がやばすぎる‥‥GPUが不要になるだと!?😨🥺😳 : ライフハックちゃんねる弐式

                          2024年03月01日 【急展開】NVIDIAの天下が終わる? MSFTが発表したAIモデル「BitNet」がやばすぎる‥‥GPUが不要になるだと!?😨🥺😳 Tweet 11コメント |2024年03月01日 12:00|Web・テクノロジー|Editタグ :AIGPU機械学習NVIDIABitNet マイクロソフトが発表したBitNet、やばすぎて半信半疑ながらも真実ながら凄すぎて期待してしまう。 行列の中身を1ビット(0 or 1のみ)にして、行列演算に乗算が必要なくなって高速化させてるらしい。 高速化する理屈はわかるけど、論文によるとなぜか精度も向上してるらしい。 やばすぎて一旦様子見。 pic.twitter.com/jugSP5RpLX— goto (@goto_yuta_) February 28, 2024 「1ビットLLMの衝撃! 70Bで8.9倍高速 全ての推論を加

                            【急展開】NVIDIAの天下が終わる? MSFTが発表したAIモデル「BitNet」がやばすぎる‥‥GPUが不要になるだと!?😨🥺😳 : ライフハックちゃんねる弐式
                          • Colaboratory on X: "Colab now has NVIDIA L4 runtimes for our paid users! 🚀 24GB of VRAM! It's a great GPU when you want a step up from a T4. Try it out by selecting the L4 runtime! https://t.co/3DDp9gxG8D"

                            • 自作PCにGPUを2枚挿して13BのLLMを動かす話 | cloud.config Tech Blog

                              この記事は FIXER Advent Calendar 2023 - Adventar 23日目の記事です。 はじめにこんにちは、毛利です。この記事では趣味用の自作PCにGPUを2枚挿してサイズが13BのLLMを動かす話をします。 LLMのパラメータ数と推論に必要なメモリ量についてまず初めに、LLMのパラメータ数に対して、推論に使う場合にどれぐらいのメモリが必要なのかを話します。ここで言うパラメータ数は7B(70億)、13B(130億)、70B(700億)といったものです。 精度によっても変わってくるのですが、配布されるモデルの精度としてはbfloat16であることが多いです。この場合は、1パラメータあたり2byteになるので、~Bの部分を2倍したGBが要求されると考えればよいです。例えば、7BのLLMであれば14GB、13BのLLMであれば26GBなどとなります。逆に4bit量子化等が行

                                自作PCにGPUを2枚挿して13BのLLMを動かす話 | cloud.config Tech Blog
                              • Intel ArcなどのGPUを担当したRyan Shrout氏がInte退職

                                  Intel ArcなどのGPUを担当したRyan Shrout氏がInte退職
                                • 生成AIの3市場を徹底解説、GPUシェアはNVIDIA一強、OpenAIやサービス市場は?

                                  生成AIは、わずか数年で急速に進化を遂げ、ハードウェアやソフトウェアだけでなく、プラットフォームやサービス産業などの業界に多くのビジネスチャンスをもたらしています。その市場規模は2023年には62億米ドルに達し、2030年までには世界のソフトウェア支出の5%近くを占めるようになると予想されています。この記事では、ドイツの市場調査会社IoTアナリティクス社の市場調査レポート「生成AIの世界市場の分析(2023年~2030年)」から、生成AIの3つの関連市場とその主要な企業について紹介します。 生成AIの市場規模 OpenAIは、2022年にChatGPTをリリースしてからわずか1年間で、売上高ゼロから10億米ドルという驚異的な成長を遂げました。これは、データセンターGPUの売上高を2022年の36億米ドルから、2023年には160億米ドルまで拡大させた米国のチップメーカー、NVIDIAに匹敵

                                    生成AIの3市場を徹底解説、GPUシェアはNVIDIA一強、OpenAIやサービス市場は?
                                  • さくらインターネット、石狩データセンターに「NVIDIA H100 Tensor コア GPU」2000基を整備完了

                                      さくらインターネット、石狩データセンターに「NVIDIA H100 Tensor コア GPU」2000基を整備完了
                                    • 速いぞ。0.00015秒。250,000倍速い高速化エンジニアリング。超速の ハッシュ計算とはなんですか。CPU Time: 38.7979  GPU Time: 0.00015 - Qiita

                                      速いぞ。0.00015秒。250,000倍速い高速化エンジニアリング。超速の ハッシュ計算とはなんですか。CPU Time: 38.7979  GPU Time: 0.00015 Python初心者ポエムChatGPTQwen 物語:GPUハッシュ計算プログラムの冒険 ある小学校6年生の男の子、ケンタはコンピュータに夢中な子どもでした。ある日、ケンタは「ハッシュ関数」というものについて学びました。それはコンピュータがビットコインマイニングを高速で行うために使う特別な方法だと聞きました。 ケンタが学んだハッシュ関数のアルゴリズムは、データを受け取って、一定のルールに従って別の形に変えるというものです。たとえば、「Hello World」というメッセージがあったとします。ハッシュ関数はこのメッセージを一定のパターンで変換して、長い数字の列にします。この数字の列はそのメッセージにだけ特有で、同じ

                                        速いぞ。0.00015秒。250,000倍速い高速化エンジニアリング。超速の ハッシュ計算とはなんですか。CPU Time: 38.7979  GPU Time: 0.00015 - Qiita
                                      • 完成品PC限定で良コスパ! 内蔵GPUなしの「Ryzen 5 7500F」ってどんなCPU?

                                        完成品PC限定で良コスパ! 内蔵GPUなしの「Ryzen 5 7500F」ってどんなCPU?(1/3 ページ) PCを購入する際に、予め想定していた予算内で求めている性能を得られると、ものすごく満足感が高い。しかし現実には「あれも、これも」とこだわっていくうちに、予算をオーバーしてしまいがちだ。 予算を増やせるのなら、それに超したことはない。しかし、現実にはそううまく行くとも限らず、何らかの妥協を強いられることになる。 欲しいスペックを満たしつつ、費用を節約したい――そんな時にふと頭に思い浮かぶのが内蔵GPUを省いた(無効化した)CPUだ。外部GPU(グラフィックスカード)を初めから搭載するのであれば、内蔵GPUが省くだけで数千円の節約となる。 そんな内蔵GPUを省いたCPUの1つが、AMDの「Ryzen 5 7500F」だ。読者の中には「え、そんなCPU聞いたことない」という人もいるかも

                                          完成品PC限定で良コスパ! 内蔵GPUなしの「Ryzen 5 7500F」ってどんなCPU?
                                        • QualcommがPC向けハイエンドSoC「Snapdragon X Elite」を発表 CPUもGPUもNPUも高速なのに省電力

                                          Snapdragon X Eliteの概要 Snapdragon X Eliteは「Performance Reborn(パフォーマンスの復活)」を標榜し、CPUコア、GPUコアやNPU(AIプロセッサ)コアなどを強化することで、x86アーキテクチャのSoC(CPU/APU)を上回るパフォーマンスを発揮しつつ、高い省電力性を確保したという。製造プロセスは4nmとなっている。 CPUコアは「Qualcomm Oryon」を12基搭載している。最大3.8GHzで稼働するが、1~2コアに限り稼働クロックを最大4.3GHzまで引き上げられる「ブーストアップ機能」も備えている。 従来のPC向けSnapdragonではパフォーマンス重視のCPUコアと省電力(高効率)重視のCPUコアを混載する「big.LITTLEアーキテクチャ」を取っていたが、本SoCではパフォーマンス重視コア(=Oryon)のみを搭

                                            QualcommがPC向けハイエンドSoC「Snapdragon X Elite」を発表 CPUもGPUもNPUも高速なのに省電力
                                          • Google、軽量&オープンで商用可能な新世代AIモデル「Gemma」を発表 ~NVIDIA GPUにも最適化/パフォーマンスは「Llama-2」をベンチマークで上回る

                                              Google、軽量&オープンで商用可能な新世代AIモデル「Gemma」を発表 ~NVIDIA GPUにも最適化/パフォーマンスは「Llama-2」をベンチマークで上回る
                                            • 産業用PCでもNVIDIA GPUやSnapdragon Xがトレンドに

                                                産業用PCでもNVIDIA GPUやSnapdragon Xがトレンドに
                                              • NVIDIAの新GPU「HGX H200」は何がすごいのか? 進化した点は?

                                                関連キーワード GPU | CPU | データセンター 2023年11月13日月曜日(現地時間)、GPU(グラフィックス処理装置)ベンダーのNVIDIAはデンバーで開催された「Supercomputing 2023」(SC23)の特別講演で、新GPUの「NVIDIA HGX H200」(以下、H200)を発表した。SC23はスーパーコンピューティング、ネットワーク、ストレージの国際カンファレンスだ。 NVIDIAによると、H200はメモリにSK hynixの「HBM3e」を採用してメモリ容量を従来モデルから増やした。これは、テキストや画像などを自動生成するAI(人工知能)技術「生成AI」(ジェネレーティブAI)と大規模言語モデル(LLM)の処理効率化に役立つという。具体的にはどのような進化を遂げたのか。 GPU選びで大事な“あの指標” 併せて読みたいお薦め記事 AIとGPUの関係を深く理解

                                                  NVIDIAの新GPU「HGX H200」は何がすごいのか? 進化した点は?
                                                • 軽率にGPUを使っていこう、OpenCL入門

                                                  軽率にGPUを使っていこう、OpenCL入門 はい、Cra2yPierr0tです。GPUを作る前に市販のGPUを触ってみるか、どうやらOpenCLってやつが標準化されてて良さそうだぞ。という動機でOpenCLを書き始めたら思いのほか辛かったし納得のいく入門記事が無かったので備忘録がてらOpenCL入門をここに置いときます。 OpenCLとは 並列プログラミング用のAPI、厳密な定義はwiki読んでね。 https://ja.wikipedia.org/wiki/OpenCL あとインストールとかは各自で頑張ってください。 OpenCLの思想 OpenCLの思想としてループの関数(カーネル)への展開が挙げられる。例として以下のように1024x1024の画像処理を1個のカーネルで行うのではなく、1024x1024=1,048,576個のカーネルで行うことで処理を高速にする。 古典的な実装 Op

                                                  • [CUDA] NVIDIA GPUやCUDA周りの互換性を理解したかった

                                                    よくわからなかったので、調べて整理しようとした試み。 Compute Capability GPU ハードウェアがサポートする機能を識別するためのもので、例えば RTX 3000 台であれば 8.6 であるなど、そのハードウェアに対応して一意に決まる。 アーキテクチャの世代が新しくなり、機能が増えるほど、この数字も上がっていく。 以下のリンク先に、Compute Capability と機能の対応表があるが、これを見ると(少なくとも執筆時点で) Compute Capability 7.x 以上でテンソルコアが使えるといったことがわかる。 それぞれの機種がどの値かは以下のサイトから確認できる。 NVIDIA Driver のバージョン Compute Capablity 一般向けの Compute Capability との関連性は見つからなかったが、データセンタ向けの資料には Maxwe

                                                      [CUDA] NVIDIA GPUやCUDA周りの互換性を理解したかった