中国に拠点を置くGPUメーカーの「摩爾線程(Moore Threads)」が、自社製GPUを用いて大規模言語モデル「MT-infini-3B」を開発したことを発表しました。MT-infini-3BはNVIDIA製GPUを用いて学習した大規模言語モデルと同等以上の性能を備えているそうです。 摩尔线程携手无问芯穹:基于夸娥千卡智算集群的“MT-infini-3B”大模型实训已完成 | 摩尔线程 https://www.mthreads.com/news/171 アメリカ政府は中国によるAI研究を軍事上の脅威と捉えており、中国に対して高性能半導体の禁輸措置を実施しています。このため中国ではNVIDIAやAMD、Intelなどが開発しているAI研究用チップの開発が困難となっています。 そんな中、Moore Threadsは2023年12月に独自開発のAI研究用GPU「MTT S4000」を発表しま
当社の社長であるAIスーパーコンピュータ「継之助(つぎのすけ)」は、ひょんなことから生まれました。 ある日のこと、共同創業者の清水がその日の朝、清水(きよみず)の舞台から飛び降りたつもりでA100 80GBというGPUを買ったという話をその日の夜に聞いた共同創業者の海老根が、「亮ちゃんが買うならおれも10個買う」と宣言し、その場で11個のA100 80GBが届くことが決まってしまったのです。 当時(今もですが)A100 80GBは非常に効果な上にタマがなく、このタイミングで11個ものA100が揃うのは奇跡的でした。 しかもものすごい速さで届いてしまったため、ただ置いておくだけでは宝の持ち腐れになってしまいます。 そこで清水は慌てて「A100を動かすためのシャシー(本体)を買わなくちゃ」と秋葉原で色々なお店を探すのですが、20年前ならいざ知らず、今の時代に秋葉原に4Uサーバーを在庫している店
ソース:wccftech - AMD RDNA 5 To Be A Completely New GPU Architecture From The Ground Up, RDNA 4 Mostly Fixes RDNA 3 Issues & Improves Ray Tracing 解説: RDNA4でレイトレーシングが改良され、RDNA5では一から設計され、大幅に変化する らしいです。 実際RDNA5は今まで通りのスケジュールならば2026年のはずで今から2年後のことを言われてもなあというのが正直な感想です。 AMDはRDNA4を予定通り出すよりもその分の生産容量をMI300やMI400に振り向けたほうが儲かると判断してRDNA4はミドルレンジしか出さないと決めたのでしょう。 それが正しいのかどうかは今のところ未知数です。 しかし、RTX5090、RTX5080、RTX5070Ti、(
プラットフォームに搭載する「GB200 Grace Blackwell Superchip」は、新GPU「B200」(2080億個のトランジスタを搭載し、現行の「H100」と比較して、AI向けの作業で5倍の処理能力を発揮するGPU)を2基と1基のGrace CPUを組み合わせたもの。 NVIDIAによると、1兆8000億パラメータのAIモデルをトレーニングするには、Hopper GPUでは8000個のGPUで15メガワットの電力が必要だったが、新スーパーチップであれば2000個で可能で、消費電力は4メガワットで済むという。 NVIDIAはGB200を、水冷ラックスケールシステム「NVL72」などで提供する。これは第5世代NVLinkで接続された72個のBlackwel GPUと36個のGrace CPUを含む36個のGrace Blackwellスーパーチップを搭載する。 Blackwel
NVIDIAが、GPU向けのコンピューティングプラットフォームとして提供している「CUDA」のソフトウェア利用許諾契約(EULA)の中で、翻訳レイヤーを通じてNVIDIA以外のハードウェアプラットフォームで実行することを禁止していることがわかりました。もともとこの条項はNVIDIAのサイト上で公開されているオンライン版のEULAには含まれていましたが、インストールしたCUDAのドキュメントにも含まれるようになったとのことです。 License Agreement for NVIDIA Software Development Kits — EULA https://docs.nvidia.com/cuda/eula/index.html Nvidia bans using translation layers for CUDA software — previously the prohi
「AMD FSR」がついにAIベースになって性能強化? NVIDIA DLSS / Intel XeSS同様の品質向上アプローチ 米AMDでCTOを務めるMark PapermasterがYouTubeチャンネル「No Priors」に登場し、ゲーム向けのAI機能活用について言及して話題を集めている。米テック媒体のVideocardzなどが報じた。 「AMD FSR」がついにAIベースになって性能強化? NVIDIA DLSS / Intel XeSS同様の品質向上アプローチ AMDはRadeonシリーズにAIコアを統合して展開しているが、各種ゲームで利用できる超解像技術「AMD FidelityFX Super Resolution」では用いていない。この機能はハードウェアに依存しない設計思想によってオープンソースソフトウェアとしても公開されているほか、GPUベンダーを問わず利用可能でき
Automatic1111's Stable Diffusion WebUI now works with Intel GPU hardware, thanks to the integration of Intel's OpenVINO toolkit that takes AI models and optimizes them to run on Intel hardware. We've re-tested the latest release of Stable Diffusion to see how much faster Intel's GPUs are compared to our previous results, with gains of 40 to 55 percent. Stable Diffusion (that currently has our prev
近年、AIを身近に体験できるサービスやアプリケーションなどが次々と登場していますが、多くは強力な処理性能を備えたサーバー経由で使用できるオンラインサービスとなっています。しかし、これらに頼らず自前のPCでAIを使う際にどのGPUが最適なのか、まとめたベンチマーク結果がTom’s Hardwareが調査をしその結果を発表しています。 Stable Diffusionを用いてGPUのAI処理性能をベンチマーク。NVIDIA製GPUが最適解 AIサービスと言うと最近ではChatGPTと呼ばれるサービスが話題を集めていますが、その前にAIがユーザーが入力したキーワードを基に画像を出力するStable Diffusionが話題となっていました。 これらのAIサービスは基本的に強力な処理性能を備えたサーバーで処理が行われるオンラインサービスとなっていますが、Stable Diffusionに関してはあ
GPU情報 AMD RDNA4 噂のスペック。129 FP32 TFLOPS GPU、GDDR7、3.5 GHz クロックレートなど、驚異的なスペック。 RedGamingTechがAMD RDNA4アーキテクチャと次期GPUであるNavi 41、Navi 42、Navi 43に関する多くの情報を公開しています。 これは、有名なリーカーからの最初のリークの1つで、RGTは信頼できる実績を持っていますが、この初期の情報は常に流動的で変更されやすいため、この投稿は現時点ではまだ噂としてマークされています。 それでは、この情報を少し割り引いて見ながら、RGTからのこの絶対的なリークを掘り下げてみましょう。 AMD Navi 41、Navi 42、Navi 43 GPUは次期Radeon RX 8000シリーズの噂の予備仕様になる まず、RGTはRDNA4 CUのALU数がRDNA3と全く同じであ
早くもGeForce RTX 5000シリーズに関する情報が出てまいりました。YouTubeチャンネルのRedGamingTechは以下のように述べています。 ▼GeForce RTX 5000シリーズ / Blackwell 早期リーク情報 ハイエンドモデルはチップレットになる可能性が高い現在、Blackwellの評価用SKUは、巨大なMCMを含めて多数存在するBlackwellは新しいStreaming Multiprocessor (SM)構造を採用するハイパースピードバスがSM / チップレットに相互接続されるRTパイプラインの一部のデノイジングアクセラレーター(詳細不明)を搭載。レイトレーシングとパストレーシングの両方にとって重要なものとなることが予想されるNVIDIA史上最大の性能向上 まだ情報は少なく、RedGamingTechの報道は概要的なものとなっています。 いくつかの
2022年11月16日にNVIDIAではGeForce RTX 4080を発売しますが、この発売に先立ちAMDでは12月に発売を控えているRadeon RX 7900 XT/RX 7900 XTXをRTX 4080と比べた時の優位性や一部ゲームにおけるパフォーマンス結果を公表しました。 2022年12月13日発売予定のRadeon RX 7900シリーズ AMDでは2022年11月3日にRDNA3アーキテクチャーとその搭載製品に関するイベントを開催し、RDNA3とその中で最上位GPUであるNavi 31 GPUを搭載するRadeon RX 7900 XTおよびRadeon RX 7900 XTXの仕様や性能の概要と価格、発売日の発表を行いましたが、それ以来AMDではあまり情報を公開してきませんでした。 しかし、Radeon RX 7900 XT、RX 7900 XTXのライバルであるNVI
タイトルでほぼほぼ出オチですが、先日、NVIDIAからCUDA Toolkit 11.4と共にリリースされた新機能GPUDirect Storage 1.0のドキュメントを読んでいると、面白い記述を見つけた。 曰く、MOFEDドライバ5.3以降と、Mellanox Connect-X4/5の組み合わせで、NFS-over-RDMAとGPUDirect Storageを組み合わせ、リモートのNFS区画からローカルのGPUへと直接のデータ転送を行う事ができるようになる、と。 14.10. NFS Support with GPUDirect Storage This section provides information about NFS support with GDS. 14.10.2. Install GPUDirect Storage Support for the NFS Cli
NVIDIA,新世代GPU「GeForce RTX 30」シリーズを発表。第1弾の「GeForce RTX 3080」は9月17日発売で税別約11万円前後 編集部:小西利明 2020年9月2日,NVIDIAは,独自開催のオンラインイベント「GeForce Special Event」で,Ampereアーキテクチャを採用する新型GPU「GeForce RTX 30」シリーズの製品として,「GeForce RTX 3080」と「GeForce RTX 3070」,および「GeForce RTX 3090」を発表した。 GeForce RTX 3080搭載カードを披露するNVIDIAのCEOであるJensen Huang(ジェンスン・フアン)氏 搭載グラフィックスカードのメーカー想定売価と発売時期は,GeForce RTX 3080が10万9800円で9月17日,GeForce RTX 3070
画面写真をクリックするとサンプルのWebGLビルドに飛びます。 こんにちは。技術部平山です。 今日はシェーダでの精度指定について、地味なお話をいたします。 詳しいことに興味がなければ、 非常に簡潔にまとめられた記事 をLIGHT11さんが書いてらっしゃいますので、それを読めば足ります。 なお、この記事の結論を一言で言えば、「UVと位置にhalfを使うな」 です。 速度や電力も大事ですが、下手に攻めてバグる方が問題です。 サンプルのソースコードはgithubに置いてありますが、 今回に関してはサンプルを動かしていただけば十分かなと思います。 より詳細を知りたい方はご覧ください。 冒頭の写真について 冒頭の写真は、仮にシェーダでの浮動小数点数の精度が低かったらどんなことが起こるか? をシミュレートしたものです。 絵の左下がテクスチャ座標(UV)が(0,0)で、右上がだいたい(5,5)です。 右
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く