米Googleは4月5日(現地時間)、AlphaGoや様々なサービスで利用しているオリジナルプロセッサ「TPU(Tensor Processing Unit)」についての論文(リンク先はPDF)を発表し、その性能について説明した。 Googleは現在はTPUを、主に人工知能の推論(学習済みモデルを使う)フェーズで使っているという。そのAIワークロードでは、TPUはGPUやCPUよりも15~30倍高速で、30~80倍エネルギー効率が高いとしている。 なお、ここで比較しているCPUは米IntelのHaswell世代の「Xeon E5-2699 v3」、GPUは米NVIDIAの「Tesla K80」で、いずれも実際にGoogleのデータセンターで稼働しているものだ。 Googleは約15年前から各種サービスで機械学習を採用している。6年前にはディープラーニングの採用を開始し、その処理には膨大なコ
来たるべき4K時代にGPUは対応できるのか。マルチGPU構成でチェックする,GeForceとRadeonの「4K対応度」 ライター:米田 聡 4K対応ディスプレイ(ASUSTeK Computer製「PQ321Q」) まだその数は限られているものの,PC用の4Kディスプレイが流通し始めている。IGZOパネルを採用したデザイン向けのものが30インチ超級で30万円以上と,まだまだ価格的には高嶺の花といった感じだったが,国内でも28インチで10万円以下という価格設定のなされたエントリー市場向けモデルがDellから年内の発売予定として告知されるなど,低価格化の兆しは見え始めている。 テレビにおける4K解像度の難点としてよく挙げられるのがコンテンツ不足だが,ゲームという立派な4K対応コンテンツがPCにはすでにある。もちろんすべてのゲームが4K解像度をサポートしているわけではないものの,GPU業界の二
インターネット上の広告は、その効果を最大化するためにユーザーの行動を追跡して適切なターゲットを選別しています。このユーザー追跡はCookieなどを用いて行われていますが、新たにGPUを用いてユーザーを識別できる技術が発表されました。 DRAWNAPART: A Device Identification Technique based on Remote GPU Fingerprinting https://arxiv.org/abs/2201.09956 Researchers use GPU fingerprinting to track users online https://www.bleepingcomputer.com/news/security/researchers-use-gpu-fingerprinting-to-track-users-online/ ユーザーの行動
RTX 2080 Tiに劣らない性能で消費電力と価格は低い優れたGPU GeForce RTX 3070 Founders Edition Text by 宮崎真一 Turing世代のハイエンド製品だった「GeForce RTX 2080 Ti」(以下,RTX 2080 Ti)の性能を凌駕するAmpere世代の「GeForce RTX 3080」(以下,RTX 3080)は,インパクトがかなり大きかった。しかし,いくら高い性能を発揮するとはいえ,10万円前後という価格のグラフィックスカードには,おいそれとは手が出ない人は多いだろう。 そんなゲーマーが待ち望んでいるのは,Ampere世代のミドルハイクラスとなる「GeForce RTX 3070」(以下,RTX 3070)ではないだろうか。 GeForce RTX 3070 Founders Edition メーカー:NVIDIA 価格:49
NVIDIA製GPUの数十倍速い? 次々に出てくる「AI専用チップ」とは何者か 識者に聞く高速化の仕組み(1/3 ページ) スタートアップ企業の米Etchedが発表した「Sohu」が、AI業界に新たな波紋を投げかけている。トランスフォーマーモデルに特化したこのAI専用チップは、米NVIDIAのH100 GPUと比較して20倍高速かつ低コストで動作すると主張しているからだ。 SohuのようなAI専用チップの登場は、AI業界にどのような変革をもたらすのか。汎用性の高いGPUから特化型チップへの移行は、AI開発のアプローチをどう変えるのか。そして、こうした専用ハードウェアの普及は、ソフトウェア開発の方向性にどのような影響を与えるのか。 オーダーメイドによるAIソリューション「カスタムAI」の開発・提供を行うLaboro.AI(東京都中央区)の椎橋徹夫CEOに、AI専用チップがもたらす可能性と課題
PFI/PFN社でオープンソース公開したディープラーニングフレームワークChainer、すで使って頂いている方、ありがとうございます。 さてそんなChainerですが、MacBookでも簡単に使い始めることはできますが、真価を発揮させるにはGPU環境が欲しいところです。また一方、GPUを積んだデスクトップPCでも(特にPyCUDAの)インストールでつまづく方がいるのも事実です。 開発側の人間としては、できれば手軽に試してもらえる環境を提供したい。そこでは、やはりAWSのEC2でGPUインスタンス使うのが一番いいと思います*1。 Chainer on EC2は何名かブログ等で記事を公開されていますが、今のところ最も簡単な方法はRyosuke TajimaさんのAWSでサクッとChainerを使ってみるです。 が、やはりここでもPyCUDAをソースからのビルドしてもらうことになっています。原因
Image super-resolution through deep learning. This project uses deep learning to upscale 16x16 images by a 4x factor. The resulting 64x64 images display sharp features that are plausible based on the dataset that was used to train the neural net. Here's an random, non cherry-picked, example of what this network can do. From left to right, the first column is the 16x16 input image, the second one i
http://calendar.perfplanet.com/2014/hardware-accelerated-css-the-nice-vs-the-naughty/ 1 comment | 0 points | by WazanovaNews ■ comment by Jshiike | 約1時間前 Ariya Hidayatが、サイトパフォーマンスの改善のためにGPUをうまく活用するポイントについて紹介してくれています。 まず、期待できるGPUの効果は、ページのレンダリングを加速してくれること。 アニメーションのフレームごとにピクセルを描くのではなく、ブラウザはDOMエレメントのスナップショットを撮って、それをGPUテクスチャ(レイヤ)として保存。後で、GPUにそのテクスチャを変換させ、DOMエレメントをアニメーションしているように見せることができる。 渋滞している高速道路ではス
※この物語はフィクションです。実在する人物・OS・プログラミング言語・端末・企業・団体名等とは一切関係がありませんのでご注意下さい ■登場人物紹介 ケイス淀橋 コンピュータウィルスに感染し、ネットのアチラ側からこちら側にでられなくなってしまった電脳空間カウボーイ。 シン石丸 電脳空間カウボーイズのリーダー。ケイスともケイスの兄とも昵懇の仲 エヌ教授 実際には何を研究しているのかよくわからないがコンピュータに詳しい教授 ■ニュース多すぎなディープラーニング業界 NVIDIAがDigitsの新しいバージョンを発表したよー おお、何ができるようになったの? とりあえず今回の目玉はマルチGPU対応みたいだね ちょっと待て、今までマルチGPUに対応していなかったのか? そうみたいだね。 NVIDIA、4GPU搭載マシンとか売ってたのに!? 120万円もする ああ。あれを買った人は全く意味ナシだったわ
2024-08-19 MenuBar 2024-08-05 Supercomputing Contest News News/sc240731 2024-07-31 SupercomputingContest2024 2024-07-03 News/sc240703 SupercomputingContest2024/予選結果 2024-06-26 News/sc240626 2024-06-20 SupercomputingContest2024/予選・認定問題Q&A 2024-06-05 News/sc240605 News/sc240605-2 2023-09-13 SupercomputingContest2023 2023-09-06 News/sc230906 2023-09-01 News/sc230830 2023-08-28 News/sc230828 Supercomp
慶應義塾大学教授で工学博士の中村維男氏。IEEEのフェローを務めるほか、英ロンドン大学インペリアル校教授兼フェロー、米スタンフォード大学客員教授、東北大学名誉教授などを兼任する。HPC Open Forumで新たに立ち上がったGPUコンピューティング分科会長に就任 「GPUは、CPUに比べると、ちょっと知能は落ちる。しかし、いったん走り出せばイノシシのように50倍ぐらいの速さで走る」。並列処理コンピューティングの第1人者として知られる中村維男教授はGPU(グラフィックス・プロセッシング・ユニット)の特性をそう説明する。GPUは条件分岐が入る処理などは苦手だが、単純な計算処理の並列化では大きな力を発揮する。 こうしたGPUの特性から、これまでベクトル型の並列コンピュータやCPUのクラスタ構成で実現してきたHPC(ハイパフォーマンスコンピュータ)、いわゆるスパコンで、GPU(グラフィックス・プ
Appleがついに「iPhone 4S」を正式発表しました。 Apple - Apple Events - Apple Special Event October 2011 iPad 2に採用されたデュアルコアCPU「A5」を搭載し、GPUもデュアルコアに。iPhone 4と比較して最大7倍速いモデルとなっています。 バッテリーに関しては3Gでの通話時間は8時間、2Gであれば14時間、3Gでのブラウジングなら6時間、無線LANを使ったブラウジングなら9時間、ビデオ再生だけなら10時間、音楽再生だけなら40時間となっています。 従来モデル(上り最大5.8Mbps、下り最大7.2Mbps)の2倍となる下り最大14.4Mbpsに対応 カメラは800万画素カメラに。 し、裏面照射型CMOSを採用したiPhone 4よりも73%明るく、撮影時間を3分の1に。 30%の省サイズ化を実現したf2.4の広
GPUを用いた並列演算に利用されるプログラミング言語といえば、機械学習の研究などに利用されるPythonが一般的ですが、JavaScriptによるウェブアプリでもGPUを用いたい場合があるはず。オープンソースのJavaScriptライブラリ「GPU.js」を使うと、スクリプトを実行するコンピューターのGPUを利用して並列処理を行うことで、多次元の演算などを高速に行うことができます。 GPU.js - GPU accelerated JavaScript https://gpu.rocks 今回GPU.jsを動かすシステムは以下。CPUはIntel Core i5-4570、GPUはAMD Radeon RX480、OSはUbuntu 20.04、ウィンドウシステムはWaylandを使用しています。 カーネルバージョンは5.4.0-42 ロードしているドライバーはこんな感じ。Linuxに標準
西川善司の3DGE:新世代GPU「Turing」のリアルタイムレイトレーシングは「本物」なのか? その正体に迫る ライター:西川善司 既報のとおり,北米時間2018年8月13日,NVIDIAは,カナダ・バンクーバーで行われているコンピュータグラフィックスとインタラクティブ技術の学会であるSIGGRAPH 2018に合わせ,新世代GPUコア「Turing」(テューリング)と,Turing世代初にして「史上初のレイトレーシングGPU」という位置づけのQuadro RTXを発表した。 Quadro RTXグラフィックスカード 本稿執筆時点で,Turingのアーキテクチャ面に関する詳細は明らかになっていない。つまり,NVIDIAのイベントで明らかになった以上の情報はないわけだが,それでも「Turing世代で何ができるようになるのか」はやはり気になるところだ。 今回は,現時点における公開情報を基に,
IoT向けの安価な小型コンピュータとして注目を集める「Raspberry Pi(ラズパイ)」の全シリーズに、GPUが標準搭載されていることをご存じだろうか。 元は教育用途として始まった同デバイスだが、ユーザーが3次元グラフィックスに触れられるよう、米Broadcom社製のメインチップにGPUコア「VideoCore」が搭載されているのである。 IoTやAI技術を手掛ける日本のベンチャー、Idein(イデイン)は、このラズパイ1~3のGPUをディープラーニング(深層学習)推論のアクセラレータとして使えるようにしたことで知られる1)。このラズパイのGPUは米NVIDIA社のGPGPUと異なり、グラフィックス以外の汎用演算を行うための開発環境やツールがチップ開発元から提供されている訳ではない。 本誌が2019年3月号で解説したように、Ideinは当時、公開されている命令セットアーキテクチャ(IS
「ストリートファイターV」は、今やモバイルPCのCPU内蔵GPUでプレイできるようになってしまった:ゲームプレイと実況配信ライブにも挑戦(1/5 ページ) 2020年3月から始まった「ストリートファイターV(以下、スト5)が快適にプレイできる自作PCをなるべくコスト安で作る」(以下、5万円台スト5PC)という企画だが、コロナ禍と半導体不足、そして仮想通貨マイニングの過熱でGPUの価格が高騰したことにより、5万円台でゲームが快適にプレイできるPCの自作はかなり困難になってしまった。 安さだけを追求するのは、昨今の円安問題もあったりして、なかなか取り組みが難しくなってきた。そこで、今回は、がらりと趣を変えて、「小さなノートPCでスト5がプレイできるのか」を探求することにした。 しかも、CPU内蔵GPUでスト5がプレイできるのかを検証する! あえてCPU内蔵GPUでどれだけスト5を楽しめるのかを
【西川善司】Wii UのGPU性能と新型コントローラに秘められた「コアゲーマー求心」の裏戦略 ライター:西川善司 西川善司 / グラフィックス技術と大画面とMAZDA RX-7を愛するジャーナリスト (善)後不覚blog:http://www.z-z-z.jp/blog/ Wii U Wii Uの専用コントローラ。いまのところ正式名称はなし E3 2011は,久々に新ハードの登場に沸いた開催となりました。 「人生」「生活」を変える可能性を秘めた携帯ゲーム機ということで,「NGP」が,ラテン語で「Life」に相当する言葉「Vita」を冠する「PlayStation Vita」になったというのは,4Gamer読者ならもうご存じでしょう。 そして,もう1つの主役が任天堂の「Wii U」です。噂や,まことしやかなリーク情報は事前にあったものの,スペックやコンセプトが公開されるのは今回が初めてでした
この記事は GPGPU Advent Calender の二日目の記事です。 二日目の内容がコレかよ!というみなさんのつっこみが本編です。以下の内容はオマケとなります。 http://pcl.intel-research.net/publications/isca319-lee.pdf 時は2010年…くーだ使えば100倍とか1000倍とか速くなるんでしょ?なんでCPUそんな遅いの?などと、世界中でボロクソに言われたIntelは、ついにブチ切れて、「お前らは全員間違ってる!俺がその間違いを正してやる!」という内容の論文をISCAに投稿するのだった… という事情だったのかどうかは知らないですが、内容としては、↓このグラフが全てを物語っていて、 「GPUだと100倍速いとか言うけど、あれはCPUのコードを最適化してないからで、CPUも最適化すれば、平均たったの2.5倍しか速くならない」、という
KubernetesでGPUを使う 一般的なWebアプリケーションと比較してMachine Leaning(ML)は複雑なインフラを要求する.Data processingを行う環境やModelのTraining/Validationを行う環境,実際にサービスからModelを利用するためのServingの環境といった複数の異なる環境が必要であり,WorkloadによってはCPUだけではなくGPUも必要になる.これらを効率的に扱うためのインフラを構築・運用するのは容易でなくGoogle and Uber’s Best Practices for Deep Learningにあるようにこれまで培われてきたDevOpsの知見を結集していく必要がある. このような複雑なMLのインフラとしてContainerとKubernetesが利用されることが多くなってきている.特に複数の環境間のPortabi
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く