[B! cpu] uokadaのブックマーク

ARMの歴史、その2: すべてがまとまり始める

ars technicaより。 12人の従業員と夢から始まった会社は、今や10億ドル規模の会社になりました。 BY ジェレミー・ライマー 1989年5月に発売されたAcorn Archimedes 3000 ここまでの話: 1980年代の終わり、Acorn Computersは岐路に立たされていました。ソフィ・ウィルソンとスティーブ・ファーバーが率いる小さなチームが、強力な新しいコンピュータ・チップ「Acorn RISC Machine(ARM)」を発明しました。Acornは、このARMチップを使った新しいコンピュータ「アルキメデス」を発売しました。しかし、世界はこの会社のドアへの道を叩いていませんでした。当初から、この驚くべきテクノロジーに関心を持つ人はなかなかいませんでした。最初のARMチップが出荷されてから数か月後、Acorn Computersのスティーブ・ファーバーは、技術系の

uokada 2022/11/28

arm
cpu

リンク

時代を塗り替えるAMD EPYCサーバー、その実力と「経済性」を知る

「AMD EPYC（エピック）サーバー・プロセッサー」シリーズがいま、x86サーバー市場で大きな注目を集めている。特に、昨年8月に発表された“第2世代”のEPYCプロセッサー（EPYC 7002シリーズ）では、アーキテクチャの刷新で最大64コアを搭載し、処理性能が「前世代製品の2倍」と大幅に向上。次々にベンチマーク記録を塗り替え、競合する他社プロセッサーとの性能差をさらに広げている。 “1ソケットサーバーで2ソケット相当の能力”を実現するEPYCプロセッサー搭載サーバーは、すでに世界中のメガクラウドやサーバーホスティング、インターネットサービス、スパコン／HPCなどの世界で採用が進んでいる。さらに今年（2020年）4月には、エンタープライズワークロードに適した新モデルも追加投入し、いよいよエンタープライズサーバー市場にも本格進出しようとしている。今回は、AMD EPYCプロセッサーの“圧

uokada 2021/08/22

cpu

リンク

ARMとx86/x64 (Intel, AMD) のCPU、アーキテクチャの違い、シェア、性能比較、アーキテクチャ、エンディアン

それぞれの読み方ですが ARMは、「あーむ」と読みます。 x86は、「エックスはちろく」または、「ペケはちろく」と読みます。 x64は、「エックスろくよん」または、「ペケろくよん」と読みます。それでは詳しく違いを見てみましょう。 ARM (アーム) アーキテクチャー ARMは一般的にはよく知られていませんが、1990年創業のイギリスのケンブリッジに本社を置く会社です。 ARM社は、ARMアーキテクチャーに基づくRISCプロセッサを開発する会社です。 RISC(Reduced Instruction Set Computer) とは、コンピュータの命令セットアーキテクチャ(ISA)の設計手法の一つで、命令の種類を減らし、回路を単純化して演算速度の向上を図るものです。 RISCが提唱されたときに、従来の設計手法に基づくアーキテクチャは対義語としてCISC(Complex Instructio

uokada 2021/05/24

リンク

CPUのアーキテクチャの違いまとめ（x86/x64/x86_64/AMD64/i386/i686とはなんなのか？） - フラミナル

CPUのx86/x64/x86_64/AMD64/i386/i686とはなんなのか？についてわかりやすくまとめますまとめ実際の定義はこちら一般的な理解はこちらビット数の違い（32bit、64bit）とは CPUのざっくり歴史（32bit〜） x86とはなんでx32じゃなくてx86っていう名前なの？ x64とはそのほか i386とは i686とは IA-32とは IA-64、Intel 64の違いまとめ出てきた単語をざっくり分類 bit数アーキテクチャ 32bit x86、i386、i686、IA-32 64bit x64、x86_64、x86-64、AMD64、IA-64、Intel 64 実際の定義はこちら一般的な理解はこちら ※厳密にはPentiumやCeleronも型番によって違うなどありますが、大雑把にはこんな感じです。 ※一般的な理解としてはx86=32bit

uokada 2021/02/10

cpu

リンク

Amazon's Arm-based Graviton2 Against AMD and Intel: Comparing Cloud Compute

Comparing the Graviton2 m6g instances against the AMD m5a and Intel m5n instances, we’re seeing a few differences in the hardware capabilities that power the VMs. Again, the most notorious difference is the fact that the Graviton2 comes with physical core counts matching the deployed vCPU number, whilst the competition counts SMT logical cores as vCPUs as well. Other aspects when talking about hig

uokada 2021/02/09

arm
cpu

リンク

なぜもっとたくさんのコアを搭載したCPUを作らないのでしょうか？2000コアのGPUなんかそこら辺にありますが、なぜCPUでは同じようにできないのでしょうか？

回答 (9件中の1件目) 質問に間違いがありますね。 2000個のコアが入ったGPUなんかありません。企業の広報は違った(間違った)方法で計算して数字を大きく見せています。 Radion 6900XTの本当のコア数(DCU)は、5120個ではなく、40個です。こちらでダイの写真を確認でき、4*5のコアが2グループあります。各コア(DCU)には32レーンのSIMDユニットが4つあり、各コアには並列に動作する32 bitの浮動小数点演算ユニット(FMA)が128個あり、チップ全体としては32 bitのFMAが5120個同時に動きます。 Zen2とZen3のCPUコアはどちらも256...

uokada 2021/02/07

リンク

CPU律速なRuby/Pythonコードはデフォルト設定のdocker上で遅くなる - まめめも

English version 要約 dockerはデフォルトでセキュリティ機構（Spectre脆弱性の対策）を有効にします。この影響で、RubyやPythonのようなインタプリタは速度が劣化します。特にCPU律速なプログラムで顕著に遅くなります（実行時間が倍くらいになることがあります）。現象 Rubyで1億回ループするコードを、直接ホスト上で実行する場合と、docker上で実行する場合で実行時間を比較してみます。直接ホスト上で実行した場合： $ ruby -ve 't = Time.now; i=0;while i<100_000_000;i+=1;end; puts "#{ Time.now - t } sec"' ruby 2.7.1p83 (2020-03-31 revision a0c7c23c9c) [x86_64-linux] 1.321703922 sec docker

uokada 2020/05/23

リンク

Ampereがサーバ向けArmプロセッサを開発、Intelに挑戦

新興企業Ampere Computing（以下、Ampere）は、Armベースの80コアプロセッサ「Altra」の出荷を開始したと発表した。“クラウドネイティブ”のプロセッサとして位置付けられる製品だ。このAltraは、通常クラウドで対応する作業負荷を処理することができ、一般的なCPUと比べて消費電力量が大幅に少ないという。つまりAltraは、一般的なx86ベースのプロセッサよりも消費電力が少ないということだ。Intelのデータセンターサーバ向けプロセッサは、力強さと柔軟性を兼ね備えるというその特性により、データセンターサーバ市場において完全な優位性を確立してきた。さまざまなプロセッサメーカーがこれまで、データセンターサーバ市場におけるIntelの完全な支配を打ち破るべく挑戦してきたが、その多くはやはりArmベースのソリューションを採用している。Ampereも、これらのメーカーの中の1

uokada 2020/05/23

cpu
arm

リンク

Flame Graphs

Recent posts: 28 Apr 2023 » eBPF Observability Tools Are Not Security Tools 01 Mar 2023 » USENIX SREcon APAC 2022: Computing Performance: What's on the Horizon 17 Feb 2023 » USENIX SREcon APAC 2023: CFP 02 May 2022 » Brendan@Intel.com 15 Apr 2022 » Netflix End of Series 1 09 Apr 2022 » TensorFlow Library Performance 19 Mar 2022 » Why Don't You Use ... 26 Sep 2021 » The Speed of Time 06 Sep 2021 »

uokada 2019/03/01

リンク

CPU / メモリ / ディスクに負荷をかける stress コマンド - kakakakakku blog

最近 stress コマンドを使って，サーバに負荷をかける方法を紹介する機会があり，よく使っているのに今までブログに書いていなかったなと気付き，今回まとめることにした．CPU に負荷をかけるだけなら yes > /dev/null をコア数に合わせて並列実行すれば良いけど，stress コマンドならメモリとディスクにも負荷をかけることができるので，シナリオのバリエーションを増やすことができる． stress project page インストール検証環境として CentOS を使った． $ sudo yum install stress $ stress --version stress 1.0.4 共通オプション以下のような共通オプションが用意されている．よく使うのは --timeout で，秒数を指定して負荷をかけることができる．他はあまり使ったことがないかも． -t, --tim

uokada 2018/10/22

リンク

【 pidstat 】コマンド――プロセスのリソース使用量を表示する

Linux基本コマンドTips一覧本連載は、Linuxのコマンドについて、基本書式からオプション、具体的な実行例までを紹介してきます。今回は、プロセスごとCPUの使用率やI/Oデバイスの使用状況を表示する「pidstat」コマンドです。 pidstatコマンドとは？「pidstat」はプロセスごとのCPUの使用率やI/Oデバイスの使用状況を表示するコマンドです。 pidstatはmpstatコマンド（第127回）やiostatコマンド（第128回）と同じsysstatパッケージに収録されています。いずれも、主に/var/log/sysstatを参照するコマンド群です。 sysstatパッケージがインストールされていない場合、「sudo yum install sysstat」あるいは「sudo apt-get install sysstat」などでインストールできます ※。

uokada 2018/07/24

yum
cpu

リンク

Javaアプリが暴走してCPUの負荷があがった時にやったこと - kitaru's diary

検証用APサーバ(Tomcat)のロードアベレージが上がりっぱなしになって一向に下がらない状態に陥ったのでその時にやったこと。ざっくりの流れ CPUに負荷かけてるプロセスの確認スレッドダンプの採取 CPUに負荷かけてるスレッドの特定スタックトレース読んで分析する top コマンドで問題のプロセス特定 ↓↓こんな感じだった↓↓明らかにJavaのWebアプリが原因(常に85%以上CPU 食ってる状態) $ top top - 18:27:24 up 285 days, 3:05, 3 users, load average: 5.33, 5.36, 4.93 Tasks: 70 total, 1 running, 69 sleeping, 0 stopped, 0 zombie Cpu(s): 10.1%us, 0.9%sy, 0.0%ni, 0.0%id, 0.0%wa, 0.0%hi,

uokada 2017/06/26

リンク

みずほ情報総研： GPUコンピューティングと並列計算

今、GPUがホットである。1チップで1TFlopsを超える性能は驚異的であり、HPCに限らず広く注目を集めるのも肯ける。しかし、GPUを使いこなすためには並列計算に関するより深い理解が求められる。 GPUコンピューティングと並列計算(PDF/527KB) “フリーランチは終わった。”これはGeForceの父と呼ばれるデヴィッド・カーク博士の言葉である。コンピューターの性能向上は常に日進月歩という枕詞が冠せられてきたが、ここ数年その中身が大きく変ってきた。従来は半導体の微細化→CPUの高クロック化という流れで演算速度が向上してきたが、リーク電流の増大に伴いクロックの向上は頭打ちになってきた（図表1）。一方、微細化はいまだムーアの法則に従って順調に進んでおり、CPUベンダーは性能向上の手段を高クロック化からマルチコア／メニーコア化による並列計算へと大きく舵を切った。先のカーク博士の言葉は、これ

uokada 2012/11/12

リンク

イマドキなNetwork/IO

The document discusses techniques for improving network and I/O performance between the network interface card (NIC) and CPU. It describes techno logies like TCP offloading, receive side scaling, and Intel I/O acceleration features that distribute processing load away from the CPU to improve throughput and reduce latency. Optimization goals include more efficiently handling interrupts and direct me

uokada 2012/11/06

リンク

CPU とキャッシュのはなし - graphics.hatenablog.com

別にグラフィックスに限ったことじゃないし、そもそも論文とか全然関係ないけど。GPU 周りでもたまに話題になるし、自分でもたまにわけわからんくなるから整理しとく。メインメモリは遅い CPU からメインメモリにデータを読みに行く場合、これはとにかく遅い。例えばレジスタにあるデータを読みに行く場合と比べると、だいたい数倍から数100倍の遅さ。ヤバいからなんとかしよう。もっと早くアクセスできる場所にデータおいとこう。キャッシュライン CPU がメインメモリからデータを読み出すとき、必ず小さなメモリチャンクをキャッシュ上にロードする。ロード単位はプロセッサによるけど、だいたい 8 ～ 512 バイト。このロード単位をキャッシュラインと呼ぶ。アクセス対象のデータが既にキャッシュに載ってる場合は、メインメモリじゃなくてキャッシュを読みに行く。ない場合はメインメモリにアクセスするけど、そのデータはも

uokada 2012/05/13

リンク

はてなブックマーク

タグ

関連タグで絞り込む (19)

cpuに関するuokadaのブックマーク (15)

お知らせ

月間はてなブックマーク数ランキング（2024年9月）

今週のはてなブックマーク数ランキング（2024年9月第5週）

今週のはてなブックマーク数ランキング（2024年9月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス