タグ

cpuに関するuokadaのブックマーク (15)

  • ARMの歴史、その2: すべてがまとまり始める

    ars technicaより。 12人の従業員と夢から始まった会社は、今や10億ドル規模の会社になりました。 BY ジェレミー・ライマー 1989年5月に発売されたAcorn Archimedes 3000 ここまでの話: 1980年代の終わり、Acorn Computersは岐路に立たされていました。ソフィ・ウィルソンとスティーブ・ファーバーが率いる小さなチームが、強力な新しいコンピュータ・チップ「Acorn RISC Machine(ARM)」を発明しました。Acornは、このARMチップを使った新しいコンピュータ「アルキメデス」を発売しました。しかし、世界はこの会社のドアへの道を叩いていませんでした。 当初から、この驚くべきテクノロジーに関心を持つ人はなかなかいませんでした。最初のARMチップが出荷されてから数か月後、Acorn Computersのスティーブ・ファーバーは、技術系の

    ARMの歴史、その2: すべてがまとまり始める
    uokada
    uokada 2022/11/28
  • 時代を塗り替えるAMD EPYCサーバー、その実力と「経済性」を知る

    AMD EPYC(エピック)サーバー・プロセッサー」シリーズがいま、x86サーバー市場で大きな注目を集めている。特に、昨年8月に発表された“第2世代”のEPYCプロセッサー(EPYC 7002シリーズ)では、アーキテクチャの刷新で最大64コアを搭載し、処理性能が「前世代製品の2倍」と大幅に向上。次々にベンチマーク記録を塗り替え、競合する他社プロセッサーとの性能差をさらに広げている。 “1ソケットサーバーで2ソケット相当の能力”を実現するEPYCプロセッサー搭載サーバーは、すでに世界中のメガクラウドやサーバーホスティング、インターネットサービス、スパコン/HPCなどの世界で採用が進んでいる。さらに今年(2020年)4月には、エンタープライズワークロードに適した新モデルも追加投入し、いよいよエンタープライズサーバー市場にも格進出しようとしている。 今回は、AMD EPYCプロセッサーの“圧

    時代を塗り替えるAMD EPYCサーバー、その実力と「経済性」を知る
    uokada
    uokada 2021/08/22
  • ARMとx86/x64 (Intel, AMD) のCPU、アーキテクチャの違い、シェア、性能比較、アーキテクチャ、エンディアン

    それぞれの読み方ですが ARMは、「あーむ」と読みます。 x86は、「エックスはちろく」または、「ペケはちろく」と読みます。 x64は、「エックスろくよん」または、「ペケろくよん」と読みます。 それでは詳しく違いを見てみましょう。 ARM (アーム) アーキテクチャー ARMは一般的にはよく知られていませんが、1990年創業のイギリスのケンブリッジに社を置く会社です。 ARM社は、ARMアーキテクチャーに基づくRISCプロセッサを開発する会社です。 RISC(Reduced Instruction Set Computer) とは、コンピュータの命令セットアーキテクチャ(ISA)の設計手法の一つで、命令の種類を減らし、回路を単純化して演算速度の向上を図るものです。 RISCが提唱されたときに、従来の設計手法に基づくアーキテクチャは対義語としてCISC(Complex Instructio

    ARMとx86/x64 (Intel, AMD) のCPU、アーキテクチャの違い、シェア、性能比較、アーキテクチャ、エンディアン
  • CPUのアーキテクチャの違いまとめ(x86/x64/x86_64/AMD64/i386/i686とはなんなのか?) - フラミナル

    CPUのx86/x64/x86_64/AMD64/i386/i686とはなんなのか?についてわかりやすくまとめます まとめ 実際の定義はこちら 一般的な理解はこちら ビット数の違い(32bit、64bit)とは CPUのざっくり歴史(32bit〜) x86とは なんでx32じゃなくてx86っていう名前なの? x64とは そのほか i386とは i686とは IA-32とは IA-64、Intel 64の違い まとめ 出てきた単語をざっくり分類 bit数 アーキテクチャ 32bit x86、i386、i686、IA-32 64bit x64、x86_64、x86-64、AMD64、IA-64、Intel 64 実際の定義はこちら 一般的な理解はこちら ※厳密にはPentiumやCeleronも型番によって違うなどありますが、大雑把にはこんな感じです。 ※一般的な理解としてはx86=32bit

    CPUのアーキテクチャの違いまとめ(x86/x64/x86_64/AMD64/i386/i686とはなんなのか?) - フラミナル
    uokada
    uokada 2021/02/10
  • Amazon's Arm-based Graviton2 Against AMD and Intel: Comparing Cloud Compute

    Comparing the Graviton2 m6g instances against the AMD m5a and Intel m5n instances, we’re seeing a few differences in the hardware capabilities that power the VMs. Again, the most notorious difference is the fact that the Graviton2 comes with physical core counts matching the deployed vCPU number, whilst the competition counts SMT logical cores as vCPUs as well. Other aspects when talking about hig

    Amazon's Arm-based Graviton2 Against AMD and Intel: Comparing Cloud Compute
    uokada
    uokada 2021/02/09
  • なぜもっとたくさんのコアを搭載したCPUを作らないのでしょうか?2000コアのGPUなんかそこら辺にありますが、なぜCPUでは同じようにできないのでしょうか?

    回答 (9件中の1件目) 質問に間違いがありますね。 2000個のコアが入ったGPUなんかありません。企業の広報は違った(間違った)方法で計算して数字を大きく見せています。 Radion 6900XTの当のコア数(DCU)は、5120個ではなく、40個です。こちらでダイの写真を確認でき、4*5のコアが2グループあります。 各コア(DCU)には32レーンのSIMDユニットが4つあり、各コアには並列に動作する32 bitの浮動小数点演算ユニット(FMA)が128個あり、チップ全体としては32 bitのFMAが5120個同時に動きます。 Zen2とZen3のCPUコアはどちらも256...

    なぜもっとたくさんのコアを搭載したCPUを作らないのでしょうか?2000コアのGPUなんかそこら辺にありますが、なぜCPUでは同じようにできないのでしょうか?
  • CPU律速なRuby/Pythonコードはデフォルト設定のdocker上で遅くなる - まめめも

    English version 要約 dockerはデフォルトでセキュリティ機構(Spectre脆弱性の対策)を有効にします。この影響で、RubyPythonのようなインタプリタは速度が劣化します。特にCPU律速なプログラムで顕著に遅くなります(実行時間が倍くらいになることがあります)。 現象 Rubyで1億回ループするコードを、直接ホスト上で実行する場合と、docker上で実行する場合で実行時間を比較してみます。 直接ホスト上で実行した場合: $ ruby -ve 't = Time.now; i=0;while i<100_000_000;i+=1;end; puts "#{ Time.now - t } sec"' ruby 2.7.1p83 (2020-03-31 revision a0c7c23c9c) [x86_64-linux] 1.321703922 sec docker

    CPU律速なRuby/Pythonコードはデフォルト設定のdocker上で遅くなる - まめめも
  • Ampereがサーバ向けArmプロセッサを開発、Intelに挑戦

    新興企業Ampere Computing(以下、Ampere)は、Armベースの80コアプロセッサ「Altra」の出荷を開始したと発表した。“クラウドネイティブ”のプロセッサとして位置付けられる製品だ。このAltraは、通常クラウドで対応する作業負荷を処理することができ、一般的なCPUと比べて消費電力量が大幅に少ないという。 つまりAltraは、一般的なx86ベースのプロセッサよりも消費電力が少ないということだ。Intelのデータセンターサーバ向けプロセッサは、力強さと柔軟性を兼ね備えるというその特性により、データセンターサーバ市場において完全な優位性を確立してきた。 さまざまなプロセッサメーカーがこれまで、データセンターサーバ市場におけるIntelの完全な支配を打ち破るべく挑戦してきたが、その多くはやはりArmベースのソリューションを採用している。Ampereも、これらのメーカーの中の1

    Ampereがサーバ向けArmプロセッサを開発、Intelに挑戦
    uokada
    uokada 2020/05/23
  • Flame Graphs

    Recent posts: 28 Apr 2023 » eBPF Observability Tools Are Not Security Tools 01 Mar 2023 » USENIX SREcon APAC 2022: Computing Performance: What's on the Horizon 17 Feb 2023 » USENIX SREcon APAC 2023: CFP 02 May 2022 » Brendan@Intel.com 15 Apr 2022 » Netflix End of Series 1 09 Apr 2022 » TensorFlow Library Performance 19 Mar 2022 » Why Don't You Use ... 26 Sep 2021 » The Speed of Time 06 Sep 2021 »

  • CPU / メモリ / ディスクに負荷をかける stress コマンド - kakakakakku blog

    最近 stress コマンドを使って,サーバに負荷をかける方法を紹介する機会があり,よく使っているのに今までブログに書いていなかったなと気付き,今回まとめることにした.CPU に負荷をかけるだけなら yes > /dev/null をコア数に合わせて並列実行すれば良いけど,stress コマンドならメモリとディスクにも負荷をかけることができるので,シナリオのバリエーションを増やすことができる. stress project page インストール 検証環境として CentOS を使った. $ sudo yum install stress $ stress --version stress 1.0.4 共通オプション 以下のような共通オプションが用意されている.よく使うのは --timeout で,秒数を指定して負荷をかけることができる.他はあまり使ったことがないかも. -t, --tim

    CPU / メモリ / ディスクに負荷をかける stress コマンド - kakakakakku blog
  • 【 pidstat 】コマンド――プロセスのリソース使用量を表示する

    LinuxコマンドTips一覧 連載は、Linuxのコマンドについて、基書式からオプション、具体的な実行例までを紹介してきます。今回は、プロセスごとCPUの使用率やI/Oデバイスの使用状況を表示する「pidstat」コマンドです。 pidstatコマンドとは? 「pidstat」はプロセスごとのCPUの使用率やI/Oデバイスの使用状況を表示するコマンドです。 pidstatはmpstatコマンド(第127回)やiostatコマンド(第128回)と同じsysstatパッケージに収録されています。いずれも、主に/var/log/sysstatを参照するコマンド群です。 sysstatパッケージがインストールされていない場合、「sudo yum install sysstat」あるいは「sudo apt-get install sysstat」などでインストールできます ※。

    【 pidstat 】コマンド――プロセスのリソース使用量を表示する
    uokada
    uokada 2018/07/24
  • Javaアプリが暴走してCPUの負荷があがった時にやったこと - kitaru's diary

    検証用APサーバ(Tomcat)のロードアベレージが上がりっぱなしになって一向に下がらない状態に陥ったのでその時にやったこと。 ざっくりの流れ CPUに負荷かけてるプロセスの確認 スレッドダンプの採取 CPUに負荷かけてるスレッドの特定 スタックトレース読んで分析する top コマンドで問題のプロセス特定 ↓↓こんな感じだった↓↓明らかにJavaのWebアプリが原因(常に85%以上CPUってる状態) $ top top - 18:27:24 up 285 days, 3:05, 3 users, load average: 5.33, 5.36, 4.93 Tasks: 70 total, 1 running, 69 sleeping, 0 stopped, 0 zombie Cpu(s): 10.1%us, 0.9%sy, 0.0%ni, 0.0%id, 0.0%wa, 0.0%hi,

    Javaアプリが暴走してCPUの負荷があがった時にやったこと - kitaru's diary
  • みずほ情報総研 : GPUコンピューティングと並列計算

    今、GPUがホットである。1チップで1TFlopsを超える性能は驚異的であり、HPCに限らず広く注目を集めるのも肯ける。しかし、GPUを使いこなすためには並列計算に関するより深い理解が求められる。 GPUコンピューティングと並列計算(PDF/527KB) “フリーランチは終わった。”これはGeForceの父と呼ばれるデヴィッド・カーク博士の言葉である。コンピューターの性能向上は常に日進月歩という枕詞が冠せられてきたが、ここ数年その中身が大きく変ってきた。従来は半導体の微細化→CPUの高クロック化という流れで演算速度が向上してきたが、リーク電流の増大に伴いクロックの向上は頭打ちになってきた(図表1)。一方、微細化はいまだムーアの法則に従って順調に進んでおり、CPUベンダーは性能向上の手段を高クロック化からマルチコア/メニーコア化による並列計算へと大きく舵を切った。先のカーク博士の言葉は、これ

  • イマドキなNetwork/IO

    The 7 Deadly Sins of Packet Processing - Venky Venkatesan and Bruce Richardsonharryvanhaaren

    イマドキなNetwork/IO
  • CPU とキャッシュのはなし - graphics.hatenablog.com

    別にグラフィックスに限ったことじゃないし、そもそも論文とか全然関係ないけど。GPU 周りでもたまに話題になるし、自分でもたまにわけわからんくなるから整理しとく。 メインメモリは遅い CPU からメインメモリにデータを読みに行く場合、これはとにかく遅い。例えばレジスタにあるデータを読みに行く場合と比べると、だいたい数倍から数100倍の遅さ。ヤバいからなんとかしよう。もっと早くアクセスできる場所にデータおいとこう。 キャッシュライン CPU がメインメモリからデータを読み出すとき、必ず小さなメモリチャンクをキャッシュ上にロードする。ロード単位はプロセッサによるけど、だいたい 8 ~ 512 バイト。このロード単位をキャッシュラインと呼ぶ。 アクセス対象のデータが既にキャッシュに載ってる場合は、メインメモリじゃなくてキャッシュを読みに行く。ない場合はメインメモリにアクセスするけど、そのデータはも

    CPU とキャッシュのはなし - graphics.hatenablog.com
  • 1