タグ

cpuに関するmurasukeのブックマーク (71)

  • ARMの歴史、その1: 最初のチップを作る

    ars technicaより。 1983年、エイコーン・コンピュータはCPUを必要としていました。そこで10人でCPUを作りました。 BY ジェレミー・ライマー それは1983年のことで、エイコーン・コンピュータは世界の頂点にありました。しかし、残念ながら、問題はすぐそこまで来ていました。 このイギリスの小さな会社は、イギリス放送協会(BBC)から全国ネットのテレビ番組用のコンピュータを製造する契約を受注したことで有名でした。同社のBBC Microの販売は急増し、120万台を超える勢いでした。 BBC Microの雑誌広告。キャッチフレーズは「The Shape of Things to Come (これからの形はこうだ)」でした。 しかし、パソコンの世界は変わりつつありました。親が子供の宿題を手伝うために買うような、安価な8ビットのマイクロプロセッサの市場は飽和状態になりつつありました

    ARMの歴史、その1: 最初のチップを作る
  • 私とOSSの25年

    2. • 自己紹介 • 会社紹介 • 普段の生活 • プログラミング歴(昔話) • 午後のこ~だ • 数学から暗号へ • 楕円曲線とペアリング • 関わっているプロジェクト • Xbyak • Intel oneDNN • ブロックチェーン • スーパーコンピュータ富岳 目次 2 / 48 3. • サイボウズ・ラボで主に暗号と最適化関係のR&D • Twitter : @herumi • GitHub : https://github.com/herumi/ • 資料 : https://slideshare.net/herumi/ • 主な活動 • OSS(オープンソースソフトウェア)を介在した 様々なプロジェクトとのゆるやかなつながり 自己紹介 暗号研究 ブロックチェーン Intel oneDNN スーパーコンピュータ富岳 Xbyak 3 / 48

    私とOSSの25年
    murasuke
    murasuke 2021/05/17
  • VM環境のCPU仮想化はどうやって実現しているのか ハードウェア仮想化支援機構の仕組み

    Arm入門勉強会とは、macOSがArmに移行したこの機にArmアーキテクチャでのプログラミングについて入門するソフトウェアエンジニアのための会です。今回主催の@nullpo_head 氏が、Armの仮想化支援機構について、その仕組みから深く説明します。前半は「現代のハードウェア仮想化支援機構」について。全2回。 ハードウェア仮想化支援とは何か 佐伯 学哉氏:入門セッション3つ目は『Armの仮想化支援機構』についての入門セッションです。どうぞよろしくお願いします。 発表のスタートとゴールです。VMwareとかQemuとか使ったことあるけど仮想マシンの仕組みなんも知らんというところがまずスタートになっています。 1個目のゴールは、最近のVMのざっくりした仕組みとハードウェア仮想化支援とは何かということがわかること。そしてその話のあとに実際にArmの仮想化支援機構の概要を説明し、Armの仮想

    VM環境のCPU仮想化はどうやって実現しているのか ハードウェア仮想化支援機構の仕組み
  • 自分で、でっかいベアメタル(物理)サーバーを作りたい方へ - Qiita

    マンガワンのサーバー 実は過去にプレスリリースの下の方にしれっとスペックを書いたことがあります。 ベアメタルなサーバー大好きクラスタとかの人が話題にしてくれないかなーと思っていたのですが、 私が観測可能な反響は無でした。 もうこの記事の需要の無さが推測されるようではありますが、意図を解説しましょう。 Xeon Gold 6244というCPUはコア数が少なく、クロックが高く、 最近Apple M1で話題のシングルスレッドの能力が高いモデルです。 マンガワンのサーバーではCPUを4つ搭載することで、コア数の少なさをゴリ押しで解決しており、 会社のフラッグシッププロダクトらしい予算の潤沢さが伺いしれます。 また、マンガアプリなのでSSDは搭載量が多いのですが、Optaneの1.5TBを2搭載しており、 1を/tmpやアクセスログ、DBのトランザクション一時ファイルの置き場所に、 もう1をマ

    自分で、でっかいベアメタル(物理)サーバーを作りたい方へ - Qiita
  • 各種メモリ/ストレージのアクセス時間,所要クロックサイクル,転送速度,容量の目安 - Qiita

    各種メモリ/ストレージについて,2024年時点で標準的なアクセス時間,所要クロックサイクル,転送速度,容量を,各種カタログスペックを参考にまとめてみました. レジスタ(レジスタファイル) 最近のCPUのレジスタ(register)のアクセスは,通常CPUの1クロックサイクルで完了します.2024年時点では,標準的なCPUのクロック周波数は,1〜5GHz程度のオーダーです.1GHzは1秒あたり10億回,すなわち1クロックサイクルは1ナノ秒です. したがって,2024年時点では,レジスタには0.2〜1ナノ秒程度でアクセスできると言えます. レジスタのメモリ容量は,レジスタファイルに存在するレジスタ数に依存します,これは命令で明示的に指定できるレジスタ数という解釈もありますが,レジスタ・リネーミングのようなプロセッサ技術を用いると,実際にはより多くのレジスタ数を持っていると解釈することもできます

    各種メモリ/ストレージのアクセス時間,所要クロックサイクル,転送速度,容量の目安 - Qiita
    murasuke
    murasuke 2020/06/22
    DB絡むとPK指定の検索で、SSDより少し遅く、HDDよりかなり早いくらいになるかな?(データはキャッシュ済みの前提で)業務アプリだとDBから読むほうが圧倒的に多いが、キャッシュは意識しないので。
  • SIMD化とは何か / Basics of SIMD

    SIMD化の簡単な説明

    SIMD化とは何か / Basics of SIMD
  • モダンCPU命令のクロックサイクル数 - Qiita

    Infographics: Operation Costs in CPU Clock Cycles - IT Hare on Soft.ware http://ithare.com/infographics-operation-costs-in-cpu-clock-cycles/ より。 対象アーキテクチャはx86/x64。データは末尾のReferenceにある論文などから取ったのだろう。その中でも最高のリファレンスと言われている[Agner4]は293ページの巨大な一覧表だ。 http://www.agner.org/optimize/instruction_tables.pdf C++の例外のコストは大きい。昔の家庭用ゲームでは例外は使わないとされていたのもむべなるかな メモリの書き込みは完了する前に次の命令へ進めるから1クロックで済むというのは恥ずかしながら知らなかった コンテキスト

    モダンCPU命令のクロックサイクル数 - Qiita
    murasuke
    murasuke 2020/03/08
  • Infographics: Operation Costs in CPU Clock Cycles - IT Hare on Soft.ware

    Another way of approaching the same question is to say that “hey, I’m calling virtual function once per piece of code which is like 10000 cycles, so virtualisation won’t eat more than 1% of the program time” – but you still need some kind of way to see an order of magnitude for the related costs – and the diagram above will still come in handy 🙁 . Preliminaries aside, let’s take a closer look at

    Infographics: Operation Costs in CPU Clock Cycles - IT Hare on Soft.ware
    murasuke
    murasuke 2020/03/08
    例外処理が遅いことを改めて認識
  • 「infoを読め」と言われたら...

    このページは、「組込み向けプログラム開発では絶対必要なスキルなんだけど、誰に聞いても「info読めば」としか答えてくれないものを、多少まじめに答えてみる」という趣旨のものです。基的には組込み応用だけでなく、プログラマとして重要な項目なども含めていくつもりです。 注意 : いきなりこのページを読むと、調べる力が身につかなくなります。なぜ相手が「infoを読め」と言ったのかを考えてから読むようにするとよいでしょう。 アライメントとか、ワード境界とか 構造体のサイズが妙に大きいとか、変数の読み出しが妙に遅いとか、アクセスエラー例外が起こるとか セクションとか.textとか ROMから動かないとか、変数の初期値が消えるとか、プログラムローダが止まるとか 初期化してない変数とか.bssセクションとか 「初期化してない変数が利用されました」警告とか、Cランタイムとか スクラッチレジスタとか呼出規約と

    murasuke
    murasuke 2019/07/03
  • CPUの作り方 - 富士通

    シリコン(ケイ素)の大きな単結晶(純度99.999999999%)を、ダイヤモンドブレードでスライスして、薄いシリコンウェーハを作ります。

    murasuke
    murasuke 2018/11/05
  • 分岐予測の簡単な歴史 - Part 1 | POSTD

    ※これは、 RC(The Recurse Center:プログラマ教育施設) によって組織された講演シリーズである”localhost”を始動するために、Two Sigma(ツーシグマ)での2017年8月22日の分岐予測に関する講演の原稿を仮に書き起こしたものです。 コードで分岐を使われている方は、どれくらいいらっしゃいますか? ifステートメントやパターンマッチングを使われているという方、よろしければ手を挙げてください。 ほとんどの聴衆が手を挙げる 次の質問に関しては手を挙げてもらうつもりはありませんが、もしそうお願いした場合、恐らく手を挙げる人の数は少なくなるのではないでしょうか。その質問とは、「分岐を実行する際、CPUが何をして、そのパフォーマンスは何を意味しているのかを十分に理解しているか」、そして「分岐予測に関する最新の論文を理解できるか」というものです。 この講演の目的は、CP

    分岐予測の簡単な歴史 - Part 1 | POSTD
    murasuke
    murasuke 2018/09/27
  • SQLServer: CPU負荷をかけている機能を見つけ出す - Qiita

    --ORDER BY を変えればいろいろな順番でデータ取得できる SELECT TOP 1000 [Average CPU used] = total_worker_time / qs.execution_count ,[Total CPU used] = total_worker_time ,[Execution count] = qs.execution_count ,[Individual Query] = SUBSTRING (qt.text,qs.statement_start_offset/2, (CASE WHEN qs.statement_end_offset = -1 THEN LEN(CONVERT(NVARCHAR(MAX), qt.text)) * 2 ELSE qs.statement_end_offset END - qs.statement_start_off

    SQLServer: CPU負荷をかけている機能を見つけ出す - Qiita
  • opengl:vfpbenchlog [HYPERでんち]

    ARM11 700MHz ARM1176JZF-S Single core ARCH: ARMv6 FPU: VFPv2-D16 SingleT SP max: 0.674 GFLOPS SingleT DP max: 0.674 GFLOPS MultiT SP max: 0.674 GFLOPS MultiT DP max: 0.674 GFLOPS CPU core: 1 NEON: no FMA: no * VFP/NEON (single fp) VFP fmuls (32bit x1) n8 : 11.876 336.8 336.8 VFP fadds (32bit x1) n8 : 11.873 336.9 336.9 VFP fmacs (32bit x1) n8 : 11.874 673.7 673.7 VFP vfma.f32 (32bit x1) n8 : - - -

  • opengl:start [HYPERでんち]

    opengl:start 目次 OpenGL / Vulkan GPU/CPU GL API Low Level API (Low Overhead API) Benchmark Platform Tool 他 Link その他の開発情報 お問い合せその他 OpenGL / Vulkan 端末全リスト: 日で発売されたスマートフォン・タブレット全リスト2017/09/02 22:49OpenGL ES 2.0/3.2 関連のハードウエア、OpenGL バージョン一覧など2024/06/24 12:08SoC spec list2015/09/18 01:59CPU core list2018/06/08 21:57GPU core list2018/06/15 21:09memory 早見表2016/01/16 11:24SmartWatch スペック一覧2017/02/18 20:25

    murasuke
    murasuke 2016/04/25
  • opengl:cpufop [HYPERでんち]

    float 32bit Scalar (32bit) SIMD 2 (64bit) SIMD 4 (128bit) SIMD 8 (256bit) SIMD 16 (512bit) CPU/SoC CPU core FPU SIMD Width add mul mad/fma total add mul mad/fma total add mul mad/fma total add mul mad/fma total add mul mad/fma total

  • iPhone SE, Apple A9 の浮動小数点演算速度 | ホイール欲しい ハンドル欲しい

    ・SP=単精度, DP=倍精度, ST=SingleThread, MT=MultiThread Apple A9 は Core 単体の演算能力が非常に上がっていることがわかります。Core 単体の演算速度 SP-ST ですでに 41.9 GFLOPS に達し、Multi-Thread 時の SP-MT では 2 core の A9 が 3 core の A8X を上回っています。クロック差を考えると iPad Pro の A9X はおそらく 100 GFLOPS を超えるでしょう。 他の CPU との比較は下記の通り。Ivy Bridge i5 は Mac Book Pro Late2013 (Core i5-3210M) の結果です。

    murasuke
    murasuke 2016/04/25
  • Visual Studioでプロファイル(CPUサンプリング) - troushoo

    Visual Studio 2010でプロファイルを行う方法を記述します。今回はプロファイルの中のCPU サンプリングについて取り上げます。 CPU サンプリングを使用すると、どの関数が頻繁に実行されたかがわかり、どこにボトルネックがあるのかを簡単に調べることができます。 今回使用するC#サンプルアプリ CPUに負荷をかける関数(=UseCPU())を実行するのみの単純な関数です。 func1()はUseCPUを1回、func2()はUseCPUを2回実行します。 using System;using System.Collections.Generic;using System.Linq;using System.Text; namespace sampling{ class Program { static void UseCPU() //NumOfLoopはfor分のループ回数です。

    Visual Studioでプロファイル(CPUサンプリング) - troushoo
  • CPU

    CPU製造メーカー一覧 あいうえお順 AMD ARM Ltd Atmel Data General DEC - コンパックに買収され、コンパックも2002年にヒューレット・パッカードが買収 IBM VIA インテル サイリックス - VIAへ ザイログ サン・マイクロシステムズ ソニー・コンピュータエンタテインメント テキサス・インスツルメンツ 東芝 トランスメタ 日電気 (NEC) - 現在、半導体部門はNECエレクトロニクス 日立製作所 - 現在、半導体部門はルネサス テクノロジ ヒューレット・パッカード 富士通 モステクノロジー モトローラ - 現在では半導体部門がスピンオフしフリースケール・セミコンダクタに 三菱電機 - 現在、半導体部門はルネサス テクノロジ ミップス・テクノロジーズ ルネサス テクノロジ - 日立製作所と三菱電機の事業統合で設立 歴代CPU一覧

    CPU
    murasuke
    murasuke 2015/08/23
  • NOP 命令が作られた日(1960)【日記 2014/07/01】

    前: 「我々が考えるように」発表(1945)次: ダグラス・エンゲルバートの命日(2013) NOP 命令が作られた日(1960)  2014-07-01 12:16:50  コンピュータ 今日は何の日 今日は NOP 命令が初めて公式文章に記された日(1960)。 …当かどうかわかりませんが。 僕の調べではこれより古い NOP 命令の記述はありません。 2014.7.6 追記 もっと前の記述がある、という情報が寄せられました。情報提供ありがとうございます。 この記事の内容全てが誤りではありませんが、少なくとも「初めて公式文書に記された日」は誤りでした。 最初に NOP が登場したのは IBM 701。しかし、考え出したのは先に開発を始め、後で発売された IBM 702のようです。 IBM 702 では、明確な目的を持って NOP が作られています。 詳細は別記事にまとめてあります。 え

  • データ読み取りと CPU の利用について at SE の雑記

    最近のハードウェアはディスク性能が向上して、ディスク I/O がネックになることも少なくなってきたかと思います。 ディスクが高速になることで大量のデータを短時間で読み取れるようになりましたが、その分負荷が CPU に表れてくることになったかと。 簡単にではありますがこの辺のデータをとってみたいと思います。 今回は、50 万件データが格納されているテーブルを使用しています。 先ずはディスクの性能を無視したいので全てのデータをキャッシュにあげます。 今回は クラスター化インデックス 非クラスター化インデックス を設定しているテーブルですので、各インデックスでフルスキャンをさせて、メモリ上にデータを全てキャッシュさせています。 その後、プランキャッシュをクリアしています。 SET NOCOUNT ON SELECT FORMAT(COUNT(*), '#,###') FROM Table_1 W

    データ読み取りと CPU の利用について at SE の雑記