タグ

cpuに関するskypenguinsのブックマーク (53)

  • ARMはx86より効率がいいというのは過去の神話

    従来から、「ARMはx86より(電力的に)効率的だ」という言説があります。これは単純に「ARMは省電力なスマホ向けで、x86は電力をPC向け」程度のアバウトなイメージのこともありますし、前世紀のRISC vs CISC論争のころからある「ARMはx86 (x64を含む)に比べ命令セットがシンプルなので、命令デコードにかかる電力が少なくて済んで効率的」という議論の形をとることもあります。 この議論については、半導体エンジニアの多くは「ARMがx86 より効率が良いというのは、もはや過去の神話」(in today’s age it is a very dead argument)という認識を共有していると言っていいでしょう。有名なところではApple CPU (ARM)とZen (x86)の両方を開発したジム・ケラー氏のインタビューでも言われていますし、Chips and Cheeseとい

    ARMはx86より効率がいいというのは過去の神話
  • 「プログラマーのための CPU 入門 ― CPUは如何にしてソフトウェアを高速に実行するか」を読んだ - おしぼりの日常

    年明けの暇な時間を利用して読んでみました。 書籍のリンク 技術書としての感想 良かった点 悪かった点 注意点 総評 技術書としての感想 良かった点 とにかく文章が分かりやすい 色々な用語の使い方に違和感がない 言葉にすると簡単ですが、当に分かりやすかったです. 具体例が豊富 図が豊富 コード例が豊富 実験例が豊富 まず、「〇〇 な場合に命令の処理が詰まって遅くなります」といった説明の後に、「では、具体的にこういったケースを考えてみましょう」という具体例を持ってくる展開が多く、とても親切だと感じました.また、このような具体例の説明のときにほぼ必ず図が用いられています.特に全体を通して頻繁に出てくる命令流の図は非常に分かりやすかったです.また、コード例とそれを用いた実験も豊富でした.具体的には、キャシュの章では実際にキャッシュミスを意図的に起こすコード・キャッシュヒットを意図的に起こすコード

    「プログラマーのための CPU 入門 ― CPUは如何にしてソフトウェアを高速に実行するか」を読んだ - おしぼりの日常
    skypenguins
    skypenguins 2024/01/04
    誰もコメントしてなくて草/パタヘネと比較した視点が知りたい(買えって話かも知れんがw)
  • プログラマーのためのCPU入門 | フューチャー技術ブログ

    まあ後半のインテルのモデルになると同じCPUでも熱設計で性能が大きく変わったり、ブースト時の性能だったり、いろいろあるのであくまでも数字は目安ですが、無視できないほど大きくなっているのがわかります。特に、Ryzenが元気なここ5-6年の競争による進化がすごいです。 なぜ5-6倍も性能が上がったのか、というのをすぐに言葉できちんと説明できる人はあまりいないと思います。最近、更新がなくなってしまい、Facebook(なぜか友達にしていただいた)上でも活動がみられなくて、悲しいのですが、後藤弘茂のWeekly海外ニュースの連載をずっと読んでいた人であれば、「命令デコーダーが増えたのね」とかなんとなく強くなった部分のイメージがつくとは思いますが、そのなぜ、というのに、実験付きで数値の根拠も含めてわかりやすく説明してくれているのが書です。 CPU実験がおもしろい書は、豊富な図で(LambdaNo

    プログラマーのためのCPU入門 | フューチャー技術ブログ
  • Microsoft Word - 2008-03-17 ☆DP171 立本.doc

    MMRC-J-171 PCのバス・アーキテクチャの変遷と競争優位 ―なぜ Intel は、プラットフォーム・リーダシップを 獲得できたか― 東京大学ものづくり経営研究センター 立博文 2007 年 7 月 東京大学 COE ものづくり経営研究センター MMRC Discussion Paper No. 171 立博文 2 東京大学 COE ものづくり経営研究センター MMRC Discussion Paper No. 171 2 PCのバス・アーキテクチャの変遷と競争優位 ―なぜ Intel は、プラットフォーム・リーダシップを 獲得できたか― 東京大学ものづくり経営研究センター 立博文 2007 年 7 月 要約 近年、製品開発論の分野では、製品のアーキテクチャの視点を取り入れた実証分析が 盛んに行われている。アーキテクチャベースの戦略の中で、もっとも強力な戦略がプ ラットフォーム

  • VM環境のCPU仮想化はどうやって実現しているのか ハードウェア仮想化支援機構の仕組み

    Arm入門勉強会とは、macOSがArmに移行したこの機にArmアーキテクチャでのプログラミングについて入門するソフトウェアエンジニアのための会です。今回主催の@nullpo_head 氏が、Armの仮想化支援機構について、その仕組みから深く説明します。前半は「現代のハードウェア仮想化支援機構」について。全2回。 ハードウェア仮想化支援とは何か 佐伯 学哉氏:入門セッション3つ目は『Armの仮想化支援機構』についての入門セッションです。どうぞよろしくお願いします。 発表のスタートとゴールです。VMwareとかQemuとか使ったことあるけど仮想マシンの仕組みなんも知らんというところがまずスタートになっています。 1個目のゴールは、最近のVMのざっくりした仕組みとハードウェア仮想化支援とは何かということがわかること。そしてその話のあとに実際にArmの仮想化支援機構の概要を説明し、Armの仮想

    VM環境のCPU仮想化はどうやって実現しているのか ハードウェア仮想化支援機構の仕組み
  • Intel、新「X86-S」アーキテクチャで8086互換を切り捨て

    Intel、新「X86-S」アーキテクチャで8086互換を切り捨て
    skypenguins
    skypenguins 2023/05/22
    (アプリとして)誰も使ってない16bitリアルモードとか切り捨てるっていう話だから、ISAがx86の拡張ですら無いIA64とは話がそもそも違うのでは
  • プロセスよりもスレッドのほうが高速にコンテキストスイッチできることを検証する

    目次 はじめに コンテキストスイッチとは 実験1: パイプを使って計測する 実験2: より実際的なモデル プロセス VS スレッド はじめに すこし前に、Chromeの開発をされているをやられている方のこんなスライドが回覧されてきた。 で、それを見てすこしひっかかったのが 15ページ のところ。 スレッドとプロセスの比較だけど、スレッドについて、このような言及がある。 そのぶんプロセスより軽い(メモリ使用量、コンテキストスイッチ) あれ、コンテキストスイッチの時間って、プロセスとスレッドで違うんだっけ…。 ぼくはアプリケーションプログラマなので低レイヤーのことは詳しくないのだけど、 プロセスもスレッドも、スケジューラーから見ると同じタスクという抽象であるみたいな話をどこかで聞いたことがあって、 コンテキストスイッチの時間にも違いはないのかと、なんとなく思い込んでいた。 これを実際に検証する

    プロセスよりもスレッドのほうが高速にコンテキストスイッチできることを検証する
  • JavaScript で CPU が Intel かどうかを判定する(ついでに JIT を検知する)

    先日、次のような Tweet を見かけました TIL I discovered that TensorFlow.js uses an interesting trick to sniff your CPU architecture in WebAssembly. pic.twitter.com/LVyywIM48I — Robert Knight (@robknight_) January 4, 2023 面白かったので、なぜこうなるのかの解説と、ついでにこのテクニックを使った JIT 検知方法などについて紹介します。 JavaScript における低レイヤーの扱い JavaScript においては、挙動が比較的しっかりと仕様に定められているために、環境による振る舞いの違いはあまり発生しません。しかし、低レイヤーに降りるほど振る舞いは実装依存になり、環境差が発生する余地が出てきます。 一番

    skypenguins
    skypenguins 2023/01/11
    ニッチすぎる
  • iPhoneにArmコアが載った日 その前日譚を技術と人脈から解説する

    こちらは機能的にはPP5002から大きく強化され、USB 2.0の対応やバッテリーモニターのサポート、カラー液晶のハンドリング、JPEG/MotionJPEGの取り扱いなどが追加された一方、CPUコアそのものは80MHz駆動のDual ARM7 TDMIと、むしろ性能は多少落ちていたりする。2005年に投入されたiPod PhotoやiPod Color Displayなどの製品もこのPP5020が利用されていた。 Sumsung SoCへの切り替えは必然的だった ただ第5世代のiPod(ビデオ再生対応)についてはPP5020のままではいろいろ性能が足りなかったようで、PP5021Cという進化型(引き続き80MHz駆動のDual ARM7 TDMIコア)にBroadcomの「BCM2722」というビデオプロセッサを組み合わせる形で実装された。 おそらくこの辺りで、PortalPlayerが

    iPhoneにArmコアが載った日 その前日譚を技術と人脈から解説する
  • Armのライセンス形態はどうなっているのか AppleはどのIP?

    RISCプロセッサの歴史連載でもおなじみ大原雄介さんがスタートした短期集中連載。テーマは今最も熱いRISCプロセッサ、“Apple Silicon”だ。Armアプリケーションプロセッサの変遷に続いて、第2回はAppleとArmの関係にも影響してくる、ライセンスの問題について。 前回、Cortex-Aシリーズの製品の説明を一通り終わらせたところで、ライセンスの話をしておきたい。 以前の記事にもちょっと書いたが、ArmはCPUのIP(Intellectual Property)を提供する企業である。ここでいうIPとは、プロセッサの「論理的な」設計図である。他に何があるかというと、「物理的な」設計図が必要である。 例えばこちらは、2つのArduinoというマイコンボードで通信を行わせよう、というテーマの記事だが、下の方にある「回路図」が論理的な設計図、「実体配線図」が物理的な設計図になる。この記

    Armのライセンス形態はどうなっているのか AppleはどのIP?
  • ArmのApplication Core、その変遷

    ArmのApplication Core、その変遷:新連載「Apple Siliconがやってくる」(1/3 ページ) RISCプロセッサの歴史を執筆中の大原雄介さんがタイムリーな短期集中連載をスタート。テーマは今最も熱いRISCプロセッサ、“Apple Silicon”だ。まずはそのベースとなっている、Armアプリケーションプロセッサの変遷について。 WWDC 2020でAppleが将来のMacプラットフォームをApple Silicon、要するにArmベースの自社プロセッサに切り替えるという話についてはこちらをはじめ、さまざまな記事が上がっている。ぶっちゃけ筆者はApple派の人ではない(なんせメインで使ってたのはグラフィックスカードVimage SE/30を突っ込んだMacintosh SE/30 16MB+漢字Talk 6.0.7あたりまで。漢字Talk 7には移行せずに、WFW(

    ArmのApplication Core、その変遷
  • ARMの誕生 ~Sinclair、BBCからNewton、Symbianへ~

    ARMの誕生 ~Sinclair、BBCからNewton、Symbianへ~:RISCの生い立ちからRISC-Vまでの遠い道のり(1/4 ページ) ※現在Armの正しい表記は“大文字A+小文字rm”であるが、今回ご紹介する内容の時期はまだ大文字の“ARM”の時代だったので、あえて“ARM”と記述させていただいた。 アメリカではハイパフォーマンス路線に突き進むMIPSやその競合メーカーが一斉にRISCに飛びつくが、それとは別の動きがイギリスで生まれていた。 1978年、CPU(Cambridge Processor Unit) Ltd.という会社がイギリスのケンブリッジで創業した。厳密に言えば、そもそもSinclair ZX80とか、後にはZX Spectrumを世に送り出したクライブ・マールズ・シンクレア卿が興したSoC(Science of Cambridge:もともとはSinclair

    ARMの誕生 ~Sinclair、BBCからNewton、Symbianへ~
  • マインクラフトで1HzのCPUを作り上げた猛者が登場、テトリスや関数のグラフ化も可能

    累計販売数が2億を超えたり、YouTubeでの総視聴回数が1兆回を超えたりと、世界的に人気のある箱庭ゲーム「マインクラフト」はサバイバル生活を楽しんだり、自由にブロックを配置し建築などを楽しんだりできるのが売りです。そんなマインクラフトで「レッドストーン」というアイテムを駆使して周波数1HzのCPU「CHUNGUS 2」を設計したと、YouTuberのsammyuri氏が発表しました。 CHUNGUS 2 - A very powerful 1Hz Minecraft CPU - YouTube CHUNGUS 2は「Computational Humongous Unconventional Number and Graphics Unit by Sammyuri 2」の略称。 CHUNGUS 2はクロック1Hzで10tickの16bitCPUで、3オペランド命令のRISCアーキテク

    マインクラフトで1HzのCPUを作り上げた猛者が登場、テトリスや関数のグラフ化も可能
    skypenguins
    skypenguins 2021/12/18
    Atari2600相当なのは外部メモリの容量4KiBであってクロック数ではない(Atari2600のそれは1.19MHz)よね?Gigazine特有の雑な翻訳記事がまた世に放たれてしまった
  • The Fastest FizzBuzz Implementation

    I have 15 years of consulting & hands-on build experience with clients in the UK, USA, Sweden, Ireland & Germany. Past clients include Bank of America Merrill Lynch, Blackberry, Bloomberg, British Telecom, Ford, Google, ITV, LeoVegas, News UK, Pizza Hut, Royal Mail, T-Mobile, Williams Formula 1, Wise & UBS. I hold both a Canadian and a British passport. My CV, Twitter & LinkedIn. The following is

  • オール・トランジスタ4ビットCPUの製作とFPGA開発[Vol.1 ノイマン型CPUの設計]

    オール・トランジスタ4ビットCPUの製作とFPGA開発 [Vol.1 ノイマン型CPUの設計] ALU,レジスタ,I/Oなどをトランジスタ・レベルで手作りし,さらにFPGAにも実装 著者・講師:別府 伸耕/Nobuyasu Beppu (リニア・テック) 企画編集・主催: ZEPエンジニアリング株式会社 関連製品:[VOD/KIT]実習キットでできる!ラズパイPicoでマイコン入門 関連製品:[VOD/KIT]実習キットでできる!ラズパイPico×Wi-FiモジュールでIoT超入門 関連製品:[VOD/KIT]一緒に動かそう!Lチカから始めるFPGA開発【基礎編】 関連製品:[VOD/KIT]STM32マイコン&Wi-Fiモジュールで学ぶ C/C++プログラミング入門 関連製品:[VOD/KIT]実習キットで一緒に作る!オープンソースCPU RISC-V入門 関連製品:[VOD/KIT]P

  • エヌビディアがCPU参入 アームと組みAI計算10倍速く - 日本経済新聞

    【シリコンバレー=佐藤浩実】米半導体大手のエヌビディアは12日、CPU(中央演算処理装置)に参入すると発表した。英アームの基設計を利用し、2023年に米欧のスーパーコンピューターに搭載する。人工知能AI)計算を10倍速くできる見通しで、米インテルの主戦場に切り込む。AIの進化を左右する「頭脳」を巡り競争が激しくなる。12日に開いたAIイベントでCPU「Grace(グレース)」を発表した。エ

    エヌビディアがCPU参入 アームと組みAI計算10倍速く - 日本経済新聞
    skypenguins
    skypenguins 2021/04/13
    日経、「謎のAI半導体メーカー」って呼ぶのやめたの?
  • コアを多数搭載するCPUは「POSIX」によって能力を制限されているとの指摘

    by Rudolf Schuba UNIX系のOSに共通する機能の呼び出し方法などを定めたPOSIXは、「POSIXに準拠するならばどんな環境でも動作する」ことを保証する規格です。POSIXは長年移植可能なアプリケーションの開発を支えてきましたが、システム管理者のチャールズ・フィッシャー氏は「POSIXがマルチコアCPUの能力を制限する要因となっている」と指摘し、「xargs」コマンドを例として具体的な説明を行っています。 Parallel shells with xargs: Utilize all your cpu cores on UNIX and Windows | Linux Journal https://www.linuxjournal.com/content/parallel-shells-xargs-utilize-all-your-cpu-cores-unix-and-

    コアを多数搭載するCPUは「POSIX」によって能力を制限されているとの指摘
    skypenguins
    skypenguins 2021/02/28
    Gigazine特有の「大学生がろくに内容を理解せずにまとめたレポート」のような記事がまた出た
  • なぜもっとたくさんのコアを搭載したCPUを作らないのでしょうか?2000コアのGPUなんかそこら辺にありますが、なぜCPUでは同じようにできないのでしょうか?

    回答 (9件中の1件目) 質問に間違いがありますね。 2000個のコアが入ったGPUなんかありません。企業の広報は違った(間違った)方法で計算して数字を大きく見せています。 Radion 6900XTの当のコア数(DCU)は、5120個ではなく、40個です。こちらでダイの写真を確認でき、4*5のコアが2グループあります。 各コア(DCU)には32レーンのSIMDユニットが4つあり、各コアには並列に動作する32 bitの浮動小数点演算ユニット(FMA)が128個あり、チップ全体としては32 bitのFMAが5120個同時に動きます。 Zen2とZen3のCPUコアはどちらも256...

    なぜもっとたくさんのコアを搭載したCPUを作らないのでしょうか?2000コアのGPUなんかそこら辺にありますが、なぜCPUでは同じようにできないのでしょうか?
  • 書籍「作ろう!CPU」

    各ボードの詳細はこちらをご参照下さい。 この他にも、スイッチとLEDがそれぞれ4個以上搭載されているFPGAボードなら、ほぼ確実に動くと思われます。 いろいろな方への紹介文 書の主な想定読者は、電気や回路や CPU について何も知らない方です。 しかし回路に詳しい方々からも、「こんな考え方があるのか!」という驚きの声を多数いただいております。 筆者として、当に嬉しい限りです。 様々なバックグラウンドの方に楽しんでいただくために、以下に10通りの紹介文をひねり出したので、興味のある項目に目を通してもらえると幸いです。 電気や回路を全然知らない方へ プログラマーの方へ 情報学科の学生さんへ 論理回路を教えておられる先生方へ FPGAに挫折した経験のある方へ ハードウェア記述言語に詳しい方へ アナログ回路に詳しい方へ 物理に詳しい方へ 数学に詳しい方へ 人間の欲望を重視する方へ 電気や回路を

    skypenguins
    skypenguins 2020/08/20
    おもしろそう
  • What does multicore assembly language look like?

    Once upon a time, to write x86 assembler, for example, you would have instructions stating "load the EDX register with the value 5", "increment the EDX" register, etc. With modern CPUs that have 4 cores (or even more), at the machine code level does it just look like there are 4 separate CPUs (i.e. are there just 4 distinct "EDX" registers) ? If so, when you say "increment the EDX register", what

    What does multicore assembly language look like?