sort Linux kernel tracing Capture high frequency ftrace data: scheduling activity, task switching latency, CPU frequency and much more nfc Userspace profilers and extra probes Native heap profiling, Java heap profiling, pollers for /proc stat files
最近、プロセッサに「NPU」と呼ばれる人工知能(AI)処理に特化したユニットが搭載されるのがちょっとしたブーム(?)になっている。このNPUって、GPUなどと何が違うのか、なぜプロセッサに搭載されるようになってきたのか解説しよう。 プロセッサに搭載されている「NPU」って何? Intelの最新プロセッサ「Core Ultra」には、人工知能(AI)処理に特化した「NPU」が搭載されている。NPUは、スマートフォン向けのプロセッサにも搭載が進んでいる。ところで、このNPUはCPUやGPUと何が違うのだろうか? 写真は、Intelのプレスリリース「AI PCの新時代の到来を告げるインテル Core Ultra プロセッサー」のCore Ultraプロセッサーの写真を使って、「CPU」「GPU」「NPU」の文字を載せたもの。 今回のお題は「NPU」である。出だしから注釈になってしまうが、NPUと
従来から、「ARMはx86より(電力的に)効率的だ」という言説があります。これは単純に「ARMは省電力なスマホ向けで、x86は電力を食うPC向け」程度のアバウトなイメージのこともありますし、前世紀のRISC vs CISC論争のころからある「ARMはx86 (x64を含む)に比べ命令セットがシンプルなので、命令デコードにかかる電力が少なくて済んで効率的」という議論の形をとることもあります。 この議論については、半導体エンジニアの多くは「ARMがx86 より効率が良いというのは、もはや過去の神話」(in today’s age it is a very dead argument)という認識を共有していると言っていいでしょう。有名なところではApple CPU (ARM)とZen (x86)の両方を開発したジム・ケラー氏のインタビューでも言われていますし、Chips and Cheeseとい
この記事はUTF-8のバリデーションとオートマトンの続きです。 前回はUTF-8のバリデーションが8状態のオートマトン (DFA) で表現できることを見ました。状態と遷移を擬似コードで書けば次のようになるでしょう: -- 8つの状態 data State = START | TAILx1 | TAILx2 | TAILx3 | A | B | C | D -- 入力バイトに応じて次の状態を返す。次の状態が該当しなかったら Nothing を返す next :: Word8 -> State -> Maybe State +----+----+-----+----+ | a0 | a1 | ... | aN | 8ビット整数列 +----+----+-----+----+ | | | v v v +----+----+-----+----+ | m0 | m1 | ... | mN | モノ
長年CPU製品を市場に送り出してきたIntelとAMD。良きライバルでありながらも、技術の標準化において協力関係にある両社。製品の性能を比較することはあっても、これまで互いを罵り合うような関係ではなかった。 だが、IntelがAMDを公式に非難したとして話題になっている。しかも、その中で過激な言葉も使われたとか……。一体、両社の間に何があったのか? IntelがAMDに対して「Snake oil」と罵ったことが始まりだった。これは、19世紀終盤から20世紀の初頭にかけて米国で使われていた言葉なのだそうだ。Snake oilとは効果がなかったり、効果を大げさにうたったりしている薬品や治療法のことを指し、そこから転じて「インチキ」「詐欺」といった意味を表す言葉として使われている。 Intelは2023年12月4日に「Core Truths」と題したスライドを自社のWebサイトに公開した。Sna
関連キーワード Intel(インテル) | Google | 脆弱性 Intel製CPU(中央処理装置)に、機密情報の漏えいにつながる恐れのある脆弱(ぜいじゃく)性が見つかった。2018年にGoogleが公開した「Spectre」「Meltdown」に続いて、Intel製CPUの新たな脆弱性が明らかになった形だ。 2023年8月、GoogleはIntel製CPUに脆弱性「Downfall」(CVE-2022-40982)を発見したと発表した。攻撃者がDownfallを悪用すると、レジスタ(CPU内蔵メモリ)のデータにアクセスできる可能性があるという。第6世代(開発コードネーム:Skylake)から第11世代(開発コードネーム:Tiger Lake)までのIntel製CPUが、Downfallの影響を受ける。 「Downfall」は何が危険なのか? 併せて読みたいお薦め記事 脆弱性によるリス
I've done a lot of things with computers, but I've always had a gap in my knowledge: what exactly happens when you run a program on your computer? I thought about this gap — I had most of the requisite low-level knowledge, but I was struggling to piece everything together. Are programs really executing directly on the CPU, or is something else going on? I've used syscalls, but how do they work? Wh
この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "メモリバリア" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL(2023年7月) メモリバリア(英: memory barrier)またはメモリフェンス(英: memory fence)とは、その前後のメモリ操作の順序性を制限するCPUの命令の一種である。 CPUには、性能最適化策としてアウト・オブ・オーダー実行を行うものがあり、メモリのロード命令やストア命令を含めて順序を入れ替えて実行することがある。この命令の並べ替えは、ひとつのスレッドの中で一般に暗黙のうちに行われるが、マルチスレッドプログラムやデバイスドライバでは慎重に制御しない限り
現在、最先端の半導体チップを開発・製造・販売するバリューチェーンに大変革が起こりつつあることをご存じだろうか。これまでは異なるメーカーから個別供給されていた半導体チップが、1つのパッケージの中に統合されて供給される時代が到来しようとしているのだ。その背景にあるのが「チップレット」と呼ばれる技術であり、半導体業界の関連企業がこぞって注目している。チップレット技術の概要とその技術的なインパクト、それによってもたらされる近未来を解説する。 米Intel(インテル)のCPU(中央演算処理装置)と米NVIDIA(エヌビディア)のGPU(画像処理半導体)、場合によっては米Qualcomm(クアルコム)の移動通信用ベースバンドチップや韓国Samsung Electronics(サムスン電子)のDRAM(一時記憶向けメモリー)まで――。これまで個別供給されていた別メーカー製の半導体チップが、1つのパッケー
本書の構成 第1章。「ふむふむ、このレベルから説明してくれるのか」 第2章の途中からギアアップしてきて、「スーパースカラ+スーパーパイプライン化」で現代のCPUの規模感のようなものを思い知ることになります。順調にCPUの中を流れる命令列はまるでナイアガラの滝のよう。 でもちょっとしたことでその流れは止まってしまい、そのペナルティの大きさを実感することになります。 第3章から第8章で、CPUの処理の流れを止めるさまざまな要因が語られていきます。 第9章は「マルチプロセッサ」。一段と複雑になる要因ですが、現代のCPUでは外せないもの。 第10章から第12章で、共有メモリ型マルチプロセッサでのマルチスレッドをするときの注意点が語られていきます。 第13章がまとめ。それ以降は付録です。 私としては第9章の「マルチプロセッサ」以降が非常に勉強になりました。ぼんやりとしかわかってなかったことがこれでク
Kernel/VM探検隊online part6 で Rui Ueyama 氏による『リンカー moldをいろんなターゲットに移植した話』のセッションを視聴し、普段は接点のないCPUやpsABIといった低レイヤーの世界を覗き見したので、メモを残しておきます。 動画 発表スライド Ruiさんは、LLVMのリンカlldの作者でもあり、過去には同勉強会のPart 2でもリンカについて発表されています。 超高速リンカmold 1/2 - ログミーTech 超高速リンカmold 2/2 - ログミーTech 今回も、前日に発表が決まったとはとても思えない、非常に濃い発表でした。 本テーマは筆者の普段の業務と大きく異なります。間違いなどがあればコメントで指摘していただけると助かります。 以下の様なキーワードが頻出します。 リンカ psABI ELF QEMU ISA RISC/CISC エンディアン
コンピュータが実行できる命令をまとめたISA(Instruction Set Architecture:命令セットアーキテクチャ)のシェアは、コンピュータチップを製造するうえで重要です。Windowsコンピュータや多くのサーバで利用されているX86 ISAと、スマートフォンやAppleのコンピュータなどで採用されているArm ISAが長らく人気を二分していましたが、オープンソースのISAであるRISC-Vが近年、大きな注目を集めています。 安価なTWSイヤホンなどで実用が進むRISC-V 先日、私は友人たちと「分解のススメ」というイベントで、いくつかのTWSマイコンを分解しましたが、多くのSoCでRISC-Vの活用が見られました。 #分解のススメ 第14回アーカイブ ニセAirPods、おもちゃ分解、Oculus分解、TWSイヤホン分解からRISC-Vの活用や、中国半導体産業の深みを知る
米Amazon Web Services(アマゾン・ウェブ・サービス、AWS)は、クラウドで使用する数百万台以上のサーバーハードウエアをすべて自社で開発・製造してきた。そのハードの中身が近年、市販のPCサーバーとは大きく異なり、メインフレームに近い構成になっていた事実が明らかになった。 AWSのサーバーが「IBMメインフレーム互換」になったわけではない。AWSは2012年、AWS専用サーバーハードの内部に、CPUとは別にI/Oやサービス管理を担う専用プロセッサーを自社で開発して搭載する方針を決断した。そうした専用プロセッサーを使う手法は、メインフレームを参考にしたものだったと、AWS幹部が2022年8月にオンライン講演で明らかにしたのだ。 その幹部とはAWSのJames Hamilton(ジェームス・ハミルトン)シニア・バイス・プレジデント(SVP)だ。ハミルトン氏はこれまでも、自社イベン
米Qualcomm Technologies(クアルコムテクノロジーズ)は2021年11月30日から12月1日(米国時間)開催の同社イベント「Snapdragon Tech Summit 2021」において、5G(第5世代移動通信システム)に対応したパソコン(PC)向け新半導体製品を2つ発表した。1つは、薄型ノートパソコン(PC)やファンレス型ノートPCのハイエンド品に向けたプラットフォーム「Snapdragon 8cx Gen 3」。もう1つは、普及価格帯のWindows PCや「Chromebook」に向けた「Snapdragon 7c+ Gen 3」である。いずれも、5Gによる常時接続性のほか、画像認識や音声認識をはじめとするAI機能を強化した点などを特徴にうたう。加えて、同イベントには米Microsoft(マイクロソフト)の関係者が映像で登壇。クアルコムにとって、PC向け半導体製品
0-1. はじめに 少し前に「自作エミュレータで学ぶx86アーキテクチャ」という本を元に、Linux上でx86エミュレータを自作しました。(詳しくはこちらの記事をどうぞ) で、「CPUが内部でどんなことをしているのか?」というイメージをざっくり掴むことはできたのですが、 『そもそもCPUはどうして命令を実行できるのか?』 といった根本的な疑問は依然解決しないままの状態で、頭の中が逆にモヤモヤするという結果になってしまいました。。 そのため、x86エミュレータの記事にも書いたのですが 「時間ができたら次はハードウェア的な部分のエミュレートにも挑戦してみたいなぁ」 と思っていたわけなのですが、最近ようやくその願いが叶いなんとか「CPUそのものの自作」(といってもブレッドボード上でですが..)までこぎつけましたので、作業中に気づいたことや苦労したことなどを軽くメモしていこうと思います。 また私自
本章では,C言語を用いて「 CPUシミュレータ 」を制作します. CPUやアセンブリ言語に習熟している場合は,本章を読み飛ばし第2章に進んでも結構です. しかし,アセンブリ言語を用いたプログラミングや,その開発環境(クロスアセンブラ)に関連する内容が 含まれており,オリジナルプロセッサのアセンブリ言語を開発する際のデバッグツールとしても活用できます. プログラミング作業やそのデバッグに,かなりの時間や労力を要するかもしれませんが, これらの作業を通して,CPUの基本的な構成や動作が,具体的にイメージできるようになり, 目的地にいち早く到達することができるでしょう. 「 コンピュータアーキテクチャ 」の復習にもなりますので,しっかり学習して下さい. 2. 設計手法について 比較的単純なプロセッサの設計手法は,ハードウェア記述言語(HDL)関連の書籍で数多く紹介されています. また,具体的な設
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く