[B! processor] [18ページ] pipeheadのブックマーク

CPUの基礎 - IS Report System

pipehead 2011/05/03

リンク

第5回　x86プロセッサの仮想化支援機能Intel VT ＆ AMD-V | gihyo.jp

前回は、システム仮想マシンを実現するための条件、その古典的な実装方法を紹介しました。また、それらのアプローチをx86システムに適用する場合、どのような障壁があるかについて説明しました。今回は、従来のx86プロセッサにおける仮想化の問題点を解決するために追加された“⁠仮想化支援機能⁠”がどのようなものであるかを紹介します。仮想化支援機能の概要 x86プロセッサの仮想マシンソフトウェアの実装が困難だった中、プロセッサを供給するインテルおよびAMDは、プロセッサ自体に仮想化支援機能を追加しました。それが、インテル製のプロセッサに搭載されたIntel VT-x、およびAMD製のプロセッサに搭載されたSVMです。リング0で動作するOSをも支配するVMM専用モード前回解説したtrap-and-emulateによるシステム仮想マシンを実装するためには、仮想マシンモニタ（VMM）が、ゲストOSのカ

pipehead 2011/04/08

VT-x, SVM (Secure Virtual Machine)

リンク

第4回　x86プロセッサにおけるプロセッサ仮想化 | gihyo.jp

これまで、x86システム仮想マシンの概要、およびその実例としてDebian GNU/Linux 6.0を利用した仮想マシンの実行方法について紹介してきました。今回からは、より具体的にCPU、メモリ、I/Oデバイスの仮想化がどうやって実現されているかを解説したいと思います。今回は、仮想マシンを実装するための古典的手法およびそれを従来のx86プロセッサに適用する際の問題点、そして仮想マシンソフトウェアがどのようにそれらの障壁を乗り越えてきたかについて解説します。システム仮想マシンに求められる条件これまで、システム仮想マシンはどのようなものかについて説明してきましたが、仮想化仮想化の生みの親とも言えるGoldbergらは、1974年に書いた論文にて、仮想マシンソフトウェアとはどのようなものであるべきかについて、コンピュータアーキテクチャの観点から論じています。彼らは、その仮想マシンソフト

pipehead 2011/03/16

trap-and-emulate, リアルモード, プロテクトモード, リングプロテクション, センシティブ命令 (sensitive instructions), バイナリトランスレーション (Binary Translation)

リンク

ARM vs Intelの未来の展望 - yukobaのブログ

ARMはスマートフォン・携帯電話で広く使われていますが、クロック周波数の割に微妙にIntelのCPUよりも遅く、なんでなのかなーということで調べてみました。まず、http://www.coremark.org/benchmark/index.php のベンチマークの結果から、色々数字があり、すごく悩みながら信用できそうな数字を拾ってみました。 1コア当たりの性能名称性能備考 ARM Cortex-A8 600Mhz 2.035/MHz Cortex-A8は2010年のスマートフォンの主流 NVIDIA Tegra 250 1GHz 2.646/MHz Cortex-A9は2011年のスマートフォンの主流かな？ Intel Core2 Duo 1596MHz 3.205/MHz Intel Core i5-650 3200MHz 3.244/MHz このように、クロック当たりの性能が

pipehead 2011/01/23

> 今のスマートフォンの1GHzというのは、600MHzな感じです。（JavaScriptのベンチマークだと、さらに25%程度遅いイメージがあります）

リンク

4Gamer.net ― Sandy Bridgeのグラフィックス機能「HD Graphics 3000＆2000」レビュー。Intel製GPUコアのイメージを覆す存在に

Sandy BridgeのGPUコア「HD Graphics 3000＆2000」には，どこまで期待していいのか Core i7-2600K/3.40GHz Core i5-2500K/3.30GHz （Intel HD Graphics 3000） Core i7-2600/3.40GHz （Intel HD Graphics 2000） Text by 宮崎真一単体グラフィックスカードを組み合わせる前提で行ったレビュー記事で筆者は，「Sandy Bridge一択」と評した。それほどまでに，Sandy Bridgeと呼ばれていたLGA1155パッケージ版Core i7＆i5プロセッサの上位モデルには性能面でのインパクトがあったわけだ。 i7-2600K 一方，Sandy Bridgeにおける最大の特徴が，「CPUコアとグラフィックスコア，ノースブリッジ機能がシングルダイに統合されている

pipehead 2011/01/14

Core i7-2600K, Core i7-2600, Core i5-2500K, Core i5-661, Phenom II X6 1100T Black Edition

リンク

コンピュータアーキテクチャの話(219) ダイナミック電力の低減手法(2)

図1.20に見られるように、電源電圧を下げるとクロックも下げざるを得なくなる。しかし、プロセサのやるべき仕事が少なく、クロックを下げて処理速度を落としても十分間に合うという状態では、電源電圧と動作クロック周波数をつり合いのとれた形で下げてやると、大幅に消費電力を減らすことができ、電源電圧を20%下げると消費電力はほぼ半減する。このように処理負荷に応じて電源電圧とクロック周波数を変えるのがDynamic Voltage Frequency Scaling(DVFS)という方法で、マイクロプロセサとしては、今は亡きTransmetaのCrusoeで最初に採用され、その後、多くのプロセサで採用が広がっている省電力手法である。そして、最後に残るパラメタがαである。前に、αが小さくなる理由としてプロセサが浮動小数点演算器は使っていないというケースを挙げたが、実は、使っていない=電力を喰わないという

pipehead 2011/01/04

Dynamic Voltage Frequency Scaling (DVFS), クロックゲート (Clock Gate)

リンク

北森瓦版 - “SandyBridge”の上位GPUコア―HD 3000のベンチマークスコア

HD 3000のゲーム性能は大雑把に言ってしまうとRadeon HD 5450前後からGeForce GT 220未満となります。つまり、HD 3000は現行の最下位GPUコア程度ならば軽く超えられる程度の能力はあるようです。HD 2000と比較してもEU数が倍となり、周波数が向上した分の性能向上は十分に確認できます。今回テストに使われたゲームを実際にHD 3000でプレイするということはそうそうないと思われます。ただ、最近はある程度のGPUパワーを何かと要求されることも多くなっています。HD 3000はこの要求に応えてくれるのではないでしょうか。 HD 2000のテスト時に言われていたように、Mobile向け“SandyBridge”でこのHD 3000がメインに搭載されるならば、その恩恵は決して少なくないものになるでしょう。

pipehead 2010/12/29

リンク

Turbo Boost Technology の研究

Turbo Boost Techno logy の研究（お勉強）１．はじめに E8600と同じ45nmなNehalemには食指が伸びずパスしたので、2008年夏以降いまだにE8600にを使っていますが、 2011年には足掛け3年になるので、Sandy Bridgeでそろそろ4コアに移行しようかと思っています。 Sandy Bridge に移行するに際しては、E8600の実稼働周波数4.5GHzを下回らないことが前提で、そうでなければ、クロック至上主義者（笑）としては、悲しいことになってしまいます。ところで、Sandy Bridgeでは、CPUへの入力クロック周波数（NehalemてはFSBではなくBCLK（ベースクロック）なのだそうで）にPCI-E等のクロック周波数が連動するので、BCLKはいじれないのだそうです。となると、Sandy Bridge のラインナップにはブースト時で

pipehead 2010/12/13

Core i5-655K

リンク

マルチコアCPUのキャッシュで問題となるコヒーレンシと解決策 (1/3)

キャッシュの仕組み解説編最後のテーマは、「コヒーレンシ」(Coherency)である。あまり耳にしない単語だが、直訳すると「首尾一貫性」といったところか。キャッシュの場合、この単語は「データの一貫性」「データの整合性」といった意味合いで利用される。これは、前回触れた複数レベルのキャッシュで問題となる場合もあるが、一番大きな問題が起きるのは、マルチプロセッサー/マルチコアCPUの環境である。マルチプロセッサー環境でキャッシュの整合性を保つスヌーピングとその方式例えば図1のような、懐かしいデュアルCPU構造を例にとって見る。ここで「CPU #1」があるデータを書き換えたとする。すると、図2のように1次/2次キャッシュの更新を経て、最終的にメモリーにそれを反映して終わる。ここまではいい。問題は「CPU #2」である。もしCPU #2が同じアドレスのデータをすでにキャッシュしていたとすると

pipehead 2010/11/22

コヒーレンシ (Coherency), スヌーピング (Snooping)

リンク

キャッシュの実装方式から見える AMDとインテルの置かれた状況 (1/3)

前回までに、CPUには複数のキャッシュが搭載されていることを説明した。今回はそのキャッシュをどう制御するか、という話をしよう。 3階層のキャッシュのどこにデータを置くか？例えば図1のように、1次～3次までキャッシュを持つCPUを考えてみる。ここでCPUがデータ(命令でもいい)のフェッチを掛けた場合、まずは1次キャッシュのタグを検索する(図1-①)。ここで見つかれば問題なく、単に1次キャッシュからそのデータを引っ張ってくる(図1-②)だけでいい。問題は1次キャッシュにデータがなかった場合(キャッシュミス)である。

pipehead 2010/11/15

Implicit Prefetch (暗黙のプリフェッチ, Hardware Prefetch), Explicit Prefetch (明示的プリフェッチ, Software Prefetch), Inclusive Cache (包括的キャッシュ), Exclusive Cache (排他的キャッシュ, Victim Cache)

リンク

仮想メモリーを支えるもうひとつのキャッシュ TLB (1/3)

仮想アドレスと物理アドレスを変換する Address Translationの基本前回はメモリーの階層構造と同様に、複数段階のキャッシュ構成があることを説明した。今回はちょっと見方を変えた話をしたい。まず、キャッシュという形でCPU内部に搭載されている、別のメモリーについて触れよう。ご存知の通り、1次キャッシュは通常「ハーバード・アーキテクチャー」と呼ばれる構造に基づき、命令用とデータ用がそれぞれ別に用意される。詳細は後述するが、2次キャッシュや最近では3次キャッシュを搭載するプロセッサーも多くなった。ただ、これらはいずれも「プログラムそのもの、およびプログラムの実行時に利用されるデータ」である。「ではそれ以外に何かあるのか？」と言われると、これが結構ある。一番多く利用されるのが「TLB」(Translation Lookaside Buffer)と言われるものだ。これは「仮想記憶」

pipehead 2010/11/08

TLB (Translation Lookaside Buffer), Address Translation (アドレス変換), ページテーブル, PTE (ページテーブルエントリ), ハーバード・アーキテクチャー

リンク

トランジスター数と性能を秤にかけるキャッシュ (1/3)

引き続き今回もキャッシュの話である。前回はキャッシュにデータを取り込み、それをタグで検索するところまでを解説したが、今回はその先のことを考える。新しいデータでキャッシュを入れ替える「リフィル」の方式プログラムや利用するデータが非常に小さくて、(OSまで含めて)全部オンキャッシュで動くなんて場合は問題ない。例えばMS-DOSであれば、OSそのものは100KB前後で動くし、簡単なプログラムであればライブラリやデータまで含めても100KB未満、なんてことも少なくない。こうした小さなプログラムなら、2次/3次キャッシュまで含めれば、数MBのキャッシュ容量を持つ昨今のプロセッサーなら、最初だけメモリーアクセスしたあとは、全部オンキャッシュでも動作する。しかし、昨今のOSは流石にこんなものでは済まないし、アプリケーションだって数10MBを軽く超えるものが普通だから、当然キャッシュには入りきらな

pipehead 2010/11/01

キャッシュ入れ替え (Refill: リフィル) の方式: LRU (Least Recently Used), ラウンドロビン, ランダム

リンク

CPUとメモリーの速度差を埋めるキャッシュの基礎知識 (1/3)

CPUの高速化についていけないメモリーの速度今回からはちょっと趣を変えて、「キャッシュ」の話である。キャッシュの目的は「レイテンシの遮蔽」にある。といきなり大上段に構えても話が通じないので、昔話から始めよう。初期のPCの場合、図1のようにCPUとメモリーが直結(厳密に言えばメモリーコントローラーを介する)されていた。初期というのは、おおむねi386ないし互換チップセットが利用されていた頃までの話である。この頃は、CPUの速度が速くても30MHz程度。対するメモリーチップの速度は100ns(10MHz)～80ns(12.5MHz)程度。たまに70ns品(≒14.3MHz)や60ns(≒16.7MHz)品が高値で販売されるという、ある意味のどかな時代であった。もちろん、これでもCPUの速度には追いついていないが、例えば2～4ウェイ・インターリーブでアクセスすれば、40～50MHz相当で

pipehead 2010/10/25

Write Through (ライトスルー), Write Back (ライトバック), Tag (タグ), キャッシュフィル, ラインサイズ, エントリー, フルアソシエイティブ, ダイレクトマップ, n ウェイセットアソシエイティブ

リンク

コンピュータアーキテクチャの話(211) 仮想化におけるI/Oの制御法

仮想化と入出力仮想化を行う場合のもう1つの大問題は入出力(I/O)である。単純に普通のOSをゲストOSとして動かすと、それぞれのゲストOSがI/Oを占有していると思って、自分のデバイスドライバでI/Oハードウェアを制御してしまう。これでは、I/Oの動作は滅茶苦茶になってしまう。基本的な解決方法は、VMMにI/Oデバイスのソフトウェアモデルを持ち、ゲストOSはI/Oデバイスの制御レジスタを読み書きしてI/O動作を行っているつもりであるが、ユーザ状態での制御レジスタの読み書きは特権違反となり、VMMのソフトウェアモデルがゲストOSの指令を変換して、整合の取れた形で実I/Oデバイスを動かすという方法である。原理的にはこれで良いのであるが、各種のI/Oデバイスに対してそのデバイス専用のデバイスドライバを騙すほどそっくりで、かつ、矛盾なく複数のゲストOSからのI/O処理をサポートするソフトウェ

pipehead 2010/10/22

IOTLB, Paravirtualization

リンク

CPU性能向上のトレンド　マルチコアの理論と限界 (1/4)

IPCの引き上げは難しいシンプルな解決策がCPU数の増加今回のテーマはマルチコアである。もともとコンピューターの世界では、CPUのコアをいっぱい並べるという技法は、非常に一般的であった。66回でも書いたが、CPUの処理性能は以下の式で表わされる。 P＝F×IPC PがPerformance(処理性能)で、FがFrequency(動作周波数)、IPCは「Instructions Per Cycle」(1サイクルあたりの処理命令数)となる。Pを引き上げるためには、Fを上げるかIPCを上げるかになるが、Fを上げると同時に消費電力も増えることになり、ある程度以上の動作周波数以上に引き上げるのが放熱の観点から困難、という制約があった。一方IPCを引き上げるのはもっと難しい、というのはここまでの連載で紹介したとおり。いろいろな策を講じてIPCを引き上げようとしているが、それでもなかなか上がらない

pipehead 2010/10/18

アムダールの法則

リンク

コンピュータアーキテクチャの話(210) VMMのオーバヘッドの解決手法

ゲストOSが実行するアプリケーションが新しいページを要求したり、ユーザ状態で実行するアプリケーションを切り替えるとゲストOSのページテーブルが変わり、それに対応してVMMはシャドーテーブルを書き換えなければならない。ゲストOSのページテーブルは普通のメモリ上にあるので、その書き換えを検出するため、ページテーブルを格納するメモリ領域を書込み禁止にして、ゲストOSがページテーブルのエントリを書き換えようとすると、特権違反が発生してVMMに制御が渡るようにする。そして、VMMは、この書き込みのアドレスを自分のページテーブルで再度変換して物理アドレスに変換してシャドーテーブルに書き込むという処理を行うので、書き換えの頻度にもよるが、一般的に、このゲストOSのページテーブルの書き換えにシャドーページテーブルを追従させる処理のオーバヘッドが、VMMの主要なオーバヘッドの1つとなっている。この問題を解

pipehead 2010/10/15

Nested Page Table, EPT

リンク

Core iシリーズにも使われる「SMT」の利点と欠点 (1/4)

まずはSMTを理解するための基本プロセスとスレッドの関係今回は「SMT」(Simultaneous MultiThreading、同期マルチスレッディング)の話をしてみたい。インテルではこれを「Hyper-Threading」と呼んでおり、以下では一般論の場合にはSMT、インテル製品に関する話題ではHyper-Threadingと、それぞれ称することにする。このSMTの技法はここ5回に渡って説明してきたパイプラインの改良そのものとは、ちょっと異なる方法論である。例えば、図1のようなデュアルコアCPUを考えてみよう。2次キャッシュがコア別に異なるのは、インテルの「Pentium D」やAMDの「Athlon 64 X2」「Athlon X2」など、共有なのが「Core Duo」以降のインテルのCoreマイクロ・アーキテクチャー製品になる。だが、この話では2次/3次キャッシュはあまり問題

pipehead 2010/10/14

Hyper-Threading

リンク

コンピュータアーキテクチャの話(209) プロセサ仮想化の基本的な概念

仮想マシンモニタ図10.8に示すように、通常のプログラム実行環境は、スーパバイザ状態で実行されるOSがハードウェアを制御し、ユーザ状態で実行されるアプリケーションはOSのサービスを使って特権命令でしか操作できないハードウェアを動かすという階層構造になっている。ユーザ/スーパバイザ機構を持つプロセサで、通常のOSをアプリケーション状態で実行すると、そのOSが特権命令を実行しようとすると、特権違反の例外が発生する。これをスーパバイザ状態で実行する管理プログラムが受け取り、必要な動作をソフトウェアでシミュレートして実行し、あたかもOSの発行した特権命令が実行されたようにして例外から復帰させれば、処理時間は別として、OSとしては自分が実ハードウェアを操作しているのと同じように動作することができるはずである。このようにしてユーザ状態で実行されるOSをゲストOSと呼び、スーパバイザ状態で動作する

pipehead 2010/10/08

仮想マシンモニタ (VMM: Virtual Machine Monitor), ハイパーバイザ (Hypervisor), シャドーページテーブル

リンク

x86を高速化する切り札技術「命令変換」の仕組み (1/4)

x86に限ってだが、アウトオブオーダーで欠かせないのが命令変換の仕組みである。インテルの場合は「μOp」(マイクロオプ)、AMD(というか旧NexGen)は当初「RISC86」と称し、その後「Op」、最終的には「microOp」と表記は変わっているが、要するにx86命令を「RISC風の」内部命令に変換する仕組みである。この内部命令が、μOpとかmicroOpなどと呼ばれるわけだ。ここでちょっと寄り道して、RISCとCISCの話をしておくことにする。例えばx86という命令はCISCの代表例であるが、そもそもRISCとCISCの違いとは？　というところを簡単に説明しておこう。 RISCとCISCの違いをざっとおさらい RISCという概念を、それと明確には知らずに搭載したCPUはかなり昔からある※1。だが、RISCという概念が明確になったのは、1981年にデビッド・パターソン(David Pa

pipehead 2010/10/04

μOp, microOp; RISC と CISC の違い

リンク

コンピュータアーキテクチャの話(208) 割り込みと例外

プロセサ本体と比べると著しく速度の遅いI/Oの動作完了や、キーボードや通信インタフェースからの入力の到着のように、プログラム中の命令の実行と非同期に発生する事象を処理するために割り込みという方法が使われる。割り込み処理機構は、当初は、このようなプロセサの外部から入力される事象を処理する目的で設けられたが、その後、前記の特権違反や、ゼロでの割り算などのプログラムの実行に伴ってプロセサ内部で発生する異常な事象に対処するためにも用いられるように拡張されてきている。そして、これらを総称してトラップ(Trap)という名称が使われる。また、外部からの事象と内部からの事象を区別する場合は、外部からのものを割り込み(Interrupt)、内部からのものを例外(Exception)と呼ぶ。プロセサに割り込み信号が到着すると、割り込み処理機構は、プログラムカウンタやキーとなる若干のハードウェアレジスタを退

pipehead 2010/10/01

トラップ (Trap), 割り込み (Interrupt), 例外 (Exception), システムコール

リンク

はてなブックマーク

タグ

関連タグで絞り込む (36)

processorに関するpipeheadのブックマーク (486)

お知らせ

今週のはてなブックマーク数ランキング（2026年5月第3週）

新サービスベータテスター募集のお知らせ

今週のはてなブックマーク数ランキング（2026年5月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

関連タグで絞り込む (36)

processorに関するpipeheadのブックマーク (486)

お知らせ

今週のはてなブックマーク数ランキング（2026年5月第3週）

新サービス ベータテスター募集のお知らせ

今週のはてなブックマーク数ランキング（2026年5月第2週）

公式Twitter

キーボードショートカット一覧

公式Twitter

はてなのサービス

新サービスベータテスター募集のお知らせ