タグ

cpuに関するkamipoのブックマーク (23)

  • perf statでL1,L2(,L3)キャッシュミス測定 - 俺とお前とlaysakura

    この記事は↓に移転しました。 laysakura.github.io

    perf statでL1,L2(,L3)キャッシュミス測定 - 俺とお前とlaysakura
  • perf stat でパフォーマンスカウンタの値を直接指定し表示 - 俺とお前とlaysakura

    この記事は↓に移転しました。 laysakura.github.io

    perf stat でパフォーマンスカウンタの値を直接指定し表示 - 俺とお前とlaysakura
  • キャッシュメモリ - Wikipedia

    キャッシュメモリ (cache memory) は、CPUなど処理装置がデータや命令などの情報を取得/更新する際に主記憶装置やバスなどの遅延/低帯域を隠蔽し、処理装置と記憶装置の性能差を埋めるために用いる高速小容量メモリのことである。略してキャッシュとも呼ぶ。コンピュータは以前から記憶装置や伝送路の性能が処理装置の性能に追いつけず、この差が全体性能に対するボトルネックとされてきた(ノイマンズ・ボトルネック)。そしてムーアの法則に基づく処理装置の加速度的な高性能化により現在ではますますこの差が拡大されている。キャッシュメモリは、記憶階層の観点からこれを解消しようとするものである。 主に、主記憶装置とCPUなど処理装置との間に構成される。この場合、処理装置がアクセスしたいデータやそのアドレス、状態、設定など属性情報をコピーし保持することで、来アクセスすべき記憶装置に代わってデータを入出力する

    キャッシュメモリ - Wikipedia
    kamipo
    kamipo 2011/06/29
  • IA-32 SIMDの扉

    SIMD命令およびアセンブラの基礎 SIMDとは 用語集 開発環境 アセンブラの基礎知識 x87 FPU命令を使用したプログラミング CPUの識別 メモリアドレスのアライメント ラップアラウンド算術と飽和算術 SIMD命令セットの分類と歴史 SIMD命令セットの記述方法 SIMD命令セットの概要 MMX命令セットの概要 SSE命令セットの概要 SSE2命令セットの概要 SSE3命令セットの概要 SSE4命令セットの概要 命令リファレンス データ転送命令 算術命令 比較命令 論理演算命令 シフト命令 シャッフル命令 パックおよびアンパック命令 変換命令 挿入および抽出命令 ブレンド命令 丸め命令 キャッシュ制御命令 その他の命令 プログラミング例 画像処理 音声信号処理 参考資料 参考資料 トップSIMDの扉

  • マルチコア時代のロードアベレージの見方 - naoyaのはてなダイアリー

    ちょっと煽り気味のタイトルですが、CPU がマルチコアになり 2個、4個と増えていく中 Linux の負荷の指針になるロードアベレージをどう読むべきか、という話です。気になったところを少し調べたのでそのまとめを。 http://d.hatena.ne.jp/naoya/20070222/1172116665 でも書いたとおり、Linux のロードアベレージは「ロードアベレージは過去1分、5分、15分の間の実行待ちプロセス数の平均数 = 実行したくても他のプロセスが実行中で実行できないプロセスが平均で何個ぐらい存在してるか」を示す値です。ボトルネックが CPU、メモリ、ディスク等々どこにあるかは関係なく、仕事の実行までにどれぐらい待たされているかを示す値なので、システムのスループットを計測する指標の入り口になる値です。 このロードアベレージですが、実装を見るとランキュー(待ち行列)に溜まった

    マルチコア時代のロードアベレージの見方 - naoyaのはてなダイアリー
  • SIMD - Wikipedia

    この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "SIMD" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL(2017年11月) SIMDの概念図 PU = 処理装置 (processing unit) single instruction, multiple data(シングルインストラクション・マルチプルデータ、SIMD[注釈 1][注釈 2])とはコンピューターの演算処理に関するフリンの分類のひとつで、1つの命令を同時に複数のデータに適用する並列化の形態を指す[5]。この手法にもとづく演算をベクトル演算 (vector operation) と呼ぶこともある。通例、SIMD命令により

    SIMD - Wikipedia
  • ストリーミングSIMD拡張命令 - Wikipedia

    この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。 出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "ストリーミングSIMD拡張命令" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL (2018年10月) ストリーミングSIMD拡張命令(英: Streaming SIMD Extensions、略称:SSE)は、インテルが開発したCPUSIMD拡張命令セット、およびその拡張版の総称である。後継の Advanced Vector Extensions (AVX) と Advanced Matrix Extensions (AMX) についても項で記載する。 SSEは、x86アーキテクチャに8の128ビットレジスタを新設し、浮動小数点演

  • http://pcjuornal.com/PCJ1/topics/P3_DDRSDRAM.html

  • おおいしゆうのASミュージックスコア登録CGI

    昨今CPUクロックとかFSBとかメモリクロックとかの関係が大変分かりづらいので、簡単にメモ CPUクロック ベースクロックの整数倍(or半整数倍) CPU-ノースブリッジ間(FSB) Pentium4から4倍速になっているので、FSB=ベースクロックx4。intelの表示だとFSBを1/4倍するとベースクロックが求まる。例えばCore 2 Duo E6600(2.4GHz FSB1066)のベースクロックは1066/4=266MHzで、CPUのクロック倍率は9倍。Core 2 Duo T7600(2.33GHz FSB667)はベースクロック166,倍率14倍。 Pen4以降バス幅は64bitなので、データ転送速度はCore2DuoT7600のケースで667Mx64bit/8=5.33Gバイト/s。 ノースブリッジ-メモリ間 SDRAMは表記そのまま。DDRはクロックの立ち上がり立ち下がり

  • さやいんげんの技術 MEMO irqbalanceサービスについて

    1.irqbalance概要 FedoraやRHEL,Suseなど多くのLinuxディストリビューションに標準実装されているデーモンで、マルチCPU環境において、IRQ割込み処理を複数のCPU間で負荷分散させることを目的としています。 2.詳細 Linux Kernelはデフォルトの状態では、CPU0のみでIRQ割込み(ハードウエアからの割込み要求)の処理を行います。しかしそれではIRQ割り込みが頻繁に発生する場合CPU0に負荷が偏りパフォーマンスが劣化する可能性があります。そこでマルチCPU環境でにおいてirqbalanceを導入することで、2nd CPU以降も割り込み処理を行えるようになります。 irqbalanceは、10秒毎に各CPUのIRQ割込み処理負荷状態状態に応じ、各CPUへのIRQ割込み処理の再配置をおこないます。CPUのIRQ割込み処理負荷状態は"/proc/in

  • Athlon II X4 605e BOXのレビューと評価: 【NDA指令】QuadCoreでTDP45W…だと!? [conecoクラブ]

    PCパーツ長者」のNDA付き緊急指令レビューです。 という事で今回エージェントとして、TDP45Wで4コアと言う驚異の省電力CPUの能力を調べてみました。 比較対象となるCPUはPhenomII X2 550BEです。 マシン構成 CPU Cooler:TITAN ENTERTAINER M/B:GIGABYTE GA-785GPMT-UD2H(BIOS:F1) Memory:OCZ Technology OCZ3G1600LV6GK(1枚利用) SSD:OCZ Technology OCZSSD2-1VTX30G PSU:Antec TP-650AP 省電力構成と言う事でHDDすら着けずに試してみました。 電源の変換効率は…ここまでいくと8割を余裕で切ってるかと思います。 第一印象 取り付けて起動、すんなりと動いたのでBIOS画面へ。 そこで驚いたのが、CPUの定格電圧が1.100V指

    kamipo
    kamipo 2009/11/13
  • ASUS M4A78 Pro のVcore電圧 - 日々是めもめも

    kamipo
    kamipo 2009/11/13
  • サーバの消費電力を測定する | Carpe Diem

    インフラエンジニアたるもの、自前でサーバを調達して運用している場合は、自分が使っているサーバの消費電力を測定することはとても重要です。サーバの消費電力が分からないと、ラックにあと何台のサーバを収めるか把握できません。 サーバの消費電力を計測するには、クランプメータという機械が必要です。 今回は、小型クランプメータの三和電気計器の DCL10 を購入してみました。これにした理由は、そこそこの精度で、価格も安いからです。あと、あわせてラインセパレーターもあわせて購入しました。ラインセパレーターを使うと、感度倍率を1倍あるいは10倍にして測定することができます。 もちろん、インフラエンジニアたるもの自分で持っていたいということで、自費で購入しました。 さっそく、このクランプメータとラインセパレーターを使って、業務で使用している DELL のサーバの消費電力を測定してみました。 測定方法は、次のと

    サーバの消費電力を測定する | Carpe Diem
  • Atomで検証! 小型PCの実用性

    sponsored 生成AI「Box AI」を組み込んだBoxの将来像も披露、「BoxWorks Roadshow Osaka 2024」レポート 大阪ガス、豊中市も登壇 西日に注力するBoxが大阪で大型イベント開催 sponsored MSIのNUC「Cubi NUC 1M」を徹底レビュー NUCはどれも同じではない!ちょっとした違いなのに大きく影響するポイントを見逃さずに選ぼう sponsored 浄土真宗親鸞会がネットギア「M4250」を導入、能登半島地震では「機動力の高さ」が生きる 大規模イベントの“ワンオペ映像業務”、実現したのはNDIとネットギアPro AVスイッチ sponsored JN-IPS238FHDR-C65W-HSPなら直販価格2万2980円 昇降式スタンドとUSB Type-C給電は後悔しないディスプレー選びの新要件! 2万円台前半でも探せばある sponso

    Atomで検証! 小型PCの実用性
    kamipo
    kamipo 2009/11/13
  • 【多和田新也のニューアイテム診断室】 TDP 45Wの低消費電力クアッドコア「Athlon II X4 605e」

    kamipo
    kamipo 2009/11/11
  • CPU TDP 一覧

    kamipo
    kamipo 2009/11/11
  • 仮想化技術の性能を向上させる、ハードウェア仮想化支援機能とは?(1/2) - @IT

    仮想化支援機能が仮想化の用途を広げる 仮想化技術歴史は古く、メインフレーム・コンピュータ時代から多くの環境でサポートされてきた。Windowsサーバ(PCサーバ)においても、1990年代から利用されていたものの、目的はサポートが終了した古いOS環境を新しいサーバで稼働させるためであったり、ソフトウェア開発の現場で仮想マシン上に開発環境やテスト環境を構築するためであったりと、その用途は限定されていた。これは、仮想化技術がコンピュータ・ハードウェア上に仮想的なコンピュータをソフトウェアで構築するという技術であるため、さまざまなオーバーヘッドが生じ、広く一般的な用途で利用するには性能面での制約が多かったためだ。 しかし「インテル バーチャライゼーション・テクノロジー(VT-x)」*1と呼ばれる仮想化支援機能の登場により、状況は大きく変わっている。VT-xは、VMM(Virtual Machin

  • フロントサイドバス - Wikipedia

    この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "フロントサイドバス" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL(2020年4月) フロントサイドバス (Front Side Bus, FSB) は、CPUバスの一種である。x86がシステム(ノースブリッジ)側と2次キャッシュ側にそれぞれCPUバスを持った際に、システム側のバスを指して命名された。 概要[編集] システム(ノースブリッジ)側と2次キャッシュ側にそれぞれCPUバスを持つ形態はPentium Proであらわれたが、Pentium Proでは2つの独立したバス、デュアルインディペンデントバス(Dual Independent

  • 革命の日々! SMPマシンでプロセスを特定のCPUにbindする

    taskset 0x00000001 ls taskset -p 0x00000003 12345 のように使う。 第一引数の0x00... というのがCPUマスク。 0x00000001 ならCPU#0のみ、 0x00000003 ならCPU#0とCPU#1. -p オプションでpidが指定できる。

  • 「複数CPUならload averageはCPU数で割れ」は正しいか?

    【この記事の所要時間 : 約 3 分】 「複数CPUで稼動するlinuxのload averageの目安はいくつだ?」という前から気になっていた疑問をLivedoor Knowledge で見つけたので、読んでみた。 snmpの.1.3.6.1.4.1.2021.10やuptimeやwで取得できる load averageで機器の負荷を監視しています。 昔どこかで、「搭載CPUの個数を目安に監視する」と聞き、 2CPUの機器は2.00を目安に監視していたのですが、 CPUの数にかかわらす1を超えてはいけないという 反論を頂きました。 複数CPUのload averageの目安に関する信頼できる団体によるソースを教えてください。 複数CPUで稼動するlinuxのload averageの目安に関する信頼できるソース つまり、 「2CPUならLoad Avarageの監視目安は2.0で、3CP