タグ

cpuに関するsleepy_yoshiのブックマーク (8)

  • CPU とキャッシュのはなし - graphics.hatenablog.com

    別にグラフィックスに限ったことじゃないし、そもそも論文とか全然関係ないけど。GPU 周りでもたまに話題になるし、自分でもたまにわけわからんくなるから整理しとく。 メインメモリは遅い CPU からメインメモリにデータを読みに行く場合、これはとにかく遅い。例えばレジスタにあるデータを読みに行く場合と比べると、だいたい数倍から数100倍の遅さ。ヤバいからなんとかしよう。もっと早くアクセスできる場所にデータおいとこう。 キャッシュライン CPU がメインメモリからデータを読み出すとき、必ず小さなメモリチャンクをキャッシュ上にロードする。ロード単位はプロセッサによるけど、だいたい 8 ~ 512 バイト。このロード単位をキャッシュラインと呼ぶ。 アクセス対象のデータが既にキャッシュに載ってる場合は、メインメモリじゃなくてキャッシュを読みに行く。ない場合はメインメモリにアクセスするけど、そのデータはも

    CPU とキャッシュのはなし - graphics.hatenablog.com
  • マルチコア時代のロードアベレージの見方 - naoyaのはてなダイアリー

    ちょっと煽り気味のタイトルですが、CPU がマルチコアになり 2個、4個と増えていく中 Linux の負荷の指針になるロードアベレージをどう読むべきか、という話です。気になったところを少し調べたのでそのまとめを。 http://d.hatena.ne.jp/naoya/20070222/1172116665 でも書いたとおり、Linux のロードアベレージは「ロードアベレージは過去1分、5分、15分の間の実行待ちプロセス数の平均数 = 実行したくても他のプロセスが実行中で実行できないプロセスが平均で何個ぐらい存在してるか」を示す値です。ボトルネックが CPU、メモリ、ディスク等々どこにあるかは関係なく、仕事の実行までにどれぐらい待たされているかを示す値なので、システムのスループットを計測する指標の入り口になる値です。 このロードアベレージですが、実装を見るとランキュー(待ち行列)に溜まった

    マルチコア時代のロードアベレージの見方 - naoyaのはてなダイアリー
  • 最近のCPUの同期性能を調べてみた - maropuのメモ墓場

    この前調べごとをしているときにpthread_spinlockなるものがあることを知った. その時にpthread_mutex_lockとどちらを使えばいいんだろう?と疑問に思ったので少し調べてみた. 結果から言えば,たいていの場合はpthread_mutex_lockで良い,という安易な結果になってしまった. /*--- 以下詳細 ---*/ 一般論ではロック期間が短いときにspinlockのほうが良い、といわれるので期間が短いロックにおける簡単な性能評価を行った. 使ったプログラムは以下. https://github.com/maropu/lockbench 単一アドレス上に存在する値を同期的にインクリメントするだけの簡単なプログラム.評価指標はthread数(# of threads/x-axis)を変化させた場合の,clock()が返す単体tickあたりの平均インクリメント回数(

    最近のCPUの同期性能を調べてみた - maropuのメモ墓場
  • PopCntの速度再び2011 - 小宮日記

    3年ほど前、popcntの速度を調べたことがありますが http://d.hatena.ne.jp/mkomiya/20070905/p1 bitを数える http://vivio.blog.shinobi.jp/Entry/137/ ふと思い出したので、またちょっと調べてみました。 以前は、ビット数少ないとアセンブラ速いけど 表引きC言語は安定してるよね 的な幕引きでしたが、 アセンブラでマジックで計算するコードをサイボウズラボの人が書いていたので、 http://developer.cybozu.co.jp/takesako/2006/11/binary_hacks.html それを加えてみます。 あと、団子の人のSSEコードもあったのでそれも追加。 LS3600さんが、SSE4.2でPopCntの使い方も紹介されてましたが、 今使ってるマシン(core2duo E7500)がSSE4

    PopCntの速度再び2011 - 小宮日記
  • 研究動向から考えるx86/x64最適化手法

    Pythonの処理系はどのように実装され,どのように動いているのか? 我々はその実態を調査すべくアマゾンへと飛んだ.kiki utagawa

    研究動向から考えるx86/x64最適化手法
  • usyWiki

    2022-03-02 富士通 PRIMERGY TX1310 M3 2022-02-11 HYUNDAI 24型液晶モニタ(W241DG、W240D) 2022-02-05 富士通 PRIMERGY TX1310 M1 2021-11-15 ホストバスアダプタ(HBA)のまとめ 2021-11-11 富士通 PRIMERGY TX100 S3p 2021-11-07 HDDメーカーによるRMA保証 2021-07-10 NEC/Express5800 2021-06-28 リムーバブルHDDケース 2021-06-13 アナログHDD・DVDレコーダー/HDD&DVD換装 2021-05-10 Lenovo ThinkServer TS140 2021-04-22 HP ProLiant ML110 G7 2021-04-02 HDD内蔵 液晶TV/HDD換装 2021-01-23 Cas

  • Intel、型番では分かりづらかったCPUの性能を「5つ星」でランク付け

    IntelがCPUのラインナップを分かりやすく性能別に「5つ星」でランク付けしました。 ランク付けではデュアルコアCPUの「Core 2 Duo E8000」シリーズがクアッドコアCPUの「Core 2 Quad Q8000」シリーズよりも性能面で上回るとされているなど、型番を一見するだけは性能を理解できなかったIntelのCPUを見分けるヒントとなっています。 詳細は以下の通り。 Processor Ratings - Intel このページによると、今回Intelが行った現行CPUのランク付けは以下の5段階。 ★★★★★:処理速度を最大にする究極の技術を採用した最上位モデル ★★★★☆:高度な技術を採用することで、快適な速度を実現したモデル ★★★☆☆:省エネルギーに長けたスマートなモデル ★★☆☆☆:信頼性が証明されたモデル ★☆☆☆☆:信頼性と価格を両立させたモデル ランク付けはこ

    Intel、型番では分かりづらかったCPUの性能を「5つ星」でランク付け
  • インテルCPUの大きな転換点に立つNehalem (1/3)

    IDF上海の技術セッションにて、米インテル社の次世代CPUの「Nehalem」(ネハレム、ネヘレム)の内部アーキテクチャーの解説が行なわれた。Nehalemは、現行のPenryn(ペンリン)世代のCore 2 Duoプロセッサーと比べると、マイクロアーキテクチャー自体に劇的な変化はないが、地道な改良によりパフォーマンスが向上している。 特に大きな変更点は、CPUのハードウェア構成面にある。基調講演のレポート(関連記事)と重複するが、IDFの資料を元に、Nehalemの姿を明らかにしていこう。

    インテルCPUの大きな転換点に立つNehalem (1/3)
  • 1