タグ

cpuに関するgfxのブックマーク (13)

  • ARMアーキテクチャ - Wikipedia

    ARMアーキテクチャ(アーム[2][3][4][5]アーキテクチャ) とは、ARMホールディングスの事業部門であるARM Ltd.により設計・ライセンスされているアーキテクチャである。組み込み機器や低電力アプリケーションからスーパーコンピューターまで様々な機器で用いられている。 概要[編集] ARMアーキテクチャは消費電力を抑える特徴を持ち、低消費電力を目標に設計されるモバイル機器において支配的となっている。アーキテクチャの命令セットは「(基的に)固定長の命令」「簡素な命令セット」というRISC風の特徴を有しつつ、「条件実行、定数シフト/ローテート付きオペランド、比較的豊富なアドレッシングモード」といったCISC風の特徴を併せ持つのが特徴的だが、これは初期のARMがパソコン向けに設計された際、当時の同程度の性能のチップとしてはかなり少ないゲート数(約25,000トランジスタ)で実装され

    gfx
    gfx 2013/10/02
  • 【連載】セカンド・オピニオン

    エンジニア出身の大原雄介氏による技術連載。技術の「理想」よりも、その「実装」に興味があると語る著者。コンピュータについて、他では読むことのできない深い内容と意外な視点を以て、独自の技術論を展開します。

    【連載】セカンド・オピニオン
    gfx
    gfx 2012/05/17
  • 【再録】コンピュータアーキテクチャの話(6) キャッシュの構造(基礎編) - どういう単位でキャッシュに入れるのか?

    連載はHisa Ando氏による連載「コンピュータアーキテクチャ」の初掲載(2005年9月20日掲載)から第72回(2007年3月31日掲載)までの原稿を再掲載したものとなります。第73回以降、最新のものにつきましては、コチラにて、ご確認ください。 キャッシュって何だろう? 性能の観点でCPUの仕様を見るとき、コア数、クロック周波数の次に来るのがキャッシュの容量というのが一般的であるが、キャッシュとはどういうもので、どう動くのかについてはあまり理解されていないように思われる。そこでこの一連の連載ではキャッシュについて述べようと思う。 プロセサのクロックが16MHz(GHzでは無い!)程度であった1980年代半ばまではDRAMメモリのアクセス時間も5サイクル程度であり、データをDRAMまで取りに行くことは大した問題では無かった。しかし、プロセサのクロックが1GHzを超えると、プロセサのクロ

    【再録】コンピュータアーキテクチャの話(6) キャッシュの構造(基礎編) - どういう単位でキャッシュに入れるのか?
    gfx
    gfx 2012/02/23
  • __builtin_expectの効力 - 初学者の箸置

    RLogをいじってて知った__builtin_expectを試してみた。__builtin_expectはある式がほとんどの場合に決まった定数になる、と言う場合に分岐予測のヒントなどを与えて高速化を計るためのgccディレクティブだそうな。 RLogはdormant(休眠)状態のログファシリティに最適化してあって、プロダクションコードにログコードを残しっぱなしでもさほどデグレしないのが売りなんだけど、そのカラクリがこれ。 で、RLog自身についてはあとで書く。 どうかく? 具体的には __builtin_expect(A,B)と書いた場合 Aが定数 Bである事を期待する、というヒント情報になる。 例えば、比較演算子がほとんどの場合成り立たない、と言う場合 __builtin_expect(, 0) となる。 #include <stdio.h> #ifdef EXPECT #define E

    __builtin_expectの効力 - 初学者の箸置
  • お安い GPU で強固なパスワードも用無しに | スラド セキュリティ

    大文字小文字に数字をまぶしたパスワードはブルートフォースアタックに対して強固であると言えるだろうか。強固であるとお考えの方はご再考を (ZDNet の記事、家 /. 記事より) 。 PC Pro Blog の記事にて、GPU を用いたパスワードクラックツール ighashgpu とお安い GPU (1 〜 2 万円で購入できる RADEON HD 5770) の組み合わせで総当たり試行を行った結果が掲載されている。CPU を用いた場合、1 秒間に 980 万パターンの試行が可能であり、5 文字の NTLM ログインパスワードは 24 秒で突破された。一方 GPU では 1 秒間に 33 億パターンほど。パスワードを 6 文字にすると CPU では突破に 90 分ほど要したが、GPU ではたったの 4 秒。7 文字になると CPU では 4 日間かかったが、GPU では 17.5 秒で突破

  • javascript - jslinuxをローカルで : 404 Blog Not Found

    2011年05月19日09:00 カテゴリ javascript - jslinuxをローカルで 先週末から体調不良なので、今話題のjslinuxと戯れてみた。 http://bellard.org/jslinux/ ブラウザでJavaScriptが動く時代がやってきた! - 葉っぱ日記 もとのディスク容量が少ないので、適当な母艦を用意して、こんな感じ で新しいディスクイメージ作って、CocProxy や Fiddler の AutoResponder を使って root.bin へのリクエストをローカルのファイルに差し替えてやれば、好きなファイルも入れられますね。 それだと環境を整えるのが面倒なので、以下のようにして必要なファイルを全てローカルにもってきてもOKだった。 index.html linuxstart.bin vmlinux26.bin root.bin あとは root.b

    javascript - jslinuxをローカルで : 404 Blog Not Found
  • 開発メモ: Kyoto Cabinetのロック機構の改善

    Kyoto CabinetはIO負荷が高い場合にCPU負荷も高くなりがちだという指摘を受けて、それを解決すべくロック機構を見直したという話。 スロットロック ハッシュテーブルの操作はハッシュバケット毎に完全に独立して実行できるのが強みだ。ハッシュテーブルは計算量が有利なだけでなく、並列性にも優れるということ。実際には下層のファイルIOで実装依存の排他制御が行われることになるが、ハッシュ層だけ見れば理想的な並列性を備えている。ただし、同じバケットに連なるレコード群の操作は互いに依存関係があるので、それらは一括して排他制御してやる必要がある。となると、バケット毎にロックを用意するのが理想だが、実際にはメモリを節約するために、予め決めた数のロックを用意して、ここのロックに複数のバケットを割り当てる構成をとる。リソース空間をスロットに分けるというイメージから、これをスロットロックと呼ぼう。 スロッ

    gfx
    gfx 2011/02/13
    "ほとんどブロックしないユースケースでは自作スピンロックの方が効率が良いのだが、それなりにブロックが発生する場合にはやはりOSのrwlockの方が総合的に得であると判断した"
  • 第16回 64ビット化への遠い道程[その1] | gihyo.jp

    一方、ロングモードに入るとアドレス長が64ビットに拡張され、新たに追加された64ビットの汎用レジスタも使えるようになります。また、ロングモードの中には32ビットのバイナリを動かす互換モードも用意され、このモードを使えば既存の32ビットのバイナリもそのまま動かすことができるようになっています。 こう書けばいいことづくめのように聞こえますが、そもそもロングモードに入るためにはカーネル自体がx86-64用にコンパイルされて、x86-64のロングモードのことを知っていなければいけませんし、カーネルをx86-64用にコンパイルするためには、コンパイラやアセンブラがx86-64用に拡張されたコマンド(オペコード)を生成できる必要があります。すなわちx86-64 CPUの新機能を利用するには、まずx86-64用の開発環境を用意する必要があるわけです。 x86-64用開発環境の選択 x86-64用の開発環

    第16回 64ビット化への遠い道程[その1] | gihyo.jp
    gfx
    gfx 2010/11/17
  • 分岐予測 - Wikipedia

    コンピュータ・アーキテクチャにおける分岐予測(ぶんきよそく、Branch Prediction、ブランチプレディクション)とは、プログラム実行の流れの中で条件分岐命令が分岐するかしないかを予測することにより、命令パイプラインの効果を可能な限り維持し、性能を高めるためのCPU内の機能である。 概要[編集] 2方向分岐は一般に条件分岐命令で実装されている。条件分岐は、分岐せず (not taken) に分岐命令直後に続く命令の流れをそのまま実行し続ける場合と、分岐して (taken) プログラム内の異なる位置に分岐してそこから命令実行を続行する場合がある。 図 1: 4段パイプラインの例。色つきの四角形が命令を表している。 条件分岐命令が分岐するかしないかは、分岐条件を計算し、条件分岐命令が実行ステージ(図1の Stage: 3)を過ぎるまでわからない。 分岐予測を行わない場合、条件分岐命令が

    分岐予測 - Wikipedia
  • CPUの使用率におけるsystemとfork Re: クラウドがネットワークゲーム開発者にもたらしてくれたもの - blog.nomadscafe.jp

    追記 元記事はDBサーバだったようですね。読んでないのバレバレでした。ただ、アプリケーションサーバでforkを多用しサーバが重いケースは何回か見てきているパターンなので負荷の高いアプリケーションを作成するときの要注意ポイントとして読んでいただければと思います。 /追記 クラウドがネットワークゲーム開発者にもたらしてくれたもの - Keep Crazy;shi3zの日記 クラウドはあまり関係がないんだけど、CPUのSystemを使い杉ってことで、どういうことをやるとSystemを使うのか再現実験。おそらくfork(2)が原因だと予想。flashの生成でswfmillコマンドを叩いているとか 以下のコードは無限ループでforkを行っています。子プロセスは何もせずにすぐに終了し、親プロセスは子プロセスの終了を確認した後、すぐにforkを行います。 #!/usr/bin/perl use stri

    gfx
    gfx 2010/08/26
  • 今更Sleepの解説するなんて、と思うのです。

    概要 最近、Sleep関数について、誤解をしていると思われる記述を多く見かけるようになりました。記事では、間違った使用方法を例に挙げ、何が間違っているのか、どう使うべきなのかについて、考察します。 はじめに いくつかの掲示板で、Sleep関数の使い方を誤解しているのではないかと思われる質問を目にしました。その時は、「解説者はわかっているからいいか」と思っていたのですが、解説記事において間違った使い方をしている記事を目にしました。その為、誤った使い方の実例を元に、何が、何故、間違っているのか解説を行います。 記事の実行環境について 記事では、論理CPU数が2個の環境を想定しています。記事で提示するコードを論理CPU数が3個以上の環境で実行する場合、スレッド数を増やして実行してください。 記事で使用するコードは、Visual C++ 2008 にて作成しています。OpenMP をサポ

  • 1GBレンタルサーバー・プロバイダー Amusement BiG-NET | www11.big.or.jp/~kkk/pico/?date=20100127

    こちらは独自ドメインからレンタルサーバー、フレッツ接続専用会員までトータルサポートのプロバイダー、BiG-NETです。 いつも弊社ユーザーのページにアクセスをして頂きましてありがとうございます。 http://www11.big.or.jp/~kkk/pico/?date=20100127 403 Forbidden (動作禁止です) 申し訳ございませんが、お客様がアクセス要求されました上記ページは、現在アクセスが出来ません。 弊社では、なぜアクセスできないのかと言う第三者からのお問い合わせにはお答えすることが出来ません。 もしこのページの関係者をご存知でしたら、連絡を取ってみることをお薦め致します。 何卒ご容赦下さい。

    gfx
    gfx 2010/01/31
  • データ型のアラインメントとは何か,なぜ必要なのか?

    以前このサイトとブログに,何度かアラインメントに関する記事を書きました (サイト内関連ページ参照). そのせいか「アラインメント」で検索して来てくれる人が多いので, 過去の記事に加筆修正してこのページを新たに作成しました. 加筆した点は次のとおりです. アラインメントとメモリアクセス回数の関係をわかりやすくするため, (ほんの少し) 図を導入しました. 「データがアラインされていないとメモリアクセス回数が増える」 と言葉で説明しているサイトは多いのですが, 図で示しているところはまだ見たことありません. アラインされていないアドレスにデータを書き込む場合, 読み出しの場合以上にメモリアクセス回数がかかる可能性があることを追記しました. 以前は「複合データ型 (配列,構造体,共用体) のアラインメント」はほとんど自明のことだと思っていたので軽く流していましたが, 意外なことにこれを解説してい

    gfx
    gfx 2009/12/28
    rubyのオリジナル実装(MRI)はmalloc()の返却アドレスの下位数ビットが0であることを前提としているのだが、そういう前提を持っても大丈夫なのはこういう理由だったのか。
  • 1