タグ

x86に関するhts1004のブックマーク (22)

  • ARM は本当に消費電力が小さいのか

    最近,スマートフォンやタブレットでの躍進が著しい ARM.その要因の一つとしてよく取り上げられるのが低消費電力. そこで気になるのが,どの程度電力効率が優れているのか.今回は,そのあたりを定量的に分析した論文をご紹介. Power Struggles: Revisiting the RISC vs. CISC Debate on Contemporary ARM and x86 Architecturs [キャッシュ] http://research.cs.wisc.edu/vertical/papers/2013/hpca13-isa-power-struggles.pdf 特定のプロセッサではなく,x86 と ARM に対して総合的に電力比較をするのは難しいため,この論文では命令セットの優劣に対象を絞っています. 実際のプロセッサ性能に大きな影響を与えるマイクロアーキテクチャにも触れら

    ARM は本当に消費電力が小さいのか
  • x86/x64最適化勉強会5 レポート - Cybozu Inside Out | サイボウズエンジニアのブログ

    こんにちはサイボウズ・ラボの光成です。 今回は3月30日に開催された「x86/x64最適化勉強会5」の模様についてお伝えします。 x86/x64最適化勉強会会場 プログラム開発においては、開発の段階において早すぎる最適化は悪、当に必要になってから最小限だけ行いなさいと言われています。 また今どきのコンパイラは優秀なので、下手な小細工はせずにコンパイラに任せておくのがよいとも言われています。 もちろん一般的にはそれは正しいのですが、普段動画や音声を利用するときに使われているコーデック、ネット上での決済時に利用される暗号ライブラリなどは、人の手によるアセンブリ言語で開発されていることが多いのもまた事実です。 私が主催しているこの勉強会はそういう下回りのライブラリを開発するときに必要な技術や情報の交換のために行っています。 ustreamで過去の会の動画も含めてみることができます。 以下、やや

    x86/x64最適化勉強会5 レポート - Cybozu Inside Out | サイボウズエンジニアのブログ
  • Bulldozer入門

    ふたつのコアで1モジュールを構成する それぞれのコアは、4の整数パイプと、L1D を持つ 整数は、基的な演算+メモリアクセスを実行するAGLUx2 と、パイプごとに対応する命令を実行するEXx2の4 L1I、Fetch、Decode、L2、FPUはふたつのコアで共有されている L1I->Fetchは32Byte、4命令デコード/clk FPUは、4が色々と命令できて、うち2が128bit FMAを実行できる 思想としては、 FPUはリソース多く使うので無駄遣いしないように実行効率を上げたい → FPUをヘヴィに使うプログラムでは HT みたいになる 整数は軽いのでたくさん入れたい → サーバー等ではHTよりも絶対性能高い ということなんだと思われる。 命令単位ベンチマーク 実際どうなっているか命令単位でベンチマークしてみる ソース(Win32 cl.exeが必要) 手元(A8-4

  • x86 CPUの進化を拡張命令のロードマップでひもとく (1/4)

    今回からは趣向を変えて、x86の拡張命令の変遷を、ロードマップでひもといてみよう。「CPUGPUと来たら、次はチップセットじゃないの?」と言われそうだが、担当編集が失念していたようだ。というわけでチップセットは今後のテーマとしたい。 そもそも拡張命令とはなんぞや? 拡張命令の話を始めると、実は長い。そもそも「拡張」を議論するには、「元になるのは何か」をきちんと決めないといけない。一般にx86命令というとき、それは「80386」の命令を指していると思われがちだが、これはあまり正しくない。結果から言えば、「Pentium Pro」から始まるP6アーキテクチャーの命令が、事実上の標準になっている。 命令セットを見てみると、以下のような命令が80386の命令に追加される形でx86命令として定義されており、これを拡張命令とみなすかどうかで、話がちょっと変わってくる。 80486で追加 BSWAP・

    x86 CPUの進化を拡張命令のロードマップでひもとく (1/4)
  • 研究動向から考えるx86/x64最適化手法

    2. Today Agenda 日の概要 CPU上のマルチコア化や,各種ペナルティの増大に対して,ペナルティの軽減, または完全に排除するデータ構造やアルゴリズムの研究に関する話題 ---- 日は2000年以降のIntel Lab.や関連研究者による成果の俯瞰が目的 スライドの目的は以下 ・マルチコア/メニーコア時代における性能改善観点の理解 ・具体例でのx86/x64最適化アルゴリズムの概要理解 ⇒探索,整数圧縮,並び替え処理 2 3. Today Agenda • 自己紹介 • Intel Lab.とは? • 最近の研究動向 • 研究分野における最適化の観点 – キャッシュミス/DTLBミスの低減化 – 分岐排除 – メモリバンド使用量の考慮 • 具体例1: SIMD命令を利用した探索の分岐排除 • 具体例2: 整数の固定長圧縮によるPipelineハザードの回避 • 具体例3:

    研究動向から考えるx86/x64最適化手法
  • 初めて読むMASMはとっても良い本。 - big-eyed-hamster’s diary

    私の所属する研究室内では、Linuxカーネル読書会なるものをやっている。教材は詳解Linuxカーネルの第3版。このは-読んでみると分かるが-x86依存の話が非常に多い。スケジューラの話のあたりになると、Gnu Assemblerなどという暗号(!)でガシガシ書いてあるので、もう訳がわからない。この辺のソースコードの様子は、id:naoya さんのLinux カーネルのコンテキストスイッチ処理を読み解くを見ていただければ分かると思う。そうなってくると、必然的にx86の副読を買わねばならぬ、となるわけだが、x86を知らない人がいきなりはじめて読む486―32ビットコンピュータをやさしく語るを読むと、多分多くの人が挫折してしまうだろう。というか、私がした。確かに良い(だと思われる)んだけれど、前提知識が足りないと、所々でつまってしまって、読むスピードが落ちて、あああ、、、僕はダメな子だ、、

    初めて読むMASMはとっても良い本。 - big-eyed-hamster’s diary
  • SSE4.2の文字列処理命令の紹介に関する補足(アイランとページ境界)

    x86/x64最適化勉強会1 なんとか無事終了. ustがうまくいったりいかなかったり, 運営が手間取ったりと申し訳ない. 主催するというのはたいへんだなあ. 名前だけはwebなりでよく見かけていたけど会ったことなかった方々に会えたので満足. でもこれまた初めてお会いした@takehiro_tさんとは殆どしゃべれなかった. 残念. 個人的にはw_oさんのベンチマークの結果から理由を探していく部分が興味深かった. 反省点 : 発表の間は5分マージンを入れておく. タイマーあるとよさげ. とりあえずいくつかの資料へのリンク(uploadされれば随時更新). herumi : 条件分岐とcmovとmaxps m_asama : IA32/Intel64におけるキャッシュ利用最適化 sinya8282 : 開発中のJIT版grepの苦労話 TAKESAKO : ビットを数える herumi

  • Androidをx86パソコンで動かしてみよう(Android 2.2/2.3編)

    皆さんこんにちは。ミラクル・リナックスの天野光隆です。日経Linux誌では時々登場させていただいてますが、ITproでの寄稿は初めてになります。ミラクル・リナックスは、LinuxサーバーOSや、デジタルサイネージソリューションの開発、販売を行っている会社で、私は組み込み関連の開発を行っています。 Androidは携帯電話のOSというイメージがありますが、普通のパソコンでも動作します。以前にも「話題の携帯向けOS「Android」をx86パソコンで動かしてみよう」という記事がITproに掲載されましたが、今回はより新しいバージョンのAndroidを動かしてみましょう。 「Android 2.3(開発コードネーム:Gingerbread)」は2010年12月に米Googleが正式リリースした、携帯電話向けAndroidの最新版です。前バージョンである「Android 2.2(開発コードネーム:

    Androidをx86パソコンで動かしてみよう(Android 2.2/2.3編)
  • エンジニアなら知っておきたい仮想マシンのしくみ 記事一覧 | gihyo.jp

    運営元のロゴ Copyright © 2007-2024 All Rights Reserved by Gijutsu-Hyoron Co., Ltd. ページ内容の全部あるいは一部を無断で利用することを禁止します⁠。個別にライセンスが設定されている記事等はそのライセンスに従います。

    エンジニアなら知っておきたい仮想マシンのしくみ 記事一覧 | gihyo.jp
  • 蹴茶: Intelの我が世の春は終わるのか?

    もしIntelの春が終わるとしても当分先の話だと思いますが、そんなARMとNVIDIAとWindowsにまつわるコラム 2。 → 笠原一輝: MS副社長に聞く、ARM版Windowsの正体 → 後藤弘茂: NVIDIAが高性能ARMコアを開発統合する「Project Denver」 私はIntelが変態じみた半導体製造能力で今後もx86でゴリ押しまくると思ってましたので、まさかARM版のフルWindowsが出てくる展開になろうとは思いもよりませんでした。IntelもかつてARM製品を抱えてましたが、ARM再参入なんて展開があるのでしょうか。カニバるリスクと天秤にかけて色々議論してそうです。 面白い展開とはいえ、笠原さんが書かれているようにまだx86版Windowsとどう繋ぐのかが未知数なので、無事にARM版Winが立ち上がってx86版と競り合っていけるのかはわからないところです。 パター

  • IBM Developer

    IBM Developer is your one-stop location for getting hands-on training and learning in-demand skills on relevant technologies such as generative AI, data science, AI, and open source.

    IBM Developer
  • GCC Inline Assembler

    "asm"と"__asm__"は、基的には同じであるが、"__asm__"は使用している言語の予約語/関数等とぶつかる場合使用します。またはANSI C互換のコードをつくっている場合、"asm"キーワードが使用できなくなるので"__asm__"を使います。 /* keyword asm と同じ関数*/ function asm(void){ } /* asmが使用できないので__asm__を使用 */ function inline(){ __asm__("asm code"); }

  • 【特集】完全版!! 「Core i7」極限検証 - 内部アーキテクチャ解析編 (1) CPU Core部分 (1) | パソコン | マイコミジャーナル

    さて、簡単な性能評価は既に示した通りなので、ここから何時も通り内部をもう少し細かく精査して行きたいと思う。内部構造そのものの概略は今年4月のIDF Shanghai 2008で公開されており、筆者も簡単にレポートしたので、この内容の正当性を含めて検証して行きたい。 ■関連記事 ・【特集】完全版!! 「Core i7」極限検証 - 総合性能プレビュー編 Photo01: テスト用に「Intel X58SO」を買い増し。今回もスタッフ見習い達が検品(?)を担当。「なんだこれ」「美味しくないぞ」 Photo02: 「中も美味しくない」「なーんだ」「なーんだ」「なーんだ」……DX58SOはべ物ではありません CPU Core部分 まずは大雑把に、従来のCore 2とCore i7の内部構造の違いをまとめてみたい。図1が従来のCore Microarchitecture(以下Core

  • IBM Developer

    IBM Developer is your one-stop location for getting hands-on training and learning in-demand skills on relevant technologies such as generative AI, data science, AI, and open source.

    IBM Developer
  • 【マイコンデータ室】その他のx86系プロセサの系譜

    x86系プロセサのメーカーは,米Intel Corp.と米Advanced Micro Devices, Inc.だけではない。実際には,それ以外の半導体からも数多くの製品が発売されている。開発していたというレベルで言えば,軽く10社を超えるメーカーがx86系プロセサを手掛けていたはずだ。ただし,「実際に量産品を出荷したメーカー」となると,その数は半分以下になる。その中で「自社で製品を設計したメーカー」となると,その数はさらに減る。 「Blue Lightning」と呼ばれたコア その中で,まず名前が挙がるのが米IBM Corp.である。IBM社はIntel社からライセンスを受けて,Intel社のコアをそのまま生産するだけでなく,コアを独自に改良したプロセサを製品化していた。デスクトップ・パソコン向けには,Intel社の「386DX」をベースにした「IBM486DLC」や「IBM486DL

    【マイコンデータ室】その他のx86系プロセサの系譜
  • Win32デバッグ(9)・・・逆アセンブラ: vanillaの日記

    各逆アセンブラライブラリの詳細については、各ライブラリのサイトを参照。ここではどのライブラリを使うかだが、ここでは上記の1つであるHacker Disassembler Engine(HDE)を使うことにした。理由は最終更新日が最近(2009年3月)であるのと、軽量である点だ。他のライブラリは結構高機能で逆アセンブルした機械語をアセンブラのニーモニックのテキスト形式に変換できたりするが、今回はx86命令のRET命令を検出できればよいので、命令長やオプコードなど最小限の情報だけを取得できるHDEにした(ちなみに、上記BeaEngineのサイトにLength Disassemblerというものもあるようだ・・)。 次に、新しいクラスを設計するが、その前にx86命令の大まかな命令フォーマットを知らないと設計できないので、x86命令の命令フォーマットを少し。x86命令の命令フォーマットは次のように

  • Assembly Programming Linux

    はじめに. アセンブラを使って Linux のプログラミングで遊んでみます.アセンブラには NASM を使用して,カーネルを直接利用することにします. いまさらアセンブラでプログラムを作成することは,時代錯誤と感じる人も 多いかもしれません.「アセンブラでプログラミングなんて職人芸でしょう」 と思うかもしれません. 20年前では趣味のプログラミングは BASIC か アセンブラしか選択肢がありません でしたが,今ではPerl, Ruby からアセンブラまでの間に非常に多くの言語があって, アセンブラは普通では不要な最下層の知識となっていると思います. 10BaseT のツイストペアケーブルのインピーダンスを気にする人はほとんどいない ようなものでしょうか? アセンブリ言語の学習で最も困難なのは,最近では書籍が見つからないこと かもしれません. …と書いていましたが、また増えてきているようで

  • x86系CPUのネイティブコードを解析する

    CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

    x86系CPUのネイティブコードを解析する
  • 頭脳放談 第99回 x86プロセッサをいっぱい並べたら何になる? - @IT

  • IA-32 SIMDの扉

    SIMD命令およびアセンブラの基礎 SIMDとは 用語集 開発環境 アセンブラの基礎知識 x87 FPU命令を使用したプログラミング CPUの識別 メモリアドレスのアライメント ラップアラウンド算術と飽和算術 SIMD命令セットの分類と歴史 SIMD命令セットの記述方法 SIMD命令セットの概要 MMX命令セットの概要 SSE命令セットの概要 SSE2命令セットの概要 SSE3命令セットの概要 SSE4命令セットの概要 命令リファレンス データ転送命令 算術命令 比較命令 論理演算命令 シフト命令 シャッフル命令 パックおよびアンパック命令 変換命令 挿入および抽出命令 ブレンド命令 丸め命令 キャッシュ制御命令 その他の命令 プログラミング例 画像処理 音声信号処理 参考資料 参考資料 トップSIMDの扉