タグ

cpuとsimdに関するmoozのブックマーク (3)

  • Intel optimization

     Intelプロセッサ最適化マニュアルを読もう 今まである程度は読んでたけど, 『Intel 64 and IA-32 Architectures Optimization Reference Manual』を読み直して, 気づいたことなどをまとめてみようという試み. 今手元にあるのは248966-024 April 2011のもの. 日語版もありますが, 多少古いので英語版がよいでしょう. 表記について プロセッサと書いたり, CPUと書いたりします. Intel64をx64と書いたりします. 例えば3サイクルのことを個人的な慣習で3clkと書くことが多いです. すいません. 間違いなどございましたらメール(herumi@nifty.com)か@herumiにお願いします. 2章 Intel64/IA-32 CPUアーキテクチャ 2.1 Sandy Bridge概要 2.1.

    mooz
    mooz 2012/03/31
  • 研究動向から考えるx86/x64最適化手法

    2. Today Agenda 日の概要 CPU上のマルチコア化や,各種ペナルティの増大に対して,ペナルティの軽減, または完全に排除するデータ構造やアルゴリズムの研究に関する話題 ---- 日は2000年以降のIntel Lab.や関連研究者による成果の俯瞰が目的 スライドの目的は以下 ・マルチコア/メニーコア時代における性能改善観点の理解 ・具体例でのx86/x64最適化アルゴリズムの概要理解 ⇒探索,整数圧縮,並び替え処理 2 3. Today Agenda • 自己紹介 • Intel Lab.とは? • 最近の研究動向 • 研究分野における最適化の観点 – キャッシュミス/DTLBミスの低減化 – 分岐排除 – メモリバンド使用量の考慮 • 具体例1: SIMD命令を利用した探索の分岐排除 • 具体例2: 整数の固定長圧縮によるPipelineハザードの回避 • 具体例3:

    研究動向から考えるx86/x64最適化手法
  • SSE4.2の文字列処理命令の紹介

    1. SSE4.2の文字列処理命令の紹介 Cybozu Labs 2011/8/6 光成滋生(8/23加筆修正p3, p.25) x86/x64最適化勉強会#1 2011/8/6 /41 1 3. 説明とコード Intelプロセッサ最適化マニュアルを読もう http://homepage1.nifty.com/herumi/prog/intel-opt.html コード片 https://github.com/herumi/opti/ アライメントとページ境界に関する補足(必読) http://homepage1.nifty.com/herumi/diary/1108.html#8 2011/8/6 3 /41 4. SIMD向き/不向き SIMDは4個(or 8/16)個のデータを同時に同じよう に処理するためのもの SIMD向き 先程の最大値を求める場合,4個ずつやっ

    SSE4.2の文字列処理命令の紹介
    mooz
    mooz 2011/08/18
    SSE 4.2 の文字列処理命令
  • 1