タグ

ブックマーク / fjnl.hatenadiary.org (1)

  • MOVDQUの特性について - fjnlの生存記録のような何か

    IntelのOptimization Manualの2.2.5.1 Efficient Handling of Alignment Hazardsによると、NehalemCPUからMOVDQUの性能が向上したとあるので、実験してみました。 4パターンのmovを実行して速度差を見ます。alignedはアクセス先のアドレスが16バイトアライメントが取られているの意味、splitはアクセス先の領域(先頭+16バイト)がcache lineを跨ないの意味です。 aligned MOVDQA aligned MOVDQU not-aligned split MOVDQU not-aligned not-split MOVDQU 実行環境はCore i5 2.66GHzと、Core2 Duo 1.6GHzです。続きにあるアセンブラ片を300000000回実行しています。 Core i5 Core2

    MOVDQUの特性について - fjnlの生存記録のような何か
    mntone
    mntone 2012/05/25
  • 1