タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

sseとsimdに関するdannのブックマーク (3)

  • SSE2命令(movdqu)を使用した128ビット単位のメモリ間転送プログラム - ちーちーの小ネタ部屋

    SSE2では、128ビット整数演算のSIMD命令の拡張が行われており、演算だけでなく、movdqa・movdquという命令を使うことで128ビット単位でメモリ間のデータコピーを高速に行うことができます。movdqaは転送対象のメモリのアドレスが16バイトの境界(アライメン ト)に揃ってる必要があります(アドレス値が16で割り切れる)。これに対して、movdquでは16バイトのアライメント制約はなく、どのアドレス値からでも読み書きできます。ただ、アライメントが揃っている分、CPUが処理しやすいため、movdqa命令の方が実行速度が速いです。速さを追求するならば、mallocや配列の確保時に16バイトのアライメントを意識する必要があります。各命令の基的な実行速度はIntelから以下の資料が出ていますが、この資料上ではmovdqa・ movdquのスループットとレイテンシは同じになってますね・

    dann
    dann 2011/11/02
  • 楓 software: x86 SIMD Technique アーカイブ

    2008年02月23日 はじめに イントリンシックで MMX や SSE が使えるようになり、手軽に SIMD が利用できるようになった。 でも、いざ使おうとするとどう書けばいいのかわからない場面に出くわすことが多い。 だからと言って、一度ばらして普通に処理すると遅くなってしまう。 ここでは SIMD 化するに当たって直面した問題を解決した方法や他のソースコードから学んだテクニック、検索して見つけたものなどをまとめて行こうと思う。 投稿者 Takenori : 20:48 | トラックバック 比較 SIMD の比較は、単にマスクを生成してくれるだけだ。 比較して分岐するなどは出来ない。 生成されたマスクを使って何とかするしかない。 これはいつも分岐で書いていると、どう書けばいいのかさっぱりわからない問題だ。 でも、これが使えると分岐を消して並列で処理できるようになる。 比較的わかりやすいで

    dann
    dann 2011/11/02
  • 東京工業大学 情報理工学院 数理・計算科学系

    大岡山地区の建物 大学正門より,桜並木のウッドデッキを通り,右手の芝生をつっきる小径が西8号館,西7号館に続くみちです. 大岡山西8号館(E棟,W棟): キャンパスマップの18, 19番の建物にあたります.館の西隣りに位置しています.正面玄関をはいったところは3階です. E棟においでの方は廊下をはいってすぐ左手のエレベータをご利用下さい. W棟にはじめておいでの方は十分に注意して下さい.E棟とW棟を繋いでいる通路は3階と10階にしかありません.E棟のエレベータを利用すると迷子になります.正面玄関から廊下をまっすぐにおいでになり,奥の右手にあるエレベータをご利用下さい. 西7号館:キャンパスマップの17番の建物にあたります.西8号館から,建物を二つ挟んだ並びにあります.芝生から向う場合,左手に館を見ながら進み,館がとぎれたあたりの右手にある小さな建物が西7号館です.橋を渡ってはいったと

    dann
    dann 2011/11/01
  • 1