タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

ljに関するyukimori_726のブックマーク (1)

  • LJの力計算のSIMD化ステップ・バイ・ステップ その6 - Qiita

    はじめに そうとうがんばってSIMD化して、もう速くならないだろうと思ってたらkohnakagawaさんから「もう少し高速化しました」というプルリクが来て慌てた話。 その0 その1 その2 その3 その3.5 その4 その5 その6 ←イマココ コードは https://github.com/kaityo256/lj_simdstep においてある。 どこを直したか 一度に256ビット取ってくる命令を使うため、配列をパディングして、(x,y,z,0)という並びにしていた。それを4要素のベクトルとしてロードして、相対座標ベクトルを作るのだが、ループを4倍展開しているので、 (dx_1, dy_1, dz_1, 0)\\ (dx_2, dy_2, dz_2, 0)\\ (dx_3, dy_3, dz_3, 0)\\ (dx_4, dy_4, dz_4, 0)

    LJの力計算のSIMD化ステップ・バイ・ステップ その6 - Qiita
  • 1