タグ

simdとintelに関するyassのブックマーク (6)

  • 或るプログラマの一生 » AVX-512 がアナウンスされていた

    x86/x64 最適化勉強会 #6 で聞いてきましたが、AVX-512 なるものがアナウンスされてました。名前から予想される通り、SIMD レジスタが 512bit になります。SIMD レジスタが 512bit というと Xeon Phi は最初からそうなっているのですが、これが普通の Xeon に降りてくるイメージです。 AVX が「単なる legacy SSE の 256bit 版」ではないのと同様、AVX-512 も「単なる AVX の 512bit 版」ではありません。 SIMD レジスタが zmm という名前で 512bit になる。下位 256bit は ymm としてアクセスできる(xmm に対する ymm と同じ) 64bit モードの場合、SIMD レジスタが 32使える。これは、zmm だけでなく ymm や xmm でも同様である。32bit モードでは8のまま

    yass
    yass 2014/01/09
    " SIMD レジスタが 512bit になります。SIMD レジスタが 512bit というと Xeon Phi は最初からそうなっているのですが、これが普通の Xeon に降りてくるイメージです。"
  • 組み込み関数(intrinsic)によるSIMD入門

    6. 目標目標 OpenCVによりも高速なプログラムを簡OpenCVによりも高速なプログラムを簡 単につくれる書き方を覚えよう単 くれる書き方を覚えよう 出来るようになること ・高速コピー src.copyTo(dest);高速コピ src.copyTo(dest); ・高速な加減乗算 dest = src1 + src2; ・高速型変換 src.convert(dest,CV_16U); ・高速BGR2RGB cvtColor(src,dest,CV_BGR2RGB); ・高速BGR2Gray cvtColor(src,dest,CV_BGR2Gray); ※出来ないこと 整数演算だけ 浮動小数点の命令は使わない 比較演算は使整数演算だけ,浮動小数点の命令は使わない,比較演算は使 わない,水平演算は使わない,AVXは含まない(SSE4.1まで) 7. 目的目的 を使えば 化は難しくないよ

    組み込み関数(intrinsic)によるSIMD入門
  • SSEとAVXで高次元ベクトルの内積計算を高速化してみた | さかな前線

    世界最速のお魚と言えばカジキ類で,泳ぐ速度は時速100km/hを超えるとか.55ノット程になるのでこれはMk-48魚雷にも匹敵するほどです. 一方ちょっとチートな高速お魚としては,お馴染みトビウオが飛行中に最大70km/hほどに達するとか. 今日はそんな若干チートな高速化のお話(?)ということで,SSE組み込み命令について. SSEやAVXといえばお馴染みSIMD命令で,それをプログラムから構造体と関数の形式で高移殖に記述する方法がSIMD組み込み関数(SIMD Intrinsic)なわけですが,これを使ってごく典型的なベクトルの内積計算を高速化してみました. ベクトルの内積の高速化と言えば星の数ほどもされてる話なわけで,いまさら魚の情報なんか役に立つ気は全くしないのですが,純粋に自分でやらないとわかんない>< ということで, とにかく書いてみよう 効果の程はいかに? を調べてみたくて,や

    yass
    yass 2013/08/13
    " SSEやAVXといえばお馴染みSIMD命令 / これを使ってごく典型的なベクトルの内積計算を高速化 / 最大で10倍のスループットというのは驚き / 8192次元,データ量にして8192*sizeof(float)*2=64KBに達すると,速度差がなくなってますね"
  • https://bugs.java.com/?bug_id=7121648

  • Yaminabe simd

    Yaminabe simd 1. Intel AVX で SIMD 入門 2012/9/15 (Sat) 第2回 闇鍋プログラミング勉強会 Yuki Kawaguchi 1 2. 自己紹介名前: Yuki Kawaguchitwitter: @kawa0810はてな id: kawa0810・学生時代の研究 並列・分散処理,GPGPU,数値計算関係・仕事 orz バックアップソフトの開発・サポート 2 3. 自己紹介名前: Yuki Kawaguchitwitter: @kawa0810はてな id: kawa0810・学生時代の研究 並列・分散処理,GPGPU,数値計算関係・仕事 バックアップソフトの開発・サポート 3 4. 題4 5. SIMD とは?・Single Instruction Multiple Data・1回の命令で複数のデータを処理する命令形式 配列 x と配列 y

    Yaminabe simd
  • CompProBeta11.0_Customer_Presentation.ppt

    Intel、インテル、Intel ロゴ、Intel Atom、Intel Core、Xeon は、アメリカ合衆国およびその他の国における Intel Corporation の商標です。 © 2009 Intel Corporation.無断での引用、転載を禁じます。 インテル® マイクロアーキテクチャー Nehalem† ソフトウェア最適化 † 「Nehalem」 の開発コード名で呼ばれていた新しいインテル® マイクロアーキテクチャー インテル株式会社 ソフトウェア&サービス統括部 © 2009 Intel Corporation. 無断での引用、転載を禁じます。 記載内容は予告なしに変更されることがあります。 *その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 内容 • ソフトウェア最適化と並列化のおさらい • インテル® マイクロアーキテクチャー Nehalem

  • 1