タグ

cとintelに関するyassのブックマーク (2)

  • インテル® マス・カーネル・ライブラリー (インテル® MKL) の Java サンプル

    インテル® マス・カーネル・ライブラリー (インテル® MKL) には以下のディレクトリーにさまざまな Java のサンプルが含まれています。 <mkl ディレクトリー>/examples/java. 以下のインテル® MKL 関数用のサンプルが提供されています。 CBLAS の ?gemm、 ?gemv、 および ?dot ファミリー 非クラスター FFT 関数の完全なセット 1 次元の畳み込み/相関用 ESSL1 形式の関数 ユーザー定義のものとファイル・サブルーチンを除く VSL 乱数生成器 (RNG) GetErrorCallBack、 SetErrorCallBack、 および ClearErrorCallBack を除く VML 関数 サンプルのソースは以下のディレクトリーにあります。 <mkl ディレクトリー>/examples/java/examples. サンプルは Ja

    yass
    yass 2013/08/14
    " Java Native Interface (JNI) を使用してインテル® MKL とバインド / ネイティブ float および double データ型は、JNI jfloat および jdouble データ型とそれぞれ同じである必要 / ネイティブ int データ型は、4 バイト長 "
  • SSEとAVXで高次元ベクトルの内積計算を高速化してみた | さかな前線

    世界最速のお魚と言えばカジキ類で,泳ぐ速度は時速100km/hを超えるとか.55ノット程になるのでこれはMk-48魚雷にも匹敵するほどです. 一方ちょっとチートな高速お魚としては,お馴染みトビウオが飛行中に最大70km/hほどに達するとか. 今日はそんな若干チートな高速化のお話(?)ということで,SSE組み込み命令について. SSEやAVXといえばお馴染みSIMD命令で,それをプログラムから構造体と関数の形式で高移殖に記述する方法がSIMD組み込み関数(SIMD Intrinsic)なわけですが,これを使ってごく典型的なベクトルの内積計算を高速化してみました. ベクトルの内積の高速化と言えば星の数ほどもされてる話なわけで,いまさら魚の情報なんか役に立つ気は全くしないのですが,純粋に自分でやらないとわかんない>< ということで, とにかく書いてみよう 効果の程はいかに? を調べてみたくて,や

    yass
    yass 2013/08/13
    " SSEやAVXといえばお馴染みSIMD命令 / これを使ってごく典型的なベクトルの内積計算を高速化 / 最大で10倍のスループットというのは驚き / 8192次元,データ量にして8192*sizeof(float)*2=64KBに達すると,速度差がなくなってますね"
  • 1