[B! Intel][AVX] yassのブックマーク

yass id:yass

IntelとAVXに関するyassのブックマーク (11)

CUTT System:AVX命令入門
AVX命令入門 Intel CPUのSIMD命令を使い倒せ著者　北山洋幸判型　B5変型判、424頁本体価格 5,400円 ISBN　978-4-87783-369-5 本書について近年においてソフトウェアエンジニアがハードウェアのアーキテクチャを意識する機会は減りました。それは悪いことではないでしょう。ソフトウェアエンジニアがハードウェアを意識していては、開発したソフトウェアはハードウェア依存となりポータビリティやスケーラビリティなどを失ってしまいます。しかしながら、Wall Timeにシビアなソフトウェアや計算量が大きなソフトウェアを開発する場合、ハードウェアのアーキテクチャを意識したプログラミングを行うと、性能が格段に向上する場合があります。時代が変わりCPU性能が大幅に向上しましたが、同時に多くの計算量を要求するソフトウェアも存在します。このため、アプリケーション開発エン
yass 2015/01/30
avx

book

intel

cpu
リンク
【仮想化道場】 Haswell世代のXeon E5、1600/2600 v3シリーズ登場 (仮想化機能も進化)
yass 2014/09/09
" 新しいJava VMのJDK8がAVXをサポートしたことが大きな要因だろう。"

xeon

java8

avx

intel

cpu

java
リンク
或るプログラマの一生 » AVX-512 がアナウンスされていた
x86/x64 最適化勉強会 #6 で聞いてきましたが、AVX-512 なるものがアナウンスされてました。名前から予想される通り、SIMD レジスタが 512bit になります。SIMD レジスタが 512bit というと Xeon Phi は最初からそうなっているのですが、これが普通の Xeon に降りてくるイメージです。 AVX が「単なる legacy SSE の 256bit 版」ではないのと同様、AVX-512 も「単なる AVX の 512bit 版」ではありません。 SIMD レジスタが zmm という名前で 512bit になる。下位 256bit は ymm としてアクセスできる（xmm に対する ymm と同じ） 64bit モードの場合、SIMD レジスタが 32本使える。これは、zmm だけでなく ymm や xmm でも同様である。32bit モードでは8本のまま
yass 2014/01/09
" SIMD レジスタが 512bit になります。SIMD レジスタが 512bit というと Xeon Phi は最初からそうなっているのですが、これが普通の Xeon に降りてくるイメージです。"

SIMD

AVX

intel

CPU

xeon

Xeon Phi
リンク
HPC性能が大幅に強化されたHaswell(前編) -各コアに256bit長のFMAを2個装備
IDF 2012で、2013年に登場と見られるIntelの次世代プロセサ「Haswell」のアーキテクチャが発表された。Haswellのアーキテクチャ全般については大原雄介氏の記事を参照戴くのが分かり易いと思うが、それを補足する意味で、HPC(High Performance Computing)向けの強化ポイントについて詳細に見て行きたい。 Haswellで一番目に付くのは、各コアに256bit長(64bit×4)のFMA演算器を2個装備し、1サイクルに倍精度の浮動小数点演算を16回実行できるようにした点である。また、32bitの単精度浮動小数点なら32回の演算を実行できる。「京」スパコンに使われている「SPARC64 VIIIfx」とその後継の「SPARC64 IXfx」のコアは8演算、2012年6月にTop500 1位となった「Sequoia」に使われている「BlueGene/Q(
yass 2013/12/07
"各コアに256bit長(64bit×4)のFMA演算器を2個装備し、1サイクルに倍精度の浮動小数点演算を16回実行 / ベクトルの内積 / Sum＝Xi×Yi+Sumをi=0から順に計算 / この場合は(A×B)+CのCに結果を格納する必要があり、VFMADD231命令が使われる"

HPC

CPU

Intel

haswell

avx

fma
リンク
組み込み関数（intrinsic）によるSIMD入門
“Symbolic bounds analysis of pointers, array indices, and accessed memory reg...Masahiro Sakai
yass 2013/08/14
CPU

simd

OpenCV

SSE

AVX

intrinsic

intel

cpu
リンク
SSEとAVXで高次元ベクトルの内積計算を高速化してみた | さかな前線
世界最速のお魚と言えばカジキ類で，泳ぐ速度は時速100km/hを超えるとか．55ノット程になるのでこれはMk-48魚雷にも匹敵するほどです．一方ちょっとチートな高速お魚としては，お馴染みトビウオが飛行中に最大70km/hほどに達するとか．今日はそんな若干チートな高速化のお話（？）ということで，SSE組み込み命令について． SSEやAVXといえばお馴染みSIMD命令で，それをプログラムから構造体と関数の形式で高移殖に記述する方法がSIMD組み込み関数(SIMD Intrinsic)なわけですが，これを使ってごく典型的なベクトルの内積計算を高速化してみました．ベクトルの内積の高速化と言えば星の数ほどもされてる話なわけで，いまさら魚の情報なんか役に立つ気は全くしないのですが，純粋に自分でやらないとわかんない＞＜　ということで，とにかく書いてみよう効果の程はいかに？を調べてみたくて，や
yass 2013/08/13
" SSEやAVXといえばお馴染みSIMD命令 / これを使ってごく典型的なベクトルの内積計算を高速化 / 最大で10倍のスループットというのは驚き / 8192次元，データ量にして8192*sizeof(float)*2=64KBに達すると，速度差がなくなってますね"

sse

simd

AVX

intel

vector

Intrinsic

c

cpu
リンク
https://bugs.java.com/?bug_id=7121648
yass 2013/08/13
java

java7

intel

cpu

AVX

SIMD
リンク
【笠原一輝のハードウェアトレンド】アンコアを大幅に進化させ、処理能力と電力効率を改善したXeon E5 2600シリーズ
yass 2013/07/03
"IntelはDDIO（Data Direct I/O）と呼ばれる仕組みを導入/DDR3-1600のメモリモジュールを利用した場合、1チャネルあたり12.8G/秒の帯域幅となるため、12.8GB/秒X4＝51.2GB/秒の帯域幅"

Intel

CPU

xeon

SandyBridge

AVX

DDIO

DMA

bandwidth

ddr

memory
リンク
プログラマのためのHaswell入門 - 2013-06-02 - J
(上の生データやらグラフを見て情報読み取れる人は読まなくてよいです) さて、世間のレビュー見てると、Haswellいらん子感があるけど、HaswellはIvyと比べて性能2倍になっている点はプログラム書く人は知っておくべきだと思う。 (IntelのCPUはCore2以降デスクトップ向け強化とサーバー/HPC向け強化を交互にやってる感があって、今回はHPC向けターンかなーという気がする) Haswellで性能出すために知っておくべきことなどを書いておく。 Haswellで強化された点プログラム書く場合に考慮すべきHaswellの強化点は、 FMA命令が追加/FMULx1/FADDx1 が FMAx2 になった AVX2命令が追加整数演算パイプ追加 TSX あたりかと思う。以下、それぞれどう意識すればいいか解説する。 (TSXは使えないCPUを選んでしまったので特に解説しません) FMA命
yass 2013/06/07
"AVXは、浮動小数しか無くて整数系の人達はガッカリだったわけだが、Haswellで整数も256bitになった。"

cpu

haswell

intel

AVX
リンク
Yaminabe simd
Yaminabe simd 1. Intel AVX で SIMD 入門 2012/9/15 (Sat) 第2回闇鍋プログラミング勉強会 Yuki Kawaguchi 1 2. 自己紹介名前: Yuki Kawaguchitwitter: @kawa0810はてな id: kawa0810・学生時代の研究並列・分散処理，GPGPU，数値計算関係・仕事 orz バックアップソフトの開発・サポート 2 3. 自己紹介名前: Yuki Kawaguchitwitter: @kawa0810はてな id: kawa0810・学生時代の研究並列・分散処理，GPGPU，数値計算関係・仕事バックアップソフトの開発・サポート 3 4. 本題4 5. SIMD とは？・Single Instruction Multiple Data・1回の命令で複数のデータを処理する命令形式配列 x と配列 y
yass 2013/01/09
intel

SIMD

AVX

cpu
リンク
CompProBeta11.0_Customer_Presentation.ppt
Intel、インテル、Intel ロゴ、Intel Atom、Intel Core、Xeon は、アメリカ合衆国およびその他の国における Intel Corporation の商標です。 © 2009 Intel Corporation.無断での引用、転載を禁じます。インテル® マイクロアーキテクチャー Nehalem† ソフトウェア最適化 † 「Nehalem」の開発コード名で呼ばれていた新しいインテル® マイクロアーキテクチャーインテル株式会社ソフトウェア＆サービス統括部 © 2009 Intel Corporation. 無断での引用、転載を禁じます。記載内容は予告なしに変更されることがあります。＊その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。内容 • ソフトウェア最適化と並列化のおさらい • インテル® マイクロアーキテクチャー Nehalem
yass 2013/01/02
CPU

intel

nehalem

simd

AVX
リンク
1