各種スケジューリング処理やシミュレーション、統計処理、デジタル制御や信号処理などの分野では、多次元行列演算や高速フーリエ変換(FFT)、線形計画法など、さまざまな数学的処理が必要とされる。これらの処理に対するアルゴリズムはほぼ完成されており、フリー/商用を問わず、すでに多数の計算ライブラリがリリースされている。その1つが、インテルが提供する「インテル マス・カーネル・ライブラリ」(Intel Math Karnel Library、以下MKL)だ。 MKLはインテル コンパイラーに標準で付属している数値演算ライブラリで、同社のItaniumやXeon、Pentium 4、Core 2、Core i7といったCPUで高速に動作するよう最適化されているだけでなく、マルチプロセッサー/マルチコアCPU環境での並列処理に対応しているのが特徴だ。 本記事では、このMKLが備えている機能を紹介するとと
6. 目標目標 OpenCVによりも高速なプログラムを簡OpenCVによりも高速なプログラムを簡 単につくれる書き方を覚えよう単 くれる書き方を覚えよう 出来るようになること ・高速コピー src.copyTo(dest);高速コピ src.copyTo(dest); ・高速な加減乗算 dest = src1 + src2; ・高速型変換 src.convert(dest,CV_16U); ・高速BGR2RGB cvtColor(src,dest,CV_BGR2RGB); ・高速BGR2Gray cvtColor(src,dest,CV_BGR2Gray); ※出来ないこと 整数演算だけ 浮動小数点の命令は使わない 比較演算は使整数演算だけ,浮動小数点の命令は使わない,比較演算は使 わない,水平演算は使わない,AVXは含まない(SSE4.1まで) 7. 目的目的 を使えば 化は難しくないよ
世界最速のお魚と言えばカジキ類で,泳ぐ速度は時速100km/hを超えるとか.55ノット程になるのでこれはMk-48魚雷にも匹敵するほどです. 一方ちょっとチートな高速お魚としては,お馴染みトビウオが飛行中に最大70km/hほどに達するとか. 今日はそんな若干チートな高速化のお話(?)ということで,SSE組み込み命令について. SSEやAVXといえばお馴染みSIMD命令で,それをプログラムから構造体と関数の形式で高移殖に記述する方法がSIMD組み込み関数(SIMD Intrinsic)なわけですが,これを使ってごく典型的なベクトルの内積計算を高速化してみました. ベクトルの内積の高速化と言えば星の数ほどもされてる話なわけで,いまさら魚の情報なんか役に立つ気は全くしないのですが,純粋に自分でやらないとわかんない>< ということで, とにかく書いてみよう 効果の程はいかに? を調べてみたくて,や
How secure is Linux's random number generator? | Hacker News Hacker Newsで話題になっていたので。 主に暗号用途には、予測不可能な乱数が必要となる。予測不可能というのは、実装と内部状態が知られていても、なお将来の乱数が予測できないということだ。 たとえば、擬似乱数としてよく使われる線形合同法(Linear congruential generator)は、以下のように書ける。 namespace lcg { thread_local unsigned int seed ; void srand( unsigned int seed ) { lcg::seed = seed ; } int rand( void ) { // glibcの使っている値を拝借 seed = (1103515245 * seed + 12345
現在のPCにはCore 2 i3、i5、i7というSandy Bridgeプロセサが使われているが、この後継となるのが、2012年に登場予定のIvy Bridgeと呼ばれるプロセサである。Sandy Bridgeは32nmプロセスで製造されているが、Ivy Bridgeはその次の22nmプロセスに移行する。Intelのプロセサロードマップは新プロセスへの移行とアーキテクチャの革新を1年ごとに交互に繰り返すので、プロセスを更新するIvy Bridgeではアーキテクチャ的には大きな革新は無いが、それでも、次の2枚のスライドに示されるような新機能が追加されている。 ユーザとしては3Dグラフィックスの強化やコアの性能強化に目が行くが、この記事では2枚目のスライドの最初に書いてあるデジタル乱数発生器を取り上げる。 乱数というとゲームの展開などを決めるときに使うという程度の認識が一般的であるが、実用的
北森瓦版 - Northwood Blog (Author : 北森八雲. Since July 10, 2006.) Intel Xeon 2013 update - A bit later, but a bit better too(VR-Zone) Intel Reveals Additional Information About Server Architectures of the Future.(X-bit labs) Intel Xeon 2013-2014 Processors Detailed – Xeon E5-2600/4600 V2 To Sport 12 Cores, Xeon E7 With 15 Cores(WCCF Tech) Intel、第4世代CoreプロセッサをOEMメーカーへ量産出荷開始(Impress PC Watch) “IvyBridge”ベ
預金の引き出しでは、残高確認→現金の引き出し→残高の更新という一連の処理を他のプロセサの処理からの干渉なく行う必要がある。 プロセサ1の引き出しの処理で、残高の更新を行う前に、他のプロセサが引き出し前の残高を読んで、引き出し、残高更新を行ってしまうと、処理がおかしくなってしまう。このため、Lockというメカニズムを使って、1つのプロセサがこの一連の処理を終わるまで、他のプロセサはこの処理を開始できないようにするというのが一般的なやり方である。しかし、これでは複数のプロセサがあっても一時には1つのプロセサしか使えず、効率が悪い。 プロセサ1が口座A、プロセサ2が口座Bの引き出し処理を並行に実行するのは問題ないので、口座ごとにLockを設ければこの問題は解決する。しかし、口座Aから口座Bへの振込をする場合は両方の口座のLockを獲得する必要がある。この時、プロセサ1が口座AからBへの振込のため
We recently changed the NICs in our web tier and primary database servers from Broadcom to Intel based NICs based on some … issues we had been having. After we put them in they worked reasonably well, but we knew that they could be faster and push more data. When I started to dig into just what we could do to tweak the pleathora of settings for the new NICs I found a few settings that would probab
インテル® Xeon® プロセッサー E5-2600 を搭載したCisco UCS B200 M3 や C220 M3、C240 M3、またまたシスコに限らず、E5-2600 を搭載していればどこのベンダーのサーバーであっても、メモリーの構成にはスイートスポット(“美味しい”構成)があります。 例えば、VMware vSphere を Enterprise Plus ライセンスで使うとして、E5-2690 を 2 基搭載したサーバーで 192GB のメモリーを搭載したい場合、8GB のDIMM を24枚(8GB x24枚)でも、16GB の DIMM を12枚(16GB x12枚)でも 192GB になります。しかし、性能面からすると、どちらも美味しい構成ではありません。では、一番美味しい構成は何でしょうか。答えは、16GB の DIMM を 8 枚、8GB の DIMM を 8 枚です。
(上の生データやらグラフを見て情報読み取れる人は読まなくてよいです) さて、世間のレビュー見てると、Haswellいらん子感があるけど、HaswellはIvyと比べて性能2倍になっている点はプログラム書く人は知っておくべきだと思う。 (IntelのCPUはCore2以降デスクトップ向け強化とサーバー/HPC向け強化を交互にやってる感があって、今回はHPC向けターンかなーという気がする) Haswellで性能出すために知っておくべきことなどを書いておく。 Haswellで強化された点 プログラム書く場合に考慮すべきHaswellの強化点は、 FMA命令が追加/FMULx1/FADDx1 が FMAx2 になった AVX2命令が追加 整数演算パイプ追加 TSX あたりかと思う。以下、それぞれどう意識すればいいか解説する。 (TSXは使えないCPUを選んでしまったので特に解説しません) FMA命
Using Intel.com Search You can easily search the entire Intel.com site in several ways. Brand Name: Core i9 Document Number: 123456 Code Name: Emerald Rapids Special Operators: “Ice Lake”, Ice AND Lake, Ice OR Lake, Ice* Quick Links You can also try the quick links below to see results for most popular searches. Product Information Support Drivers & Software
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く