タグ

IntelとXeon Phiに関するyassのブックマーク (8)

  • 或るプログラマの一生 » AVX-512 がアナウンスされていた

    x86/x64 最適化勉強会 #6 で聞いてきましたが、AVX-512 なるものがアナウンスされてました。名前から予想される通り、SIMD レジスタが 512bit になります。SIMD レジスタが 512bit というと Xeon Phi は最初からそうなっているのですが、これが普通の Xeon に降りてくるイメージです。 AVX が「単なる legacy SSE の 256bit 版」ではないのと同様、AVX-512 も「単なる AVX の 512bit 版」ではありません。 SIMD レジスタが zmm という名前で 512bit になる。下位 256bit は ymm としてアクセスできる(xmm に対する ymm と同じ) 64bit モードの場合、SIMD レジスタが 32使える。これは、zmm だけでなく ymm や xmm でも同様である。32bit モードでは8のまま

    yass
    yass 2014/01/09
    " SIMD レジスタが 512bit になります。SIMD レジスタが 512bit というと Xeon Phi は最初からそうなっているのですが、これが普通の Xeon に降りてくるイメージです。"
  • 北森瓦版 - Intel 次世代Xeon Phiとなる“Knight Landing”を明らかに【11/25追記】

    北森瓦版 - Northwood Blog (Author : 北森八雲. Since July 10, 2006.) Intel Formally Introduces Next-Generation Xeon Phi “Knights Landing”.(X-bit labs) Supercomputing Conefernce 13でIntelは“Knight Landing”のコードネームで呼ばれる次世代Xeon Phiを紹介し、“Knight Landing”のCPU版のメモリ仕様とフォームファクタを明らかにした。この“Knight Landing”のCPU版はプログラマビリティを容易にし、さらに性能向上を期待するものである。 “Knight Landing”はHost processorとして使用できる。つまり、標準的なラックに搭載でき、今までのようにCoprocessorとし

    yass
    yass 2013/11/25
    " “Knight Landing”はHost processorとして使用 / 今までのようにCoprocessorとしてデータをオフロードする必要がなく、完全にNativeな形でアプリケーションを走らせることが出来る。 / 倍精度浮動小数点演算性能で3TFlops "
  • 高並列計算アクセラレータ Intel Xeon Phi Coprocessor 5110P Board

    Xeon Phi Coprocessor E5110P Intel MIC 60コアにより1,011GFLOPSの浮動小数点演算理論性能を実現 8GBのGDDR5メモリを320GB/sで高速接続 PCI Express x16でホストサーバと接続 2基のXeon Phiを搭載することで2TFLOPSのHPCサーバを実現 FDR InfiniBand接続によりメニーコア機のネットワーク並列処理機を実現 Intel Xeonとはプログラミング・モデルと開発環境を共通化 高信頼のHPC ProServerシリーズとセットで提供 管理サーバや開発環境などを含めたシステムインテグレーションを提供 3年間の当日オンサイト保守と技術支援を提供 高並列計算アクセラレータ Intel Xeon Phi Coprocessor 5110P Board Intel Xeon Phi Copro

    yass
    yass 2013/09/23
    " 性能は限定的に確認/現在はまだ試験導入の段階/適した条件は、計算の粒を8GBのメモリサイズ内に納めることができ、1回のPCIeを経由のデータ転送で十分な量の繰り返し処理を実施でき、しかも高い並列度で動作する計算"
  • インテル® Xeon Phi™ コプロセッサー向け OpenCL* アプリケーションの設計とプログラミング・ガイド | iSUS

    この記事は、インテル® デベロッパー・ゾーンに掲載されている「OpenCL* Design and Programming Guide for the Intel® Xeon Phi™ Coprocessor」の日語参考訳です。 記事の PDF 版はこちらからダウンロードできます。 概要 この記事は、インテル® Xeon Phi™ コプロセッサー向けのハイパフォーマンス OpenCL* アプリケーションを開発するための設計とコーディング・ガイドです。インテル® Xeon Phi™ コプロセッサーのアーキテクチャーおよびマイクロアーキテクチャーを紹介した後、OpenCL* 構造を効率良く利用してインテル® Xeon Phi™ コプロセッサーのハードウェアを活用する方法を説明します。パフォーマンス・アプリケーションではハードウェアの並列性を利用することが不可欠であるため、ここではインテル®

    インテル® Xeon Phi™ コプロセッサー向け OpenCL* アプリケーションの設計とプログラミング・ガイド | iSUS
    yass
    yass 2013/09/22
    "メモリーアクセスが自動的に高速化される、従来の CPU キャッシュに似た完全にコヒーレントなキャッシュ階層を実装 / データ・プリフェッチが不可欠"
  • ビッグデータを変える!Xeon Phi搭載サーバーの可能性 (1/3)

    既存のデータ解析とビッグデータの大きな差である処理速度や解像度。このギャップを埋めるには、既存のサーバーアーキテクチャでは難しい。インテルのXeon Phiを搭載したNECのメニーコアサーバーは果たしてどれだけの実力を持っているのか? 最大520スレッドを1Uで実現するビッグデータサーバー 前回説明したのは、「もっと大容量に、より高速に」という要件を満たすデータセンターの重要性だ。スマートデバイスやソーシャルメディアの普及、クラウドへのデータの集約化、多種多様なデータをビジネスで積極的に活用するビッグデータの台頭など、現在起こっているあらゆるトレンドが、データ量の爆発的な増大を誘発している。さらに、データが膨大になっていくということは、データの容量だけではなく、おのずと処理能力が必要になるということだ。つまり、これからのデータセンターは、今までに比べて桁違いのキャパシティと処理能力を有した

    ビッグデータを変える!Xeon Phi搭載サーバーの可能性 (1/3)
    yass
    yass 2013/09/22
    " GPGPUの場合、CPUとGPUでそれぞれ異なるプログラミングが必要になる。/ Xeonと共通のプログラミング環境でより簡単に処理の超並列化が可能 / コンパイラが賢いので、処理を複数のコアに自動的に割り当て / 大谷イビサ "
  • 【後藤弘茂のWeekly海外ニュース】 Intelが60コアのメニイコア「Xeon Phi」を正式発表

    yass
    yass 2013/09/22
    "スカラユニットを備えておりx86命令が実行/ GPUは一般にSingle Program, Multiple Data(SPMD)モデルで、ベクタをプログラムに対して露出させない / MICではビジブル / レイテンシは(メモリからキャッシュへの)プリフェッチングで隠蔽"
  • インテル® Xeon Phi™の検証結果 | HPCシステムズはすべての研究開発者に計算力を提供します。

    Phiは1GHz 200コア(物理50コア × Hyper Threading 4スレッド)サーバと覚えます。 つまり、このボードの中に、1GHzで動作するCPUを200コア搭載したLinuxサーバがある、と考えてください。大雑把ですが、それで実体をほぼあらわしています。 評価結果を端的に述べますと、Phiには有望3割、失望7割を感じました。詳細を説明いたします。まずは有望なデータから。 2012年現在、インテルのCPU E5-2600シリーズの1ノードとNVIDIAのTesla M2090の1枚は、単精度行列積の性能が674Gflops程度となっています。ベンチマークページ そんな中、Phiは1枚で1290Gflops(従来比ほぼ2倍)の実効性能を達成しました!これは潜在的に強力な浮動小数点数演算性能を有していることをアピールしています。 また、Phiは「従来のIAアーキテクチャのアプリ

    インテル® Xeon Phi™の検証結果 | HPCシステムズはすべての研究開発者に計算力を提供します。
    yass
    yass 2013/09/22
    " つまり、このボードの中に、1GHzで動作するCPUを200コア搭載したLinuxサーバがある、と考えてください。大雑把ですが、それで実体をほぼあらわしています。"
  • Intelコンパイラはここがスゴい、Xeon Phiで自動オフロード

    「Intel Parallel Studio XE」が「2013 SP1」にバージョンアップした。プラグマを1行書くだけでXeon Phiや、第3世代Coreプロセッサ以降のCPUが備える統合GPUで演算処理を実行するコードを生成する機能を備えた。 米Intelが開発し、エクセルソフトが販売するx86プロセッサ向けソフトウェア開発ツール「Intel Parallel Studio XE」が「2013 SP1」にバージョンアップした。それに含まれるC/C++コンパイラの「Intel C++ Composer」はバージョン14になり、C++11規格やOpenMP 4.0への対応のほか、並列処理を高速実行する機能が追加された。具体的には、Xeon Phiや、第3世代Coreプロセッサ(開発コード名「Ivy Bridge」)以降のCPUが備える統合GPU「Intel HD Graphics」で演算

    Intelコンパイラはここがスゴい、Xeon Phiで自動オフロード
    yass
    yass 2013/09/22
    "オフロード実行モデルでは、プログラムの起動はホストPC側で行い、ソースコード上の一部分だけをXeon Phiで実行させる。Xeon Phiで実行させるコードの単位は、関数/メソッドだけでなく、forループなど任意の単位で指定可能"
  • 1