タグ

intelとhpcに関するyassのブックマーク (8)

  • HPC性能が大幅に強化されたHaswell(前編) -各コアに256bit長のFMAを2個装備

    IDF 2012で、2013年に登場と見られるIntelの次世代プロセサ「Haswell」のアーキテクチャが発表された。Haswellのアーキテクチャ全般については大原雄介氏の記事を参照戴くのが分かり易いと思うが、それを補足する意味で、HPC(High Performance Computing)向けの強化ポイントについて詳細に見て行きたい。 Haswellで一番目に付くのは、各コアに256bit長(64bit×4)のFMA演算器を2個装備し、1サイクルに倍精度の浮動小数点演算を16回実行できるようにした点である。また、32bitの単精度浮動小数点なら32回の演算を実行できる。 「京」スパコンに使われている「SPARC64 VIIIfx」とその後継の「SPARC64 IXfx」のコアは8演算、2012年6月にTop500 1位となった「Sequoia」に使われている「BlueGene/Q(

    HPC性能が大幅に強化されたHaswell(前編) -各コアに256bit長のFMAを2個装備
    yass
    yass 2013/12/07
    "各コアに256bit長(64bit×4)のFMA演算器を2個装備し、1サイクルに倍精度の浮動小数点演算を16回実行 / ベクトルの内積 / Sum=Xi×Yi+Sumをi=0から順に計算 / この場合は(A×B)+CのCに結果を格納する必要があり、VFMADD231命令が使われる"
  • 高並列計算アクセラレータ Intel Xeon Phi Coprocessor 5110P Board

    Xeon Phi Coprocessor E5110P Intel MIC 60コアにより1,011GFLOPSの浮動小数点演算理論性能を実現 8GBのGDDR5メモリを320GB/sで高速接続 PCI Express x16でホストサーバと接続 2基のXeon Phiを搭載することで2TFLOPSのHPCサーバを実現 FDR InfiniBand接続によりメニーコア機のネットワーク並列処理機を実現 Intel Xeonとはプログラミング・モデルと開発環境を共通化 高信頼のHPC ProServerシリーズとセットで提供 管理サーバや開発環境などを含めたシステムインテグレーションを提供 3年間の当日オンサイト保守と技術支援を提供 高並列計算アクセラレータ Intel Xeon Phi Coprocessor 5110P Board Intel Xeon Phi Copro

    yass
    yass 2013/09/23
    " 性能は限定的に確認/現在はまだ試験導入の段階/適した条件は、計算の粒を8GBのメモリサイズ内に納めることができ、1回のPCIeを経由のデータ転送で十分な量の繰り返し処理を実施でき、しかも高い並列度で動作する計算"
  • インテル® Xeon Phi™ コプロセッサー向け OpenCL* アプリケーションの設計とプログラミング・ガイド | iSUS

    この記事は、インテル® デベロッパー・ゾーンに掲載されている「OpenCL* Design and Programming Guide for the Intel® Xeon Phi™ Coprocessor」の日語参考訳です。 記事の PDF 版はこちらからダウンロードできます。 概要 この記事は、インテル® Xeon Phi™ コプロセッサー向けのハイパフォーマンス OpenCL* アプリケーションを開発するための設計とコーディング・ガイドです。インテル® Xeon Phi™ コプロセッサーのアーキテクチャーおよびマイクロアーキテクチャーを紹介した後、OpenCL* 構造を効率良く利用してインテル® Xeon Phi™ コプロセッサーのハードウェアを活用する方法を説明します。パフォーマンス・アプリケーションではハードウェアの並列性を利用することが不可欠であるため、ここではインテル®

    インテル® Xeon Phi™ コプロセッサー向け OpenCL* アプリケーションの設計とプログラミング・ガイド | iSUS
    yass
    yass 2013/09/22
    "メモリーアクセスが自動的に高速化される、従来の CPU キャッシュに似た完全にコヒーレントなキャッシュ階層を実装 / データ・プリフェッチが不可欠"
  • 95. x86 プロセッサの将来と HPC 用プロセッサ (2011/2/20)

    yass
    yass 2013/09/22
    " まあ、そうするとこれから数年間は x86 の発展、Intel MIC、 NVIDIA ARM+GPU とアーキテクチャやトランジスタ効率・電力効率的にはなんだかなあ 感があるものが HPC マーケットで戦うということになります。"
  • ビッグデータを変える!Xeon Phi搭載サーバーの可能性 (1/3)

    既存のデータ解析とビッグデータの大きな差である処理速度や解像度。このギャップを埋めるには、既存のサーバーアーキテクチャでは難しい。インテルのXeon Phiを搭載したNECのメニーコアサーバーは果たしてどれだけの実力を持っているのか? 最大520スレッドを1Uで実現するビッグデータサーバー 前回説明したのは、「もっと大容量に、より高速に」という要件を満たすデータセンターの重要性だ。スマートデバイスやソーシャルメディアの普及、クラウドへのデータの集約化、多種多様なデータをビジネスで積極的に活用するビッグデータの台頭など、現在起こっているあらゆるトレンドが、データ量の爆発的な増大を誘発している。さらに、データが膨大になっていくということは、データの容量だけではなく、おのずと処理能力が必要になるということだ。つまり、これからのデータセンターは、今までに比べて桁違いのキャパシティと処理能力を有した

    ビッグデータを変える!Xeon Phi搭載サーバーの可能性 (1/3)
    yass
    yass 2013/09/22
    " GPGPUの場合、CPUとGPUでそれぞれ異なるプログラミングが必要になる。/ Xeonと共通のプログラミング環境でより簡単に処理の超並列化が可能 / コンパイラが賢いので、処理を複数のコアに自動的に割り当て / 大谷イビサ "
  • 【後藤弘茂のWeekly海外ニュース】 Intelが60コアのメニイコア「Xeon Phi」を正式発表

    yass
    yass 2013/09/22
    "スカラユニットを備えておりx86命令が実行/ GPUは一般にSingle Program, Multiple Data(SPMD)モデルで、ベクタをプログラムに対して露出させない / MICではビジブル / レイテンシは(メモリからキャッシュへの)プリフェッチングで隠蔽"
  • インテル® Xeon Phi™の検証結果 | HPCシステムズはすべての研究開発者に計算力を提供します。

    Phiは1GHz 200コア(物理50コア × Hyper Threading 4スレッド)サーバと覚えます。 つまり、このボードの中に、1GHzで動作するCPUを200コア搭載したLinuxサーバがある、と考えてください。大雑把ですが、それで実体をほぼあらわしています。 評価結果を端的に述べますと、Phiには有望3割、失望7割を感じました。詳細を説明いたします。まずは有望なデータから。 2012年現在、インテルのCPU E5-2600シリーズの1ノードとNVIDIAのTesla M2090の1枚は、単精度行列積の性能が674Gflops程度となっています。ベンチマークページ そんな中、Phiは1枚で1290Gflops(従来比ほぼ2倍)の実効性能を達成しました!これは潜在的に強力な浮動小数点数演算性能を有していることをアピールしています。 また、Phiは「従来のIAアーキテクチャのアプリ

    インテル® Xeon Phi™の検証結果 | HPCシステムズはすべての研究開発者に計算力を提供します。
    yass
    yass 2013/09/22
    " つまり、このボードの中に、1GHzで動作するCPUを200コア搭載したLinuxサーバがある、と考えてください。大雑把ですが、それで実体をほぼあらわしています。"
  • Intelコンパイラはここがスゴい、Xeon Phiで自動オフロード

    「Intel Parallel Studio XE」が「2013 SP1」にバージョンアップした。プラグマを1行書くだけでXeon Phiや、第3世代Coreプロセッサ以降のCPUが備える統合GPUで演算処理を実行するコードを生成する機能を備えた。 米Intelが開発し、エクセルソフトが販売するx86プロセッサ向けソフトウェア開発ツール「Intel Parallel Studio XE」が「2013 SP1」にバージョンアップした。それに含まれるC/C++コンパイラの「Intel C++ Composer」はバージョン14になり、C++11規格やOpenMP 4.0への対応のほか、並列処理を高速実行する機能が追加された。具体的には、Xeon Phiや、第3世代Coreプロセッサ(開発コード名「Ivy Bridge」)以降のCPUが備える統合GPU「Intel HD Graphics」で演算

    Intelコンパイラはここがスゴい、Xeon Phiで自動オフロード
    yass
    yass 2013/09/22
    "オフロード実行モデルでは、プログラムの起動はホストPC側で行い、ソースコード上の一部分だけをXeon Phiで実行させる。Xeon Phiで実行させるコードの単位は、関数/メソッドだけでなく、forループなど任意の単位で指定可能"
  • 1