タグ

hpcに関するdowhileのブックマーク (798)

  • 筑波大がFPGAを本格使用するCygnusスパコンの運用を開始

    筑波大学は、FPGA格使用するスーパーコンピュータ(スパコン)「Cygnus」の運用を4月より開始した。 筑波大で運用を開始するFPGA格使用するCygnusスパコン (写真提供:筑波大計算科学研究センター) 現在では、IntelのXeonなどの汎用CPUとNVIDIAのGPUを組み合わせたスパコンが主流で、米国のSummitSierraスパコン、国内最大の産総研のABCIスパコンもこのタイプである。 筑波大はメーカーが開発したスパコンをそのまま購入するのではなく、自分のところの研究成果をとりいれたスパコンをメーカーと共同開発を行うという形のスパコン調達を行ってきた歴史を持っている。 正確に言えば、どこもメーカーの製品をそのまま購入しているわけではなく、いろいろと工夫して自分のところに合うスパコンを共同開発しているのであるが、筆者の印象では、筑波大はスパコンシステムの構成に自分の

    筑波大がFPGAを本格使用するCygnusスパコンの運用を開始
    dowhile
    dowhile 2019/04/07
  • SC18 - 全容が見えてきた富士通のポスト「京」スパコン

    SC18のExhibitor Forumで、富士通の次世代テクニカルコンピューティング開発部システム開発統括部長の清水俊幸氏がPost-K(ポスト「京」)スパコンについて発表を行った。 SC18のExhibitor Forumにおいてポスト京スパコンについて発表する富士通の清水統括部長 ポスト京のゴールは、第1に、高いアプリケーション性能と良い電力効率を両立させることである。第2は、良い利用性とよりよいアクセスをユーザに提供することである。第3は、前世代からの進歩をさせながら、アプリケーションの互換性を保つことであるという。 このため、高性能と高いスケーラビリティを持つカスタムのCPUを開発することにした。高性能のカギは、幅の広いSIMDと高いメモリバンド幅、高いスケーラビリティのカギはTofuインタコネクトである。そして、高い電力効率は7nmプロセスの採用、電力制御機能、最適な資源配分

    SC18 - 全容が見えてきた富士通のポスト「京」スパコン
  • 30周年を祝ったスパコンの学会SC18 | マイナビニュース

    スパコンの学会「SC」は1988年に第1回が開催されて以降、今年が30周年にあたる。第1回の参加者は1500人以下であったが、今年の参加者は、公式発表では13071人となっている。 なお、プレスルームのホワイトボードには来場者数が記載されるのだが、部屋が閉まる直前となる最終日14時30分時点では13,040人と書かれていた。いずれにしても12868人という2015年の記録を上回って過去最高の参加者となった。 プレスルームの閉まる直前のホワイトボードへの書き込みは、参加者は13040人で新記録となっている。 今年は30周年であるので、過去のすべてのSCに出席した17人の表彰が行なわれ、それらの人たちもTOP500のプレス発表に招待された。しかし、集合写真のようなものは撮影されておらず、HPC WireもSC15の時の写真を使っている。 なお、日人でこれまでの31回すべてのSCに出席している

    30周年を祝ったスパコンの学会SC18 | マイナビニュース
  • [新サービス] HPC用の高速な分散ファイルシステムAmazon FSx for Lustreが発表されました #reinvent | DevelopersIO

    大栗です。 現在re:Invent 2018のKeynote中で機械学習やHPC向けの高速なファイルシステムの新サービスが発表されました。 Amazon FSx for Lustre AWSには様々なストレージサービスがありますが、多数のマシンからアクセスするためのサービスはレイテンシよりもスループットを重点においたサービスが多くありましたが、今回発表されたAmazon FSx for LustreはHPC機械学習で必要になるスケールアウトな並列ファイルシステムで数百万GB/秒のスループットとミリ秒未満の低レイテンシのLustreファイルシステムを提供します。 Amazon FSx for LustreはS3と統合されていて長期間保存するデータセットを高性能なファイルシステムへ簡単にリンクしてコンピュータ集約型のワークロードを実行できます。また実行結果をS3に書き戻せます。 メリット A

    [新サービス] HPC用の高速な分散ファイルシステムAmazon FSx for Lustreが発表されました #reinvent | DevelopersIO
  • Green500 - 理研の菖蒲システムBが連続して1位を獲得

    これまで、ExaScalarは、もっとも簡易なレベル1という方法で電力の測定を行ってきていたのであるが、スイスのPiz Daintは早くから最も精度の高いレベル3測定を行ない、わが国でも東大のReed-Bushがレベル3測定を行うなど、より精度の高い測定法に移行してきている。このため、ExaScalar社は、6月の講演の時に、次はレベル2か3の測定を行うと宣言しており、その約束を果たす必要があった。 ちょっと話が横にそれるが、Green500ではOptimizedという測定も認めている。Optimizedの場合は、クロックと電源電圧を下げて、性能は下がるが性能/電力が最高になる条件での測定値を提出することができる。 実は今回のGreen500の2位~4位のシステムはOptimized測定である。2位のSaturn V VoltaはOptimized測定では15.133GFlops/Wである

    Green500 - 理研の菖蒲システムBが連続して1位を獲得
    dowhile
    dowhile 2018/11/23
    PEZY
  • » 【わがスパコン人生】第7回 平尾公彦

    dowhile
    dowhile 2018/11/03
  • Hot Chips 30 - DeePhiが語ったディープラーニングのトレンド(1) ディープラーニングの最近の進歩とDeePhiのプラットフォーム | マイナビニュース

    Xilinxが買収したディープラーニングのスタートアップ DeePhi Tech(深鉴科技)は清華大学とスタンフォード大学の研究者が、2016年に北京に設立したディープラーニング技術を開発するスタートアップである。コンピュータアーキテクチャ関係のトップクラスの学会である2016年のISCAで最優秀論文賞を受賞するなど、高い技術力を誇る。 DeePhi Techは、その将来性からSamsungやMediaTekなども出資していたが、2018年7月に出資先の1つであったXilinxが買収し、現在はXilinxの一部になっている。DeePhi TechはXilinxのFPGAをディープラーニングのエンジンとして使っており、資関係だけでなく、研究開発でも両者の関係は深かった。 Hot Chips 30でマシンラーニングプラットフォームについて発表するDeePhi TechのSong Yao CE

    Hot Chips 30 - DeePhiが語ったディープラーニングのトレンド(1) ディープラーニングの最近の進歩とDeePhiのプラットフォーム | マイナビニュース
    dowhile
    dowhile 2018/10/18
  • Hot Chips 30 - DeePhiが語ったディープラーニングのトレンド(2) ディープラーニングでFPGAを使う利点 | マイナビニュース

    DPU-Vでの処理の流れ MobileNetでは、まず、層ごとに分解したDepth-wise Convを行い、その後に層間の1×1のPoint-wise Convを行っている。そしてPoint-wise/Depth-wiseのワークロードの比率は棒グラフを見ると3~228まで変動している。このため、DeePhiはDepth-wise ConvとPoint-wise Convの入力バッファを分離し、Depth-wiseは1個のPEで処理し、Point-wiseは4個のPEで並列に処理するアーキテクチャを使うことを考えている。 (a)MobileNetなどでは、Depth-wise Convの直後にPoint-wise Conv処理を行っている。(b)各層でのPW/DWの処理量比率。平均的にはPWはDWの50倍程度。(c)DeePhiはDWには1個のPE,PWには全部のPEを割り当てる Dee

    Hot Chips 30 - DeePhiが語ったディープラーニングのトレンド(2) ディープラーニングでFPGAを使う利点 | マイナビニュース
  • Hot Chips 30 - 16個のGPU接続を実現した小さな巨人「NVSwitch」(前編)

    NVSwitchの詳細が公開 NVIDIAは8個のV100 GPUを搭載するDGX-1サーバに続いて、2018年3月のGTC 2018で16個のV100 GPUを搭載するDGX-2サーバを発表した。このDGX-2サーバの高いスケーラビリティを実現した影の主役がNVSwitchと呼ぶNVLinkを接続するスイッチチップである。 NVIDIAはHot Chips 30において、このNVSwitchについて発表を行った。これはNVSwitchに関する初めての学会での詳細な発表である。 Hot Chips 30においてNVSwitchの発表を行うNVIDIAのAlex Ishii氏 NVSwitchの概要 次の図に示すDGX-1の8個のV100 GPUの間の接続は、4個のGPUの範囲では、NVLinkの直結の接続があるが、反対側の4個のGPUの間では直結の接続が無く、来無関係なGPUを1個経由し

    Hot Chips 30 - 16個のGPU接続を実現した小さな巨人「NVSwitch」(前編)
  • Hot Chips 30 - NVIDIAのDeep Learning Accelerator(DLA)(3) NVDLAの構成による性能や電力の変化

    構成によるチップ面積、性能、電力の変化 構成とチップ面積と性能、電力への影響を考えてみよう。小規模構成はINT8のデータパスで、DRAMへのインタフェースだけ、高度な機能は無しという最低限の構成を考える。一方、大規模構成はINT8に加えてINT16やFP16をサポートし、DRAMに加えて内蔵の高速SRAMを持ち、専用のマイクロコントローラを備え、重みの圧縮機能も持つというようなものを考える。 小規模構成は、INT8だけのサポートで、DRAMへのアクセスパスだけで、高度な機能をもっていないものを想定。大規模構成は、INT8に加えてINT16とFP16をサポートし、メモリはDRAMに加えて高速のSRAMを持ち、命令の実行を制御するマイクロコントローラを持つ。さらに、重みの圧縮などの高度な機能をもつものを想定する なお、NVDLAはプロセサがコントロールバスを通して命令の実行を指示し、命令の実行

    Hot Chips 30 - NVIDIAのDeep Learning Accelerator(DLA)(3) NVDLAの構成による性能や電力の変化
  • ウェザーニューズ×NVIDIA、全世界の降水分布を可視化・予測するAIプロジェクト

    ウェザーニューズは9月13日、NVIDIAと連携し、気象災害による被害軽減を目的に、全世界の雨の状況を高精度に可視化・予測するAIプロジェクトを開始すると発表した。 同プロジェクトにおいて、NVIDIAはGPUコンピューティングのためのハードウェア、ソフトウェアスタック、そしてそのノウハウを提供。NVIDIAのスタートアップ支援プログラムであるInceptionに参画するdAignosisは、NVIDIA DGX-1を駆使したDeep Learning技術の開発を担当。同社は、新たな気象モデルの開発と運営を行う。 なお、NVIDIAのAIプラットフォームは、高いコンピューティングパワーだけでなく、コスト削減においても同プロジェクトに大きく貢献。主に経済的な制約により、現在レーダでカバーされている地域は地球上の約17%に限られており、地球すべてをカバーするには、4000基ものレーダが必要と言

    ウェザーニューズ×NVIDIA、全世界の降水分布を可視化・予測するAIプロジェクト
  • Hot Chips 30 - 富士通が発表したPost-Kスパコンのプロセサ(4) ポスト「京」スパコンはどの程度の性能になるのか?

    A64FXのエラー訂正機能 スパコンは規模が大きく、どこが故障しても実行中の計算に影響を及ぼす。このため、エラーの発生を見逃さないこと、可能な限りハードウェアのエラーを訂正することが重要である。 このため、A64FXプロセサは、メインフレームクラスのハードウェアによるRAS(Reliability、Availability、Serviceability)機能を備えている。具体的には、すべてのキャッシュはECCによるエラー訂正か2重化によるエラー訂正機能を備えている。また、実行ユニットにはパリティチェックを施し、演算器のエラーも検出している。 そして、パリティチェックだけではエラーは訂正できないが、A64FXでは、パリティエラーが検出された場合には、その命令の実行をやり直して訂正を試みる。トランジスタが壊れてしまったような場合は、やり直しても同じエラーになってしまうが、宇宙線などに起因する一

    Hot Chips 30 - 富士通が発表したPost-Kスパコンのプロセサ(4) ポスト「京」スパコンはどの程度の性能になるのか?
    dowhile
    dowhile 2018/09/13
  • Hot Chips 30 - 富士通が発表したPost-Kスパコンのプロセサ(2) ポスト「京」のプロセッサ「A64FX」を読み解く

    A64FXコアのパイプラインダイヤグラム 次の図にA64FX富士通FX100スパコン、京コンピュータの諸機能の一覧を示す。この表を見ると、京コンピュータでは128ビット幅であったSIMD演算が、FX100では256ビット幅に拡張され、さらにA64FXでは512ビット幅と演算性能が強化されていることが分かる。 それに加えて、飛び飛びのメモリアドレスをまとめてアクセスするScatter/Gatherなどの機能が強化されたり、AI用にFP16やINT16/8などの低精度演算のサポートなどが追加されてきていることが分かる。 A64FXの機能一覧と富士通FX100スパコン、京コンピュータとの比較。A64FXではAI向けにFP16とINT16/8の内積演算が追加された 次の図はA64FXコアのパイプラインダイヤグラムである。基的には京コンピュータで開発したSPARC64のパイプライン構造をキー

    Hot Chips 30 - 富士通が発表したPost-Kスパコンのプロセサ(2) ポスト「京」のプロセッサ「A64FX」を読み解く
  • ポスト「京」はHPCやAIでの活躍に期待 - 富士通がCPUの仕様を公表

    富士通は8月22日、理化学研究所と共同開発を行っているポスト「京」について、搭載するCPU「A64FX」の詳細を発表した。高性能プロセッサと関連技術に関する世界的なシンポジウムである「Hot Chips 30」で公表した。 ポスト「京」は、2011年にTOP500で世界一となったスーパーコンピュータ「京」の後継機として、2021年頃の共用開始を目指して開発が進んでいる。今回、A64FXというCPUを搭載することが公表され、HPCAIといった分野での活躍が期待される。 A64FXのパッケージ写真 A64FXはArmのArmv8-A命令セットアーキテクチャをスーパーコンピュータ向けに拡張する「SVE(Scalable Vector Extension)」を、世界で初めて採用したCPUである。 「A64FX」ブロック図 CPUCPUの間を、「京」に向けて開発された独自のTofuインターコネク

    ポスト「京」はHPCやAIでの活躍に期待 - 富士通がCPUの仕様を公表
    dowhile
    dowhile 2018/08/23
  • 速さ「京」の100倍 スパコン「ポスト京」心臓部開発:朝日新聞デジタル

    スーパーコンピューター「京(けい)」の後継機(ポスト京)で、心臓部となるCPU(中央演算処理装置)の開発に、理化学研究所などが成功した。このCPUを使うことで、実用的な計算速度が世界一で、「京」と比べて最大で約100倍速いスパコンの実現につながるという。2021年の稼働を目指す。 文部科学省によると、「ポスト京」の開発費は約1100億円。理研と富士通は国の補助を受けて、14年から開発を続け、今年6月にCPUの試作品が完成。機能試験の結果、十分な性能を発揮できることが確認できた。新たな製造技術は、一般向けコンピューター用の高性能CPUにも応用できるという。 富士通は米国で21日に開かれる国際会議で詳細な性能を発表する。理研は近く、文科省の有識者会議に報告。心臓部の開発が成功したことを受け、政府の総合科学技術・イノベーション会議が製造を了承する見込みだ。 「ポスト京」は、新型のCP…

    速さ「京」の100倍 スパコン「ポスト京」心臓部開発:朝日新聞デジタル
    dowhile
    dowhile 2018/08/22
  • 高温水冷を使う産総研のABCIスパコン(2) ABCIスパコンのネットワーク構成とストレージ構成

    ABCIはEDR InfiniBandのネットワークを使う InfiniBandスイッチによる接続は、次の図のようになっている。ABCI全体のネットワークをつなぐのはMellanoxのCS7500ディレクタスイッチである。CS7500は最大648ポートの大型のスイッチで、ABCIはこれを2台使っている。 MellanoxのCS7500 ディレクタスイッチ そして、ラックに搭載するリーフスイッチとしては36ポートのSB7890スイッチをラック当たり7台使っている。 接続は、次の図に示すように、各ノードから2ポートが出ており、ラック全体では68ポートある。リーフスイッチは36ポートであるが上側のスイッチへの接続に半分のポートを使うとすると、計算ノードに使えるポート数は18ということになる。4台のリーフスイッチがあり合計で72ポートあるが、その内の68ポートを計算ノードに接続する。 リーフスイッ

    高温水冷を使う産総研のABCIスパコン(2) ABCIスパコンのネットワーク構成とストレージ構成
    dowhile
    dowhile 2018/08/17
  • ポスト「京」開発状況について : 富士通

    English PRESS RELEASE 2018年6月21日 富士通株式会社 理化学研究所 ポスト「京」開発状況について CPUの試作チップが完成、機能試験を開始 富士通株式会社(代表取締役社長 田中達也、以下「富士通」)と理化学研究所(理事長 松紘、以下「理研」)は共同で、文部科学省がスーパーコンピュータ「京」(以下「京」)の後継機として推進するポスト「京」の開発を、2021年頃の共用開始を目指して進めています。このたび、富士通はポスト「京」の中核となるCPUの試作チップを完成し、機能試験を開始しました。 ポスト「京」は科学技術のみならず様々な社会課題の解決に向け、幅広いアプリケーションの性能を引き出す世界最高水準のスーパーコンピュータを目指しています。その実現に向け、CPUには広く普及しているArm®命令セットアーキテクチャ(ISA:Instruction Set Archite

    ポスト「京」開発状況について : 富士通
    dowhile
    dowhile 2018/08/17
  • ISC 2018 - 恒例のSterling教授によるHPC年次総括基調講演(2) Exascaleの実現に向けた道筋

    Exascaleに向けた10大チャレンジ 次の図は、Advanced Scientific Computing Advisory Committeeがまとめた、Exascaleに向けての10大チャレンジのリストである。「エネルギー効率」、「インタコネクトテクノロジ」、「メモリテクノロジ」、「スケーラブルシステムソフトウェア」など、改善が必要な項目が10項目リストされている。 Advanced Scientific Computing Advisory CommitteeがまとめたExascaleに向けての10大チャレンジ Exascaleのシステムでは、アプリケーション開発、アプリケーションを動かすためのソフトウェアスタックの開発、ハードウェアを作るためのテクノロジの開発、そして、それらをまとめてExascaleのシステムとして動くようにするインテグレーションが必要である。 当に役に立つ

    ISC 2018 - 恒例のSterling教授によるHPC年次総括基調講演(2) Exascaleの実現に向けた道筋
    dowhile
    dowhile 2018/08/09
  • 高温水冷を使う産総研のABCIスパコン(3) ABCIスパコン最大の特徴 温水水冷を読み解く(前編)

    温水冷却は何が良いのか ABCIスパコンの1つの特徴は、温水を使った効率の高い冷却方式を採用したグリーンスパコンであることである。実は、温水冷却は東工大のTSUBAME3.0で採用され、ABCIは国内では2システム目の温水水冷マシンであるが、ABCIもTSUBAME3.0も元の設計は松岡先生なので、同じ冷却方式であるのは当然とも言える。温水冷却は、なかなか面白い方式であるので詳しく説明したい。 スマホなどでは、特別な冷却は使わず、温まったスマホの表面の空気が軽くなって上昇することで、周囲から温度の低い空気が入ってくるという自然対流で冷却を行っている。しかし、消費電力が多くなると自然対流では発生する熱を運び出すことはできなくなる。 このため、ファンを付けて、CPUなどの高発熱部品に風を当てて、熱を運び出す空気の量を増やす強制空冷という方式が使われる。 強制空冷で運び出せる熱量は、熱を運ぶ空気

    高温水冷を使う産総研のABCIスパコン(3) ABCIスパコン最大の特徴 温水水冷を読み解く(前編)
    dowhile
    dowhile 2018/08/09
  • ISC 2018 - 恒例のSterling教授によるHPC年次総括基調講演(3) 量子コンピュータの実用性はどの程度のものなのか?

    該当者なしだったSeymour Cray賞 話は変わって、この1年では、スパコン界に重要な貢献をした先駆者が、2人亡くなった。1人は、Wisconsin大学の教授で、NSFのAdvanced Scientific Computing Divisionのディレクタや、マウイスパコンセンターのCTOなどを務めたRobert Borchers氏である。 Wisconsin大のRobert Borchers教授が亡くなられた そして、DenelcorのHEPを開発し、マルチスレッドアーキテクチャの父と呼ばれるBurton Smith氏が亡くなった。Smith氏はTera Computerを創立し、後にTeraはCrayを買収して社名をCrayに変更して現在に至っている。その意味では、Smith氏は、現在のCrayの創立者である。Eckart-Mauchly賞やCray賞、National Acad

    ISC 2018 - 恒例のSterling教授によるHPC年次総括基調講演(3) 量子コンピュータの実用性はどの程度のものなのか?
    dowhile
    dowhile 2018/08/09