サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
ドラクエ3
www.cc.u-tokyo.ac.jp
第111回お試しアカウント付き並列プログラミング講習会 「第1回 ディープラーニング分散学習ハッカソン」 共催:東京大学情報基盤センター、株式会社Preferred Networks、TensorFlow User Group、エヌビディア合同会社、PCクラスタコンソーシアム(実用アプリケーション部会) 開催趣旨 本ハッカソンでは、すでに単一GPUあるいは単一ノードにおいて複数GPUを用いたディープラーニングを実践されている方またはチーム(3人まで)を対象に、情報基盤センター(以降、センター)に設置されたスーパーコンピュータReedbush(Reedbush-H)を活用した分散学習の実践を行います。参加費は無料です。 ハッカソンは参加者がディープラーニングのモデルおよびデータセットを持ち込み、マルチGPU,マルチノードでの分散学習を実践する形で進行します。情報基盤センター教員に加えて、Ch
mp4 ビデオ教材 (Internet Explorer 9以降、Firefox 17.0.1以降、Safari 6.0.2以降にて再生可能) 並列処理解説Ⅰ 並列プログラミングの基礎(17分52秒、60.3MB) 並列処理解説Ⅰ 性能評価指標(15分、46.0MB) 並列処理解説Ⅱ MPI プログラミングの基礎(11分28秒、38.4MB) 並列処理解説Ⅱ 基本的な MPI 関数(22分49秒、92.7MB) 並列処理解説Ⅱ MPI プログラムの実例(15分28秒、70.4MB) 並列処理解説Ⅱ 実際の並列計算機構成例(5分58秒、39.0MB) 並列処理解説Ⅱ バッチ処理と MPI ジョブの投入(8分47秒、40.0MB) 並列処理解説Ⅲ 単体(CPU)最適化の方法の概要(4分15秒、15.7MB) 並列処理解説Ⅲ ループ内連続アクセス(5分17秒、22.4MB) 並列処理解説Ⅲ ルー
C 言語におけるファイル入出力の高速化 東京大学情報基盤センター 黒田 久泰 不連続なメモリ上のデータをファイルに保存する場合、内部バッファサイズを大きくすると実行時間 が短縮できます。また、メモリ上に連続して配置されている大規模なデータをファイルに保存する場合 には、できるだけ大きなデータサイズでファイル入出力を行うことで実行時間が短縮できます。ここで は、これらの方法や性能について紹介します。 1. 内部バッファサイズの変更方法 高水準入出力関数 fopen、fread、fwrite、fclose では内部バッファにデータを貯めておき、内部バ ッファが空になるか一杯になるとまとめてファイル入出力を行います。通常、この内部バッファサイズ はインクルードファイル /usr/include/stdio.h の BUFSIZ で定義されている値になります。例えば、 SR8000/MPP では
実アプリケーションの最適化のテクニック 吉廣 保 東京大学情報基盤センター 1. はじめに スーパーコンピューティングニュース 10 巻 4 号、 5 号と 2 回に渡り、 HA8000 クラスタシステム (以 降 HA8000)で高性能プログラミングを行うための手法や技術を紹介してきました。しかしながら、 HA8000 の利用者全員が自分でプログラムを組み、計算を実行するユーザではなく、フリーソフトウェ アなどをソースからコンパイルし利用する、もしくは与えられたプログラムを使って計算を実行するユ ーザも多いと考えられます。 本稿では、そのようなユーザのために、プログラム本体を修正せずとも、コンパイラオプションなど を修正するだけで、プログラムの高速化ができないかということを、実際に配布されているフリーソフ トウェアを例に挙げて紹介する予定でした。しかしながら、正式運用が開始された段階で、
FX10 スーパーコンピュータシステムでは、ログインノード、インタラクティブノード、計算ノードで、それぞれの特徴に合わせた計算サービスを行っています。長時間あるいは大規模な計算を行う場合はバッチジョブをご利用ください。 また、計算ノードと同じアーキテクチャであるインタラクティブノードで会話的にジョブ実行 (インタラクティブジョブ) できる環境も用意していますので、プログラムのデバッグ実行などでご利用ください。 【ご注意ください】 SR16000システム で利用しているジョブ実行スクリプトとは互換性はありません。新たに作成して頂く必要があります。 インタラクティブジョブ、バッチジョブは以下の表 (表 1. ~ 表 4.) にあるとおり、利用するノード数や実行制限 (経過) 時間により、適切なキュー (ジョブクラス、リソースグループ) に自動的にジョブが割当られ、実行されます。 表 1.インタ
- 1 - 高性能プログラミング(Ⅰ)入門編 片桐 孝洋 東京大学情報基盤センター 特任准教授 1.はじめに 本稿は、高性能プログラミングを始める場合の入門的な解説書を目指して執筆した。特に、コ ンパイラが行う最適化手法について、どのような手法や技術があるか説明する。コンパイラが 行う最適化についてユーザが知る必要は無い思われる方もいるかも知れない。しかし、実用コ ードの多くはコンパイラが解析するにはあまりに複雑な書き方がされており、自動最適化は限 界がある。ユーザがコンパイラの理解しやすい書法を習得するのが望ましいが、コンパイラの 最適化手法を知らないと無理である。したがって、高性能化のためコンパイラの最適化につい てユーザが尐しでも理解することが、ユーザのアプリケーション高速化への近道と思う。 本稿の想定事例は、ユーザのスキルに応じ以下のとおりである: (1)コンパイラが最適化しや す
Fortran におけるファイル入出力の高速化 東京大学情報基盤センター 黒田 久泰 配列データの中身をそのままファイルに保存するような場合は、書式なし入出力を使うことでファイ ル入出力にかかる時間を短縮することができます。また、書式なし入出力ではバッファレス入出力を使 うとさらに高速化されます。 1. 書式付き入出力 書式付き入出力では、FORMAT 文を用いて書式付きでファイルの保存を行います。例えば、配列 a 全体をファイルに保存する場合は次のようにします。 数値 10 の部分は装置番号を指定します。装置番号は 0 から 2,147,483,647(=231 -1)の間から任意に指 定できますが、装置番号 0 は標準エラー出力(stderr)、装置番号 5 は標準入力(stdin)、装置番号 6 は標 準出力(stdout)に接続されています。なお、実行時オプションとして「-F'po
講習会 Wisteria/BDEC-01 お試しアカウント付き並列プログラミング講習会 他団体と共催で開催する講習会 並列プログラミング講習会 東京大学学内向け講習会 他大学が開催する講習会(遠隔配信による講習会) お試しアカウント付き並列プログラミング講習会 スーパーコンピューティング部門では、全国のスーパーコンピュータ利用者、および利用を検討している新規ユーザ(企業の技術者・研究者を含む)を対象とした、スーパーコンピュータを用いた実習付きの並列プログラミング講習会(お試しアカウント付き講習会)を定期的に実施しています。 本講習会は2021 年 8 月に稼働した Wisteria/BDEC-01 システム にて実施される予定です。 並列処理に関する基礎知識を必要としない初級編に始まり、数値計算の応用レベルの並列化まで、受講者の習得レベルに応じた講習会に参加が可能です。並列化には MPI
HOME > システム > FX10 FX10 スーパーコンピュータシステム(Oakleaf-FX,Oakbridge-FX) (大規模超並列スーパーコンピューターシステム,長時間ジョブ実行用並列スーパーコンピューターシステム) 運転状況: ※FX10スーパーコンピュータシステム(Oakleaf-FXおよびOakbridge-FX)は、 2018年3月30日(金) 午前9:00をもってサービスを終了しました。
2021.5月号(Vol.23 No.3)を持ちまして冊子体を終了いたしました。今後は、Web版のみの発行となります。 詳細は、「『スーパーコンピューティングニュース』冊子体発行終了のお知らせ」をご覧ください。 本誌では利用者の皆様からの原稿を募集しています。詳細は執筆要項をご覧ください。 2024年 2023年 2022年 2021年 2020年 2019年 2018年 2017年 2016年 2015年 2014年 2013年 2012年 2011年 2010年 2009年 2008年 2007年 2006年 2005年 2004年 2003年 2002年 2001年 2000年 1999年 2024年 Vol.26 No.5 (2024年9月) センターから サービス休止等のお知らせ (最新情報) システム変更等のお知らせ スーパーコンピュータシステム「大規模HPC チャレンジ」課題
● 日 時:2010年7月12日(月)13:00~17:30 ● 場 所:東京大学武田先端知ビル 5階武田ホール(地図) (最寄駅:東京地下鉄千代田線 根津駅) ● 参加費:無料(事前登録へのご協力をお願いいたします)事前登録はこちら 開催趣旨 筑波大学、東京大学、京都大学の3大学の連携により進められてきた"T2K Open Supercomputer Alliance" のもと、各大学におけるT2Kオープンスパコンの運用開始から2年を迎えました。様々なアプリケーションが実行され、また大規模PCクラスタの運用経験も蓄積されてきました。 T2K Open Supercomputer Allianceでは、これまで4回のシンポジウムを各拠点で行って参りました。このたび、「T2Kシンポジウム2010@東大」を東京大学武田先端知ホールで開催致します。本シンポジウムでは、文部科学省 次世代
Vol.11 No.6 (2009年11月) センターから サービス休止等のお知らせ システム変更等のお知らせ ~HA8000クラスタシステム~ Linpack性能が101TFLOPSに更新されました スーパーコンピューター若手利用者推薦(試行)平成21年度(後期)採択結果 2010年度の利用申込について[新規・継続] 部門の人事異動 8・9月のジョブ統計 資料 T2Kスパコンにおける固有値ソルバの開発 研究報告 第2回クラスタシステム上での並列プログラミングコンテスト実施報告 「お試しアカウント付き並列プログラミング講習会(試行)」実施報告 講習会:科学技術計算のためのマルチコアプログラミング入門 米澤明憲情報基盤センター長 紫綬褒章受章 全国共同利用情報基盤センター顕彰「功績賞」受賞 Vol.11 No.5 (2009年9月) センターから サービス休止等のお知らせ システム変更等のお
粒子法シミュレーションの大規模化と高速化 越塚誠一 東京大学大学院工学系研究科 1.はじめに ここでの粒子法は,流体や固体といった連続体に関する力学を粒子の運動に離散化してシミ ュ レ ー シ ョ ン を お こ な う 方 法 を 意 味 し て い ま す 。 具 体 的 に は , MPS(Moving Particle Semi-implicit)法や SPH(Smoothed Particle Hydrodynamics)法です。また,粉体を粒子の集ま りとして計算する DEM(Discrete Element Method)も加えたいと思います。分子動力学も分子を 粒子として計算する方法ですので,プログラミング上は共通するところも多いはずですが,筆 者の専門外ですので,ここでは除外することにします。 以下,粒子法シミュレーションのプログラミングに関する特徴,計算例,大規模計
情報基盤センターに設置されたスーパーコンピュータの利用者における利用促進、および利用を検討している新規ユーザを対象とした、センターのスーパーコンピュータを用いた並列プログラミング講習会(MPIおよびOpenMPを用いるもの)を実施します。 第7回 2009年9月14日~15日(科学技術計算のためのマルチコアプログラミング入門) 資料(「有限体積法コードの概要、OpenMP超入門」、「オーダリング」、「OpenMPによる並列化」、 「拡張階層型領域間境界分割に基づく並列前処理手法」) 第6回 2009年9月7日~8日 資料(並列プログラミングの基礎、MPI)[PDF] 資料(makeを使った分割コンパイルと並列処理)[PDF] 資料(MPIによる並列アプリケーション開発 「超」入門(Ⅰ)[PDF]・(Ⅱ)[PDF]・演習[PDF]) 第5回 2009年7月1日~2日 資料(並
本部門が運用する計算機は、学術研究・教育・社会貢献を目的として各大学・研究機関等に在籍する大学教員・大学院学生・学部学生・研究者、大学院学生・学部学生の高性能計算演習等によって共同利用されています。 [重要] GPU搭載ノード中心とする次期システム Miyabi 運用開始に向けた、GPU移行ポータルサイトについて ※利用者の皆様へのお願い※ ・ご利用にあたっては、「東京大学情報基盤センタースーパーコンピューターシステム利用規程」をご一読の上、必ず遵守するようお願い致します。 ・アカウントを第三者に利用させることは厳禁です。必ず本人が使用してください。 ・第三者と共通のSSH鍵を使用することはアカウントを共有することと同義のため厳禁です。 ・利用時の注意点をご確認ください。 現在の稼働中サービス お知らせ 最先端共同HPC基盤施設における次期システムの名称を決定 (2024.04.01) 最
- 1 - 高性能プログラミング(Ⅰ)入門編 片桐 孝洋 東京大学情報基盤センター 特任准教授 1.はじめに 本稿は、高性能プログラミングを始める場合の入門的な解説書を目指して執筆した。特に、コ ンパイラが行う最適化手法について、どのような手法や技術があるか説明する。コンパイラが 行う最適化についてユーザが知る必要は無い思われる方もいるかも知れない。しかし、実用コ ードの多くはコンパイラが解析するにはあまりに複雑な書き方がされており、自動最適化は限 界がある。ユーザがコンパイラの理解しやすい書法を習得するのが望ましいが、コンパイラの 最適化手法を知らないと無理である。したがって、高性能化のためコンパイラの最適化につい てユーザが尐しでも理解することが、ユーザのアプリケーション高速化への近道と思う。 本稿の想定事例は、ユーザのスキルに応じ以下のとおりである:(1)コンパイラが最適化しや す
C 言語におけるファイル入出力の高速化 東京大学情報基盤センター 黒田 久泰 不連続なメモリ上のデータをファイルに保存する場合、内部バッファサイズを大きくすると実行時間 が短縮できます。また、メモリ上に連続して配置されている大規模なデータをファイルに保存する場合 には、できるだけ大きなデータサイズでファイル入出力を行うことで実行時間が短縮できます。ここで は、これらの方法や性能について紹介します。 1. 内部バッファサイズの変更方法 高水準入出力関数 fopen、fread、fwrite、fclose では内部バッファにデータを貯めておき、内部バ ッファが空になるか一杯になるとまとめてファイル入出力を行います。通常、この内部バッファサイズ はインクルードファイル /usr/include/stdio.h の BUFSIZ で定義されている値になります。例えば、 SR8000/MPP で
このページを最初にブックマークしてみませんか?
『東京大学情報基盤センター スーパーコンピューティング部門』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く