サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
Wikipedia
accc.riken.jp
CUDAプログラミング入門 2012年6月1日版 理化学研究所 情報基盤センター 青山幸也 はじめに 本書は、C 言語のプログラムを CUDA 化して GPU を使用する方法を説明した、初心者向けの講習会テキストです。 GPU は、理化学研究所の RICC (Riken Integrated Cluster of Clusters) に導入されている、NVIDIA 社の C1060 を想定し、 Compute Capability は 1.3 を想定します。本書を読むための前提として、C 言語の基本的な知識が必要になります。 Fortran のプログラムを CUDA 化する方法、PGI コンパイラの使用方法、GPU の新アーキテクチャー Fermi での使用 方法などについては、今後順次加筆する予定です。 なお、本書の記述中に、誤字や脱字、プログラムのバグ、筆者の誤解による記述ミスなどあ
注意 1 原稿をイメージデータとして読み込んでPDFファイル化したため、サイズが大きくなっています。 テキストの内容は今後不定期に加筆修正します 。 下記資料に関するお問い合わせは までご連絡下さい。 注意 2 以下は(1)(2)のテキストの注意点です。 ファイル名の末尾についている「20xx-xx-xx」は、そのファイル内のページが最後に更新された日付を示します。 簡易製本する際は、i, iii, vページ(vは(2)のみ) 、および本文の奇数ページ(例えば1-1,1-3,・・・,2-1,2-3,・・・)が 、 見開きした右側のページになるようにして下さい 。 参考 掲載しているテキストは現在外部の機関で運用(更新、講習会の実施)が行われています。最新のテキストの入手をされたい方はこちらからダウンロードしてください。 (1) 「チューニング技法入門」(旧「チューニング技法虎の巻」) 「
キャッシュの効果と計算サイズ 姫野ベンチとは 姫野ベンチマークは情報基盤センター・センター長の姫野龍太郎氏が非圧縮流体解析コードの性能評価のために考えたものでポアッソン方程式解法をヤコビの反復法で解く場合に主要なループの処理速度を計るものです。 コードは非常に短く簡単にコンパイル・実行できるので、即座に実測速度(何 MFLOPS)を求めることが出来ます。 # 計算機ごとの性能による測定時間の差を少なくするために、計算時間を一定にするように、これまでのソースコード(姫野ベンチ 98)を一部修正し himenoBMTxp として新しいソースコードに変更しました。Fortran バージョンに関しては、測定の核の部分には変更は無いので、これまでの測定結果とも比較することは出来ます。しかし、C バージョンに関しては配列の宣言方法を Fortran バージョンとの整合性を持たせるために、以前のバージョ
(2009年7月21日更新) 注意 原稿をイメージデータとして読み込んでPDFファイル化したため 、 サイズが大きくなっています。 全ページを含むファイルと 、 章(またはいくつかの節)ごとに分割したファイルの2種類があります(内容は同じです)。 テキストの内容は今後不定期に加筆修正します 。 ファイル名の末尾についている 「20xx-xx-xx 」 は、そのファイル内のページが最後に更新された日付を示します 。 簡易製本する際は 、i, iii, vページ(vは(2)のみ) 、 および本文の奇数ページ(例えば1-1,1-3, ・ ・ ・,2-1,2-3, ・ ・ ・)が 、 見開きした右側のページになるようにして下さい 。 下記資料に関するお問い合わせは までご連絡下さい 。 (1) 「チューニング技法入門」(旧「チューニング技法虎の巻」) 「スカラー・チューニング講習会」 で配
単精度190Tflops GPUクラスタ (長崎大)の紹介 長崎大学工学部 超高速メニーコアコンピューティングセンター テニュアトラック助教 濱田 剛 2009/3/12 理研シンポジウム-第3世代PCクラスタ 1 概要 GPU (Graphics Processing Unit)について簡単に GPU 説明します. GPUクラスタが得意とする応用問題を議論し GPU 長崎大学でのGPUクラスタによる 長崎大学での 取組方針 取組方針 N体計算の高速化に関する研究内容 を紹介します. まとめ まとめ 2009/3/12 理研シンポジウム-第3世代PCクラスタ 2 GPU (Graphics Processing Unit) パソコンの3D描画アクセラレータ パソコンの 演算性能が急速に向上 演算性能が急速に向上 ~ 1 T flops/board flops/board オンボードメ
GPU Computing with CUCA & Tesla - Accelerating Scientific Discovery
姫野ベンチマークは情報基盤センター・センター長の姫野龍太郎氏が非圧縮流体解析コードの性能評価のために考えたものでポアッソン方程式解法をヤコビの反復法で解く場合に主要なループの処理速度を計るものです。 コードは非常に短く簡単にコンパイル・実行できるので、即座に実測速度(何 MFLOPS)を求めることが出来ます。 # 計算機ごとの性能による測定時間の差を少なくするために、計算時間を一定にするように、これまでのソースコード(姫野ベンチ 98)を一部修正し himenoBMTxp として新しいソースコードに変更しました。Fortran バージョンに関しては、測定の核の部分には変更は無いので、これまでの測定結果とも比較することは出来ます。しかし、C バージョンに関しては配列の宣言方法を Fortran バージョンとの整合性を持たせるために、以前のバージョン(姫野ベンチ98)とは変更していますので、
「スカラー・チューニング講習会」と「並列プログラミング(MPI)講習会」で配布したテキスト 理研スパコン・システム講習会(内部向け)のうち、 「スカラー・チューニング講習会」と「並列プログラミング(MPI)講習会」で配布したテキストは、下記からダウンロード可能ですのでご自由にお使い下さい(当ページはリンクフリーです)。なお、 理研スパコン・システムのユーザーの方は、講習会で配布した、理研スパコン・システムに固有の使い方について説明した 「補足資料 」 も参照して下さい。 「補足資料」は理研HPCポータル(IDが必要)の「Document」の「Programming Class Materials」の「Scalar tuning and Parallel programming (Supplement)」にあります。 注意 原稿をイメージデータとして読み込んでPDFファイル化したため 、 サ
このページを最初にブックマークしてみませんか?
『理化学研究所情報システム部 | スーパーコンピュータおよび職員向けサービスの情報...』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く