タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

GPUに関するttopのブックマーク (7)

  • NVLink & NVSwitch for Advanced Multi-GPU Communication

    Creatives/Designers Data Scientists Developers Executives Gamers IT Professionals Researchers Roboticists Startups

    NVLink & NVSwitch for Advanced Multi-GPU Communication
    ttop
    ttop 2018/03/28
  • GTC2017 - Tesla V100 と CUDA9.0 - KaiGaiの俺メモ

    今年のGTCはジェンスン・ファンCEOの基調講演が3日目に設定されており、そこでVolta世代の新製品 Tesla V100 と、それを搭載するDGX-1などサーバ製品とGPUクラウドが発表された。 4日間の日程のうち、情報の解禁が3日目の正午なので、その後は慌ただしくVoltaのアーキテクチャや、関連するCUDA9新機能のセッションに参加。 聞くべきセッションが被っちゃったりもしたので、できれば基調講演は初日の方が日程に余裕はあったかなぁ…。 Tesla V100について 5120CUDAコア、16GB(HBM2; 900GB/s)のメモリを搭載するまさに化け物プロセッサ。 デバイス全体で80個のSMを搭載する。SMあたりの構成は64CUDA CoreなのでPascalと同等だが、目新しい基軸としてTensor Coreという新しい計算ユニットが追加されている(SMあたり8個 = 全体で

    GTC2017 - Tesla V100 と CUDA9.0 - KaiGaiの俺メモ
    ttop
    ttop 2017/05/22
  • AMD、GPGPU向けの取り組み「ボルツマンイニシアチブ」を発表。CUDAとの互換性も提供 | スラド

    ストーリー by hylom 2015年11月18日 17時20分 ついにAMDがCUDAにすり寄る? 部門より HPC分野の国際会議SC15において、AMDが「ボルツマンイニシアティブ」を発表した(AnandTech)。内容は外部GPUとクラスタに対応したHSA+、CPU/GPU両対応のC++14コンパイラ、CUDAとソースコードレベルで互換性を取るインターフェースの3点だ。ボルツマンの名前は流体解析の格子ボルツマン法や機械学習モデルのボルツマンマシンでGPUが利用されていることから取られたようだ。 HSA+はこれまでのHSAを拡張して外部GPUやHPCクラスタ向けのプログラミングモデルに対応したもの。64bit Linux向けのディスプレイ出力なしのドライバとランタイムが提供され、広帯域インターコネクト経由のノード内/ノード間リモートDMAをサポートする。 Heterogenous C

    ttop
    ttop 2015/12/07
    ブクマするの忘れてた
  • Deep learning実装の基礎と実践

    2. ⾃自⼰己紹介 l 得居 誠也 (Seiya Tokui) l Preferred Networks リサーチャー l Jubatus のアルゴリズム開発 – Jubatus: NTTとPFIで共同開発しているオープンソースの分散 リアルタイム機械学習基盤 http://jubat.us/ l 現在は映像解析とディープラーニングの研究開発に従事 2 3. ニューラルネットの基礎、実装、実験について話し ます l ニューラルネットの道具 – 全体の構成、⾏行行列列による表現、損失関数、誤差逆伝播、SGD l 主要な実装 – Pylearn2, Torch7, Caffe, Cuda-‐‑‒convnet2 l フレームワークの基的な設計 – テンソルデータ、レイヤー、ネット、最適化ルーチン – アーキテクチャの記述⽅方法(宣⾔言的、スクリプティング) l 実験の進め⽅方

    Deep learning実装の基礎と実践
    ttop
    ttop 2014/08/27
  • Google Sites: Sign-in

    Not your computer? Use a private browsing window to sign in. Learn more about using Guest mode

    Google Sites: Sign-in
  • PacketShader - GPU-accelerated Software Router

    New: The I/O engine is now available! We have partially released the source code used in this work. You can find the user-level packet I/O engine for Intel 82598/82599 NICs here. We do not have a definite release plan for other parts of the PacketShader code not made available on the web as of today. What is PacketShader? PacketShader is a high-performance PC-based software router platform that ac

  • GPUを用いたSSLリバースプロキシの実装について - ゆううきブログ

    近年,汎用計算の高速化のためのアクセラレータとして注目されているGPUを,ネットワーク処理に適用する一環として,サーバサイドのSSL処理に注目した論文を読んだので,内容を軽く紹介します. SSLShader - GPU-accelerated SSL Proxy SSLShader SSLShader: Cheap SSL acceleration with commodity processors Proceedings of the 8th USENIX conference on Networked systems design and implementation 2011 なお,評価に使われた実装の一部のソースコードが公開されています. http://shader.kaist.edu/sslshader/libgpucrypto/ 紹介 背景 SSL(Secure Socket

    GPUを用いたSSLリバースプロキシの実装について - ゆううきブログ
  • 1