dannのブックマーク - はてなブックマーク

GPUの温度と性能低下 - Fixstars Tech Blog /proc/cpuinfo
このブログは、株式会社フィックスターズのエンジニアが、あらゆるテーマについて自由に書いているブログです。先日、GeForce GTX 1080 Tiを2枚積んだマシンを計算サーバとして追加導入しました。新しいマシンで意気揚々と学習を回していたのですが、時間がたつにつれて学習速度が低下していったり、マルチGPU化しても性能が伸びなかったりかえって遅くなったりしてしまっていました。このような症状を聞くと熱問題だろうと気づく方も多いかと思いますが、せっかくなので冷却が不十分なGPUがどういった挙動を示すか少し実験してみました。実験内容アプリケーション・計測方法 GPUに負荷をかけるためのアプリケーションとして、ひたすらcuBLASのSGEMM (n=m=k=8192) を実行し続けるプログラムを用意しました。また、各種メトリクスの取得にはNVMLを使用し、およそ10-20ms程度ごと
dann 2019/02/04
gpu
リンク
【TensorRT やってみた】(4): GoogLeNet で性能を検証する - Fixstars Tech Blog /proc/cpuinfo
このブログは、株式会社フィックスターズのエンジニアが、あらゆるテーマについて自由に書いているブログです。遠藤です。 TensorRT やってみたシリーズの締めくくりとして、実際に推論を実行した結果を報告します。第1回: TensorRT の概要について第2回: インストール方法について第3回: 使い方について使用したネットワークについて今回使用したネットワークは 2014 年の ILSVRC で優勝した GoogLe Net です。22層からなるネットワークで、 Inception module というモジュールで複数のカーネルサイズのコンボリューションをパラレルに適用している点が特徴です。 GoogLe Net にはたくさんのレイヤがありますが、それらの理論計算量を求めると、バッチサイズ 1 の 224×224 の入力データに対しておよそ 2GFLOPs となります。理論計算量
dann 2018/12/02
tensorrt
リンク
ONNX のモデル出力と、ONNX を使った推論をやってみた - Fixstars Tech Blog /proc/cpuinfo
このブログは、株式会社フィックスターズのエンジニアが、あらゆるテーマについて自由に書いているブログです。遠藤です。先日、ニューラルネットワークをフレームワーク間でやり取りするフォーマットである NNEF と ONNX を紹介いたしました。今回のブログ記事では、それらのうちの ONNX を実際に利用してみて、実際の使用感をレポートしたいと思います。使用したコードについて今回の実験で使用したコードは、すべて以下のリポジトリにコミットされています。 fixstars / blog / source / onnx_sample / onnx – Bitbucket null 上記のコードを実行する際に使用した Docker コンテナのビルドスクリプトは、以下のとおりです。nvidia-docker を使って実行してください。 fixstars / blog / source / onnx
dann 2018/05/17
onnx
リンク
1