[B! tensorrt] dannのブックマーク

Introduction to NVIDIA TensorRT for High Performance Deep Learning Inference

dann 2022/11/05

tensorrt

リンク

Inference Optimization with NVIDIA TensorRT

dann 2022/11/05

tensorrt

リンク

NVIDIA Deep Learning TensorRT Documentation

dann 2022/11/05

tensorrt

リンク

TensorRTの演算精度・バージョンのメモ - OPTiM TECH BLOG

TensorRT 歴３年となった R&D チームの奥村（@izariuo440）です。今回は、2021/04/12 に発表された Ampere 世代の各種 GPU に対して TensorRT でその性能を十分に引き出すために必要な知識をまとめておきます。FP16/INT8 をうまく使うと、推論速度が２〜４倍になったりするのでおすすめです。演算精度演算精度 FP16/INT8 をサポートしている GPU FP16 の威力 INT8 の威力 TensorRT のバージョン互換性さいごに演算精度 NVIDIA TensorRT は、NVIDIA GPU 上で深層学習モデルを高速に推論するためのプラットフォームです。TensorRT を使うモチベーションについては以下をご覧ください。 TensorRT で物体検出・姿勢推定はどれくらい速くなる？ - OPTiM TECH BLOG Ten

dann 2022/11/05

tensorrt

リンク

Hugging FaceのBERTモデルの推論をTorch TensorRTで高速化 | ゆるいDeep Learning

docker run --gpus all -it --rm -p 8887:8887 --name tensorrt nvcr.io/nvidia/pytorch:22.07-py3 下記コードを参考に実行します。 https://github.com/pytorch/TensorRT/blob/master/notebooks/Hugging-Face-BERT.ipynb Docker内にすでにコードがあるので、そのコードを使用します。 Jupyter-labを起動してコードにアクセスします。

dann 2022/08/17

リンク

onnxruntime/TensorRT-ExecutionProvider.md at master · microsoft/onnxruntime · GitHub

dann 2019/08/02

リンク

ONNX Runtime と NVIDIA TensorRT の統合: プレビューを開始

dann 2019/07/08

tensorrt

リンク

NVIDIA open sources parsers and plugins in TensorRT | NVIDIA Technical Blog

dann 2019/06/18

arm対応といい戦略性のある発表が続くなぁエッジ周りはこれで一段と盛り上がるね

tensorrt

リンク

TensorRTを使ってcaffeモデルを最適化するの巻

TensorRT 4.0は、実行・保存可能なカフェモデルを読み込んで最適化するためのPython APIをサポートしている。先ず、必要なモジュールをインポートする。 import tensorrt as trt import pycuda.driver as cuda import pycuda.autoinit import numpy as np from random import randint from PIL import Image from matplotlib.pyplot import imshow #to show test case from tensorrt import parsers 通常、最初にやる事は、モデル変換と推論プロセスの間に頻繁に使われるロガーを作成することで、tensorrt.infer.ConsoleLoggerで簡単なロガー実装を提供している

dann 2019/03/06

tensorrt

リンク

Developer Guide :: NVIDIA Deep Learning TensorRT Documentation

This NVIDIA TensorRT Developer Guide demonstrates how to use the C++ and Python APIs for implementing the most common deep learning layers. It shows how you can take an existing model built with a deep learning framework and build a TensorRT engine using the provided parsers. The Developer Guide also provides step-by-step instructions for common user tasks such as creating a TensorRT network defin

dann 2019/03/06

tensorrt

リンク

Optimizing TensorFlow Serving performance with NVIDIA TensorRT

dann 2019/03/05

リンク

TensorRTを用いたインファレンスの高速化 - Qiita

自己紹介当記事はKichigai-Friends Advent Calendar 2017です．こんにちは，TrsNium　です．現在　大学を休学して放浪しています．養ってくれる方を募集しています．昨日開催されていたGTCJapnaで行って気になった，TensorRTの紹介をしたいと思います．もし間違えがあればご指摘をお願いしいます. TensorRTとは TensorRTはTensorFlowやPyTorchを用いいて学習したモデルを最適化をし,高速にインファレンスをすることを可能にすることができます．結果的にリアルタイムで動くアプリケーションに組み込むことでスループットの向上を狙うことができます．実際にTesla V100とTensorFlowを使った場合，秒間305枚をインファレンスできるのに対して，Tesla V100とTensorRTは秒間5707枚をインファレンス

dann 2019/02/22

tensorflow tensorrt

リンク

TensorFlow/TensorRT Models on Jetson TX2

dann 2019/02/22

リンク

Speed up TensorFlow Inference on GPUs with TensorRT

https://blog.tensorflow.org/2018/04/speed-up-tensorflow-inference-on-gpus-tensorRT.html https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEg89ciEGdSKLRCQoeHv3mCqvnzV3GSh4pW9u3DJuHVC_a_Gb4wWEJgIEEE9mU6OIhLIhyphenhypheng49vzjjQ5QbPXjZPy5AcsAYEaQFLTtQRaQkJcT61CHGugg3QjogKIBYvVfzYnKtskD2_AZ-G8/s1600/fig1.png April 18, 2018 — Posted by Siddharth Sharma — Technical Product Marketing Manager, NVi

dann 2019/02/22

リンク

Inference With GPU At Scale With Nvidia TensorRT5 On Google Compute Engine

dann 2018/12/23

tensorrt

リンク

GitHub - onnx/onnx-tensorrt: ONNX-TensorRT: TensorRT backend for ONNX

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

dann 2018/12/23

リンク

GitHub - pfnet-research/chainer-trt: Chainer x TensorRT

dann 2018/12/14

リンク

Microsoft の #ONNX Runtime を速攻レビュー - OPTiM TECH BLOG

はじめにオプティムの奥村です。Microsoft が 2018/12/04 に ONNX Runtime を MIT ライセンスでオープンソースとして公開しました。 azure.microsoft.com ONNX Runtime は 2018/10/16 に Preview として公開されて気になっていましたが、コードが公開されたのでざっと目を通してみて、ONNX Model Zoo に登録されている物体検出モデルの Tiny YOLOv2 を動かしてみました。 ONNX Runtime を大雑把にいうと以下のようになると思います。 Menoh、 onnx-tensorrt のような ONNX の推論エンジンのひとつ CUDA・MKL-DNN の計算支援を受けた高速な推論が可能で、nGraph や TensorRT に対応予定 Linux/Mac/Windows で動作 CPU は A

dann 2018/12/09

リンク

TensorRT で物体検出・姿勢推定はどれくらい速くなる？ - OPTiM TECH BLOG

今回は、TensorRT で物体検出・姿勢推定はどれくらい速くなるのかを紹介します。せっかちな人のために、TensorRT による効果を先にかいつまんで書いておきます。 RefineDet という物体検出モデルでは 38 fps が 68 fps に向上 (x1.8 Faster!) OpenPose という複数人物姿勢推定モデルでは 10 fps が 25 fps に向上 (x2.5 Faster!) ベンチマークは NVIDIA GeForce GTX 1080 Ti で実施なぜ TensorRT を使うのか、という導入が長いですが、興味があればどうぞ。自己紹介最近やっていること背景深層学習モデルの推論とその課題ハードウェアの動向ソフトウェアの動向 TensorRT 物体検出・姿勢推定をベンチマーク RefineDet のベンチマーク結果 OpenPose のベンチマーク

dann 2018/12/03

リンク

【TensorRT やってみた】(4): GoogLeNet で性能を検証する - Fixstars Tech Blog /proc/cpuinfo

このブログは、株式会社フィックスターズのエンジニアが、あらゆるテーマについて自由に書いているブログです。遠藤です。 TensorRT やってみたシリーズの締めくくりとして、実際に推論を実行した結果を報告します。第1回: TensorRT の概要について第2回: インストール方法について第3回: 使い方について使用したネットワークについて今回使用したネットワークは 2014 年の ILSVRC で優勝した GoogLe Net です。22層からなるネットワークで、 Inception module というモジュールで複数のカーネルサイズのコンボリューションをパラレルに適用している点が特徴です。 GoogLe Net にはたくさんのレイヤがありますが、それらの理論計算量を求めると、バッチサイズ 1 の 224×224 の入力データに対しておよそ 2GFLOPs となります。理論計算量

dann 2018/12/02

tensorrt

リンク

はてなブックマーク

タグ

関連タグで絞り込む (7)

tensorrtに関するdannのブックマーク (22)

お知らせ

今週のはてなブックマーク数ランキング（2024年6月第3週）

今週のはてなブックマーク数ランキング（2024年6月第2週）

月間はてなブックマーク数ランキング（2024年5月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス