[B! ONNX][C++] makaya2のブックマーク

makaya2 id:makaya2

ONNXとC++に関するmakaya2のブックマーク (3)

Introduction to Python calling C++ PYBIND11 - Programmer Sought
makaya2 2021/01/05
Python

C++

ONNX
リンク
ONNX Runtimeを使ってみるその2(性能測定) - TadaoYamaokaの開発日記
先日、ONNX Runtimeを使って、MNISTの推論を試した。今回は、dlshogiのResnet 10ブロック、192フィルタのモデルを使って、GPUで実行した場合の速度と、CPUで実行した場合の速度を比較した。測定条件 GPUでのONNXの推論にはTensorRT(FP16)を使用する。 CPUの測定にはONNX Runtimeを使用し、デフォルトのCPUプロバイダと、MKL-MLを有効にしたCPUプロバイダ、DNNLプロバイダのそれぞれで測定した。 OSはWindows 10 64bit、GPUはGeForce 2080Ti、CPUはCore i7-6700K(4コア、8スレッド、4GHz)を使用した。推論の対象は、floodgateの棋譜からサンプリングした1万局面、バッチサイズは128とした。それぞれの条件で、3回測定し、その平均時間を求める。 GPUで実行した場合の
makaya2 2020/12/15
機械学習

ONNX

C++

TensorRT
リンク
ONNX Runtimeを使ってみる - TadaoYamaokaの開発日記
dlshogiはCUDAに対応したNvidiaのGPUが必須になっているが、AMDのGPUやCPUのみでも動かせるようにしたいと思っている。 Microsoftがオープンソースで公開しているONNX Runtimeを使うと、様々なデバイスでONNXモデルの推論を行うことができる。 TensorRT対応で、ONNXのモデルを読み込めるようになったので、ONNX Runtimeに対応すれば同じモデルを使いまわせる。 ONNX Runtimeは、PythonやC#など複数の言語のインターフェースが提供されている。 dlshogiに組み込むにはC++のインターフェースが必要だが、C++も提供されている。推論に使うデバイスは、CPUやCUDA、TensorRT、DirectX、MKL-DNNなど複数のデバイスを切り替えられるようになっている。 DirectXに対応すれば、AMDのGPUでも高速に推
makaya2 2020/12/07
機械学習

ONNX

C++
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx