qiita.com[B!]新着記事・評価 - はてなブックマーク

『qiita.com』

ONNX Runtimeでプロファイルを取ってみる - Qiita
3 users
qiita.com/project_raizin

Rasperry Pi 4のCPUでDeep Learningを高速化の続きです。 Deep Learningを高速化するためには、どの処理がどれくらいの時間を消費しているかを調査して、実際の処理時間を削減していく必要があります。そのため、まずはONNX Runtimeのプロファイル機能を使用してプロファイリングを行います。プロファイル機能を有効にする方法はONNX公式チュートリアルに記載されています。 import onnxruntime options = onnxruntime.SessionOptions() options.enable_profiling = True # <- プロファイル機能有効化 session = onnxruntime.InferenceSession(path_to_model, options) [プロファイル対象] prof_file = se
- テクノロジー
- 2020/10/04 23:02

Rasperry Pi 4のCPUでDeep Learningを高速化 - Qiita
3 users
qiita.com/project_raizin

私たちは、マルチコアCPUやSIMDアーキテクチャのHW性能を引出す組込みSW最適化技術をコアコンピタンスとするスタートアップを目指す有志集団です。 Raspberry Pi 3/4のCPUだけでどれくらいDeep Learningを高速化できるかに挑戦しています。過去、Chainerやdarknetといったフレームワーを対象としていましたが、現在はONNX runtimeの高速化に挑戦しています。現時点での結果は以下の通りです。 @onnxruntime on RPi4(CPU Only) MobileNetV3(Image clasification) MobileNetV2-SSDLite(Image detection) Original vs. Accelerated#RaspberryPi #Python #DeepLearninghttps://t.co/wvBLn9Tf
- テクノロジー
- 2020/09/19 12:02

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx