1. 概要 NVIDIA が提供するプロファイリングツール Nsight を使って、Jetson Nano で動作するアプリの性能ボトルネックを見つける方法をまとめます。 今回私が Nsight を使おうと思ったきっかけは、前回記事 でもネチネチと作業したように、 TensorFlow Lite GPU Delegate (OpenGLESバックエンド) を使ったアプリを少しでも速くしたかったからです。 ですので、下記のような Posenet による姿勢推測処理負荷の高いアプリを観測対象とします。 なお、観測対象アプリのソースコードは下記にあります: https://github.com/terryky/tflite_gles_app/tree/master/gl2posenet 2. Nsight について 2.1 Nsight 3兄弟 公式ページ にある通り、2019/12月時点におい