タグ

ブックマーク / qiita.com/terryky (2)

  • Raspberry Pi4 単体で TensorFlow Lite はどれくらいの速度で動く? - Qiita

    1. はじめに 世の中にはDeepLearningの学習済みモデルを公開してくださっている方がたくさんいらっしゃいます。記事は、そのうちのいくつかをラズパイ4で動かしてみて、いったいどれくらいの速度で動くのかを検証したものです。 計測対象モデルとして、Mediapipe および TensorFlow.js、TensorFlow Lite models で公開されている学習済みモデルを利用させて頂きました。またモデル実行フレームワークとしては、モバイル向けに整備が進む TensorFlow Lite (C++) を用いました。 計測にあたっては、公開されているモデルをそのまま動かすだけでなく、一般的な高速化手法である下記の2手法を両方試し、その効果も計測しました。 [1] モデルをint8量子化する方法 演算精度に多少目をつぶる代わりに、NEON等のSIMD演算器による並列処理の並列度をさ

    Raspberry Pi4 単体で TensorFlow Lite はどれくらいの速度で動く? - Qiita
  • Raspberry Pi4 で TensorFlow Lite GPU Delegate (OpenGLES) を試す - Qiita

    0. 更新履歴 (2020/06/27) Tensorflow r2.3用に記述内容を全面修正しました。 1. はじめに ラズパイ4の OpenGLES はリリース当初 ver 3.0 でしたが、2020/1月に ver 3.1 にアップデートされました。 OpenGLES 3.1 では、ComputeShader が使えるようになり、GPGPUプログラミングしやすくなります。超うれしいアップデートです。 一方 TensorFlow Lite には、推論にかかる演算処理を CPUからGPU にオフロードする GPU Delegate 機能があります。 この GPU Delegate は、さらに V1(OpenGLES) と V2(OpenCL) とがあり、V1 は OpenGLES 3.1 が使える環境であれば動かすことができます。V2は OpenCL が使える環境での動作を想定しています

    Raspberry Pi4 で TensorFlow Lite GPU Delegate (OpenGLES) を試す - Qiita
    kenzy_n
    kenzy_n 2020/02/02
    なかなかのハードウェアスペックにこれからの可能性を夢見る
  • 1