ブックマーク / tech-blog.optim.co.jp (4)

  • 物体検出器 EfficientDet をブラウザで高速推論 - OPTiM TECH BLOG

    R&D チームの奥村(@izariuo440)です。EfficientDet がブラウザで動いているのを見たことがなかったので、やってみました。以下はブラウザで実行中の様子1です。 結果として、EfficientDet-D0 で 256x256 の解像度の画像を TensorFlow Lite で推論させると、ネイティブで 20 FPS、WebAssembly SIMD support ありの Chrome で 7 FPS 程度の速度性能を確認できました。 Case XNNPACK XNNPACK スレッド数 FPS A OFF N/A 4 B ON 1 15 C ON 4 20 測定環境は MacBook Pro (Retina, 15-inch, Mid 2015) の 2.5 GHz です。 背景と動機 周辺知識 EfficentDet EfficientDet の精度 Effici

    物体検出器 EfficientDet をブラウザで高速推論 - OPTiM TECH BLOG
    soy-curd
    soy-curd 2024/05/24
  • JWT(Json Web Token)を利用するためのOAuth 2.0拡張仕様での認可をGolangでやってみる - OPTiM TECH BLOG

    こんにちは。AI・IoTサービス開発部の青木です。 最近はWebフレームワークやチームビルディング系をやっていますが、 元々はIoTエンジニアとしてのキャリアを積むべくIoTに関わるプログラミングをメインでやっていました。 今回はOPTiM Cloud IoT OSや、OPTiM IoTのデバイス認証として用いられる JSON Web Token (JWT) Profile for OAuth 2.0 を利用して実際に認証を行ってみたいと思います。 grant_type=urn:ietf:params:oauth:grant-type:jwt-bearer とは datatracker.ietf.org JWTを秘密鍵で署名し認可フローとしてOAuth2.0のAccessTokenを要求します。 秘密鍵を利用して認可ができることから、OPTiM Cloud IoT OSではユーザIDやパス

    JWT(Json Web Token)を利用するためのOAuth 2.0拡張仕様での認可をGolangでやってみる - OPTiM TECH BLOG
    soy-curd
    soy-curd 2022/10/04
  • CUDAを一枚の絵にまとめてみた - OPTiM TECH BLOG

    まえがき 初めまして、R&Dチームの宮﨑です。趣味はFPSをやってます。150時間やってますが未だにドンかつをべられていません。普段は深層学習のベンチマークを取ったりしています。 実はひと昔前からあった深層学習。近年実用性が増して一大ブームとなっています。実用的になった背景の一つとしてGPUを用いた高速化により深層学習の学習及び推論が実用的な時間で実行できるようになったことがあります。NVIDIAから提供されるCUDAを用いるとC言語に拡張を加えた形式でCPU+GPUのヘテロジニアスコンピューティングを記述できます。 CUDAを使用するにはCPU+GPUの環境がどのようなハードウェア構成をしており、その上でCUDAがどのようなシステムを構築しているのかを理解する必要があります。この理解なしに漫然とサンプルコードを真似するだけでは意図通りのパフォーマンスが出なかったり、そもそもAPIの意味

    CUDAを一枚の絵にまとめてみた - OPTiM TECH BLOG
    soy-curd
    soy-curd 2020/07/22
  • TensorRT/Rust/CUDA/thrust... 技術選定 2018 - OPTiM TECH BLOG

    オプティム R&D チームの奥村です。今回は、私がどういう風に技術選定してきたかという振り返りです。2018 年は、動画解析ミドルウェアの開発などに取り組んできましたので、その中で学んだことの一部 (TensorRT/Rust/CUDA/thrust) を振り返る形でお伝えししてみます。 学んだこと TensorRT 学び方 検討できなかったこと C++ (復習) 学び方 Rust 学び方 検討できなかったこと おまけ:パフォーマンス解析 CUDA/thrust 学び方 検討できなかったこと さいごに 学んだこと TensorRT 深層学習モデルを高速に推論するために、2017 年末から継続的に取り組んできました。背景は以下を参照してくだい。 tech-blog.optim.co.jp TensorRT にビルトインされていないカスタムレイヤーの実装や、前処理・後処理の実装、学習済みモデル

    TensorRT/Rust/CUDA/thrust... 技術選定 2018 - OPTiM TECH BLOG
    soy-curd
    soy-curd 2019/01/24
    たのしそう
  • 1