タグ

cvと*techに関するsh19910711のブックマーク (6)

  • NPUを限界まで使い切って400FPSで物体(パイロン)検出する - Qiita

    1080P120のビデオをSBC(ROCK5B)で推論している動画です。平均で360FPS程度出ているので、3倍速で再生されています。これなら高速移動体からも正確にパイロンへの距離が認識出来ます。 目次 NPUとは? 高速推論を実行するまでの流れ Yolov5での学習 Export RKNN形式への変換 Edgeデバイスでの推論 NPUとは NPUは、Neural Processing Unitの略称で、AI専用のプロセッサーです。NPUは大量の計算を並列処理することに特化しており、機械学習に専用設計されたチップであるため、GPUよりも効率的に処理を実行できます。NPUを使うことで、画像認識や自然言語処理などの機械学習タスクを高速に実行することができます。最近は、IntelやAMD、モバイルデバイス向けに多く組み込まれるようになってきています。 今回利用するするROCK5Bに搭載されている

    NPUを限界まで使い切って400FPSで物体(パイロン)検出する - Qiita
    sh19910711
    sh19910711 2024/06/14
    "NPU: 大量の計算を並列処理することに特化しており、機械学習に専用設計されたチップ / 現状、ベンダー毎に提供されるAPIを利用したりモデルの変換の手間がありますが、低消費電力で超高速推論が可能" 2023
  • threestudioでProlificDreamerを動かす

    はじめに 画像生成だけでなく、3Dモデル生成の品質もかなり上がってきました。特にtext-to-3Dモデルは、驚異的な進歩を見せています。 一番左のDreamFusion(2022年9月公開)から、一番右のProlificDreamer(2023年5月公開)まで、僅か8ヶ月しか経っていません。 研究者であれ開発者であれクリエイターであれ経営者であれ、このぐらいの技術進歩速度は予見して行動すべきでしょうし、少なくとも追従できる必要があると思います。 幸いなことにProlificDreamerの論文公開3日後には、技術解説記事が公開されています。 また、幸いなことに論文公開当日には、3Dモデル生成のライブラリであるthreestudioで非公式実装が公開されています。 公開当初から品質が改善され、昨日2023/6/3時点では以下のような生成ができるようです。 記事では、threestudio

    threestudioでProlificDreamerを動かす
    sh19910711
    sh19910711 2024/06/08
    "3Dモデル生成の品質もかなり上がってきました。特にtext-to-3Dモデルは驚異的な進歩 / DreamFusion(2022年9月公開)から、一番右のProlificDreamer(2023年5月公開)まで僅か8ヶ月" 2023
  • マルチモーダル学習ライブラリ Heronと⾃動運転への応⽤

    sh19910711
    sh19910711 2024/05/24
    "運転: 人間は無意識のうちに多くの「文脈」を理解している / Heron: 様々なモデルを組み合わせて学習(画像エンコーダ・アダプター・LLM) / 大規模分散学習: ABCIグランドチャレンジで実施 + V100 256基を使用"
  • ゼロからわかる3次元計測 3Dスキャナ,LiDARの原理と実践 - ぱたへね

    ゼロからわかる3次元計測 3Dスキャナ,LiDARの原理と実践 www.ohmsha.co.jp カメラを使った計測に興味がある人に呼んで欲しい。 そもそも3次元計測とはなにかから説明があり、結構小難しい話がとても良くまとまっています。 特にカメラの補正機能が何をやっていて測量時にどういう影響があるかは、仕事でやる人は目を通して欲しいなと思いました。 OpenCVを使ったキャリブレーションも、単にライブラリの使い方を説明するのではなく、原理や実際にやる上での注意点が書いてありとても良かったです。 後半は、実際に3D計測をやってみようという内容になります。 ここでも原理をさらっと説明した上で、実際にやっている様子やソースコードもあって分かりやすいです。まあ、実際仕事でやるならお金払って市販の3D Scannerを買うことになるので、どちらかというとホビーか勉強用の情報ですね。ただ、読んでい

    ゼロからわかる3次元計測 3Dスキャナ,LiDARの原理と実践 - ぱたへね
    sh19910711
    sh19910711 2024/05/02
    "カメラの補正機能が何をやっていて測量時にどういう影響があるか / OpenCVを使ったキャリブレーションも、単にライブラリの使い方を説明するのではなく、原理や実際にやる上での注意点が書いてありとても良かった" 2023
  • 7帖の室内で球速を測ってみる話 - すぎやまたいちのブログ

    こちらは ドワンゴ Advent Calendar 2021 4日目の記事です。 はじめに 新型コロナウイルス対策の一環としてテレワークが急速に普及し、今はご自宅でお仕事をされている方も多いのではないでしょうか。 私が働く会社でも、感染対策として昨年2月という比較的早い時期から原則在宅勤務が導入され、昨年7月にその制度が恒久化されました。 さて突然ですが、みなさんの仕事部屋に防球ネットは置いてありますか? 私はあります。(マウント) 仕事部屋です 防球ネットが仕事部屋にあると非常に便利です。仕事で溜まったストレスをいつでも軟式M号球に込めて防球ネットにぶつけて発散することが出来ます。 ただ、仕事部屋の広さは約7帖で、日の一般的な住宅の1室としては普通の広さかなと思いますが、軟式球を投げるにはあまりに狭過ぎます。 それでも防球ネットは安定して私の投げたボールを受け止めてくれるので素晴らしい

    7帖の室内で球速を測ってみる話 - すぎやまたいちのブログ
    sh19910711
    sh19910711 2022/06/15
    "防球ネットが仕事部屋にあると非常に便利です。仕事で溜まったストレスをいつでも軟式M号球に込めて防球ネットにぶつけて発散することが出来ます / 白色のボールを白色の壁の部屋で検出するのは難しい"
  • THETAプラグインでTensorFlow Liteのセグメンテーションをかける - Qiita

    はじめに リコーのYuuki_Sです。 弊社ではRICOH THETAという全周囲360度撮れるカメラを出しています。 RICOH THETA VやTHETA Z1は、OSにAndroidを採用しており、Androidアプリを作る感覚でTHETAをカスタマイズすることもでき、そのカスタマイズ機能を「プラグイン」と呼んでいます。(詳細は記事の末尾を参照)。 上述の通りTHETAは、カメラでありながらAndroid端末でもあるため、単体で撮影し機械学習の処理をかけて出力することが可能です。 以前、@KA-2さんがTHETAプラグインで連続フレームにTensorFlow Liteの物体認識をかける記事を掲載しましたが、今回はセマンティックセグメンテーションを実施する方法を記載しようと思います。 記事を参考にすることで、セグメンテーション結果をライブプレビューに反映したり、 下図の様に人物と背

    THETAプラグインでTensorFlow Liteのセグメンテーションをかける - Qiita
  • 1