タグ

object-detectionに関するnabinnoのブックマーク (2)

  • GPT4oを使って、訓練無しで物体検出(BBox)ができるか試してみる

    今日も今日とてopenAIの新発表が機械学習界隈を賑わせていますね。 今回は、2024/05/14に発表されたGPT4oについてです。 返答速度があがったり画像認識精度があがったり音声会話の性能が良くなったりと色々話題が尽きません。 具体的にどのあたりが凄くなったのかは僕以外にもまとめている人が多そうなのでこの記事では触れません。 個人的に特に気になっているのが画像認識の精度向上部分で、今回は画像認識精度がどの程度あがったのか?というのを画像系機械学習の主要なタスクであるBBoxによる物体認識というタスクで簡単にチェックしてみようと思います。 BBoxとは BBoxはBoundingBoxの略で、画像内の特定のオブジェクトを囲むために使用される長方形のボックスの事を指します。 BoundingBoxの定義は以下の通り このBBox検出は画像系機械学習モデルの基的なタスクであり、自動運転の

    GPT4oを使って、訓練無しで物体検出(BBox)ができるか試してみる
  • 物体検出 - Wikipedia

    80クラスの一般的な物体を検出できるCOCOデータセットで学習されたYOLOv3モデルを使用して、OpenCVのディープニューラルネットワークモジュール(DNN)で検出された物体。 物体検出(ぶったいけんしゅつ、object detection)は、デジタル画像処理やコンピュータビジョンに関連する技術の一つで、デジタル画像・動画内に映っている特定のクラス(人間、建物、車といったカテゴリー)の物体を検出するものである[1]。物体検出はコンピュータビジョンの基礎的な学問領域であり、画像分類(英語版)や顔認識、自動運転など多くの分野でその知見が応用されている[2]。深層学習(ディープラーニング)技術の進展に伴い、物体検出の分野でもR-CNNYOLOSSDなどの深層学習を用いた手法が広く使われるようになって精度も大きく向上したが、一方で物体検出分野に特有の技術的な課題や学習・評価に必要なデータ

    物体検出 - Wikipedia
  • 1