概要この例では、移動カメラから撮ったビデオに映っている人物を自動的に検出し、追跡する方法について説明します。これは、追跡システムを移動カメラに応用する際の柔軟性を示すものであり、自動車安全性のアプリケーションに最適です。静止カメラを使った動きに基づく複数のオブジェクトの追跡の例とは異なり、この例にはアルゴリズム上の追加ステップがいくつか含まれています。こうしたステップには、人物の検出、カスタマイズされた非最大値抑制、ヒューリスティックな方法による誤警報トラック (false alarm track) の特定と排除などが含まれます。詳細については、複数オブジェクトの追跡を参照してください。 この例は、本体部分が上部にあり、ヘルパー ルーチンが入れ子関数とはの形式で下部に置かれた関数です。 % Create system objects used for reading video, load
ミーンシフトの原理と応用 岡田和典 サンフランシスコ州立大学 計算機科学科 E-mail: kazokada@sfsu.edu あらまし ミーンシフトは、カーネル密度推定を用いるロバストなデータ解析手法で、福永らによっ て提唱されたのち最近の Cheng や Comaniciu の定式による広範なビジョン問題への応用成功例が知ら れている。本稿では、ミーンシフト法の基本原理およびその一般的な特徴と利点を順を追って解説し た上で、最近の理論的拡張および画像の領域分割やビデオ上の物体追跡などの実際のビジョン応用例 について概説する。 キーワード ミーンシフト, カーネル密度推定, 最頻値探索, クラスタリング, 領域分割, 物体追跡 Mean Shift: from Theory to Application Kazunori Okada Computer Science Departme
このサイトについて DERiVEはコンピュータビジョン、画像認識が専門のMasaki Hayashiがお送りしている、コンピュータビジョン(Computer Vision)を中心としたITエンジニア、研究向けのブログです。※「DERiVE メルマガ別館」は2015/9月で廃刊致しました、 ML Advent Calendar2012のこの記事へのリンクから飛んできた皆さんこんにちは。この記事は私が担当させていただく、2012/12/19のML advent calender向け記事になります。 まず最初に、はじめてこのブログにいらっしゃった非コンピュータビジョンクラスタ向けに、簡単に自己紹介をしておきます。私は慶応義塾大学の後期博士課程に所属している、学生研究者の林(@payashim)と申します。私は修士修了後、(画像以外の計測も含めて)各種計測システムの開発者をしておりましたが、昨年退
Vol. 48 No. SIG 16(CVIM 19) Nov. 2007 † 1 1 101 6 The Current State and Future Directions on Generic Object Recognition Keiji Yanai† “Generic object recognition” aims at enabling a computer to recognize objects in images with their category names, which is one of the ultimate goals of computer vision research. The categories which are treated with in generic object recognition have broad variabili
J-GLOBAL ID:200902274295784762 整理番号:09A0614038 ドライバーの意図認識とカー・ロボティクス・シミュレータ 出版者サイト 複写サービスで全文入手 {{ this.onShowCLink("http://jdream3.com/copy/?sid=JGLOBAL&noSystem=1&documentNoArray=09A0614038©=1") }} 高度な検索・分析はJDreamⅢで {{ this.onShowJLink("http://jdream3.com/lp/jglobal/index.html?docNo=09A0614038&from=J-GLOBAL&jstjournalNo=S0434A") }}
1月6日追記:作者のPablo氏とメールのやり取りをする中で、当初掲載していたスピードのベンチマークはコンパイラの最適化オプションが指定されていなかったことに気づきましたので、最適化オプションを指定して再度計測し、結果を差し替えました。 2012年のComputer Vision Advent Calendarで、さかな前線 » ECCV2012で発表されたKAZE局所特徴量を試してみた という記事を見て以来、ずっと気になっていた、KAZE特徴量を自分でも使ってみようと色々試していたところ、KAZE特徴量を高速化したAKAZE特徴量が公開されていることに気づきました。 AKAZE Features Accelerated KAZEとかいうKAZEの高速化版がいつの間にか作られていた。動画を見る限り、リアルタイムの用途にも使えそう。試してみるか。 http://t.co/Q3mEMuaeV4
SSII2021 [OS2-02] 深層学習におけるデータ拡張の原理と最新動向 6月10日 (木) 11:00 - 12:30 メイン会場(vimeo + sli.do) 登壇者1:中山 英樹 氏(東京大学) 登壇者2:幡谷 龍一郎 氏(東京大学) 概要:データ拡張は画像認識の精度向上テクニックとして古くから用いられてきたが、最新の深層学習においても最重要技術の一つとして年々注目を集めており、多様かつ複雑な進化を遂げている。その成功のカギは、タスクに関する先見知識を活用しながら、如何にして汎化性能を高めるように訓練画像を変換あるいは生成するかにある。本講演では、データ拡張の原理や最新動向について解説すると共に、自動的なデータ拡張に関する講演者の研究事例についても紹介する。
東京大学 松尾研究室が主催する深層強化学習サマースクールの講義で今井が使用した資料の公開版です. 強化学習の基礎的な概念や理論から最新の深層強化学習アルゴリズムまで解説しています.巻末には強化学習を勉強するにあたって有用な他資料への案内も載せました. 主に以下のような強化学習の概念やアルゴリズムの紹介をしています. ・マルコフ決定過程 ・ベルマン方程式 ・モデルフリー強化学習 ・モデルベース強化学習 ・TD学習 ・Q学習 ・SARSA ・適格度トレース ・関数近似 ・方策勾配法 ・方策勾配定理 ・DPG ・DDPG ・TRPO ・PPO ・SAC ・Actor-Critic ・DQN(Deep Q-Network) ・経験再生 ・Double DQN ・Prioritized Experience Replay ・Dueling Network ・Categorical DQN ・Nois
東芝は12月15日、1台のカメラで広範囲を撮影した映像から、人や車の数を高精度に計測できる技術を開発したと発表した。 従来の計測技術では、人やものの存在確率を対象となる画像の輝度値をもとに推定する密度マップが使用されていたが、計算量が膨大で、性能向上には非常に多くのメモリを使用する必要があった。 今回東芝は、人やものの位置をベクトルで表す独自のCOUNTフォレスト方式を開発した。同方式では、画像における人数と位置のみを統計学習し、画像から人の位置を示すベクトルの情報を推定。推定した位置を中心に、予め正規分布で作成した一人の密度マップを重ね合わせて集団の密度マップを算出して、人数を計測する。従来方式と比べ、人数と位置に特化した学習を行うため、省メモリで高精度に人やものの数を推定することができるという。 これまで最も性能の高かった方式で平均絶対誤差が3.43人であった公開データに対し、COUN
防犯カメラは、台数が増えるとともに、監視スタッフの負担も大きい。しかし「異変」が起きたときにリアルタイムに状況を知らせてくれる技術によってその負担を減らすことができる。
単眼計測の考え方 Homography(ホモグラフィー) 平面上にある四角形で、その4頂点をカメラで写した時、実際の点と対応する画像上の点との間には相関関係があります。 即ち、カメラ画像から実際の位置を計算することが出来ます。平面射影変換とも言います。 以下に具体的な例を示します。 今、平面上の点1~4の画像上の点を i-iv とすると、画像上の点v から、平面上の実際の点の位置5を算出することが出来ます。 平坦な床や道路にあるものや、動いているものの位置を観察したい場合などにはこの方法を用いることが出来ます。また、物体間の寸法なども計測できます。 平面の定義は最初に一度行うだけでよく、後はカメラによる観察だけになります。 応用例として、 平面上の寸法計測、正面化などがあります。 Resection(リセクション) これは、画像に写った物体の形状寸法からカメラの位置と方向とを算出することで
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く