タグ

cnnと画像認識に関するxiangzeのブックマーク (4)

  • Vitis AI で開発を開始

    開発者サイトでは、AMD のアダプティブ コンピューティング プラットフォームを使用する開発に役立つ、最新かつ包括的な Vitis™ AI 開発ガイダンス、チュートリアル、リファレンス デザイン、トレーニング コースなど、数多くの技術リソースを提供しています。 Vitis AI プラットフォームを使用する開発の詳細 >

    Vitis AI で開発を開始
  • 畳み込みニューラルネットワークの研究動向

    2017年12月に開催されたパターン認識・メディア理解研究会(PRMU)にて発表した畳み込みニューラルネットワークのサーベイ 「2012年の画像認識コンペティションILSVRCにおけるAlexNetの登場以降,画像認識においては畳み込みニューラルネットワーク (CNN) を用いることがデファクトスタンダードとなった.ILSVRCでは毎年のように新たなCNNのモデルが提案され,一貫して認識精度の向上に寄与してきた.CNNは画像分類だけではなく,セグメンテーションや物体検出など様々なタスクを解くためのベースネットワークとしても広く利用されてきている. 稿では,AlexNet以降の代表的なCNNの変遷を振り返るとともに,近年提案されている様々なCNNの改良手法についてサーベイを行い,それらを幾つかのアプローチに分類し,解説する.更に,代表的なモデルについて複数のデータセットを用いて学習および網

    畳み込みニューラルネットワークの研究動向
  • 3D CNNによる人物行動認識の動向

    2. 人物行動認識 1 入力:動画 → 出力:行動ラベルという課題 *K. Soomo+, “UCF101: A Dataset of 101 Human Actions Classes From Videos in The Wild”, CRCV-TR-12-01, 2012. * 3. 代表的な大規模行動認識データセット | Trimmed 2 切り出し済み or 開始終了ラベル込み動画  HMDB-51: 7000動画 (Movie, YouTube),51クラス  UCF-101: 13000動画 (YouTube),101クラス  ActivityNet: 28000動画 (YouTube),200クラス  Kinetics: 30万動画 (YouTube),400クラス 大規模化がどんどん進んでいる 4. 代表的な大規模行動認識データセット | Untrimmed 3

    3D CNNによる人物行動認識の動向
  • Is Second-order Information Helpful for Large-scale Visual Recognition?

    By stacking layers of convolution and nonlinearity, convolutional networks (ConvNets) effectively learn from low-level to high-level features and discriminative representations. Since the end goal of large-scale recognition is to delineate complex boundaries of thousands of classes, adequate exploration of feature distributions is important for realizing full potentials of ConvNets. However, state

  • 1