開発者サイトでは、AMD のアダプティブ コンピューティング プラットフォームを使用する開発に役立つ、最新かつ包括的な Vitis™ AI 開発ガイダンス、チュートリアル、リファレンス デザイン、トレーニング コースなど、数多くの技術リソースを提供しています。 Vitis AI プラットフォームを使用する開発の詳細 >
2017年12月に開催されたパターン認識・メディア理解研究会(PRMU)にて発表した畳み込みニューラルネットワークのサーベイ 「2012年の画像認識コンペティションILSVRCにおけるAlexNetの登場以降,画像認識においては畳み込みニューラルネットワーク (CNN) を用いることがデファクトスタンダードとなった.ILSVRCでは毎年のように新たなCNNのモデルが提案され,一貫して認識精度の向上に寄与してきた.CNNは画像分類だけではなく,セグメンテーションや物体検出など様々なタスクを解くためのベースネットワークとしても広く利用されてきている. 本稿では,AlexNet以降の代表的なCNNの変遷を振り返るとともに,近年提案されている様々なCNNの改良手法についてサーベイを行い,それらを幾つかのアプローチに分類し,解説する.更に,代表的なモデルについて複数のデータセットを用いて学習および網
2. 人物行動認識 1 入力:動画 → 出力:行動ラベルという課題 *K. Soomo+, “UCF101: A Dataset of 101 Human Actions Classes From Videos in The Wild”, CRCV-TR-12-01, 2012. * 3. 代表的な大規模行動認識データセット | Trimmed 2 切り出し済み or 開始終了ラベル込み動画 HMDB-51: 7000動画 (Movie, YouTube),51クラス UCF-101: 13000動画 (YouTube),101クラス ActivityNet: 28000動画 (YouTube),200クラス Kinetics: 30万動画 (YouTube),400クラス 大規模化がどんどん進んでいる 4. 代表的な大規模行動認識データセット | Untrimmed 3
By stacking layers of convolution and nonlinearity, convolutional networks (ConvNets) effectively learn from low-level to high-level features and discriminative representations. Since the end goal of large-scale recognition is to delineate complex boundaries of thousands of classes, adequate exploration of feature distributions is important for realizing full potentials of ConvNets. However, state
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く