画像認識におけるトップカンファレンス「CVPR 2019」で、AIでの自動動画要約の常識を根本的に覆す論文が発表された。最先端の動画要約手法が、ランダムで作成された動画要約と同等レベルでの要約しか作成できていないことを示したものだ。 本稿では、7月13日に開催された「CCSE 2019」でのサイバーエージェントAI Labの大谷まゆ氏による講演「ディープラーニング時代の性能評価」の講演内容、および同氏のCVPR 2019に採択された論文「Rethinking The Evaluation of Video Summaries」の内容をまとめた。 合わせて、動画要約技術で用いられてきた手法の簡単な説明と、「ランダム抽出での要約結果がAIと同等の結果を示した」とはどういうことか、解説する。 近年の動画要約手法とそのデータセットそもそも動画要約とは、もとの映像のなかで根幹をなす内容を捉えつつ、映
![「AIによる動画要約研究」に激震。今までの自動動画要約技術はランダム抽出と大差なかった? | Ledge.ai](https://cdn-ak-scissors.b.st-hatena.com/image/square/268e8fb95d9bdad69e02d1d350886fe77d59a5ca/height=288;version=1;width=512/https%3A%2F%2Fs3-ap-northeast-1.amazonaws.com%2Fledge-ai-assets%2Fmedia%2Fwp-content%2Fuploads%2F2019%2F10%2F18154707%2Fai_sum_eyecatch.jpg)