MITとIBM、映像内で何が起きているのかにラベル付けされた3秒動画の大規模データセット100万点を発表。AIシステムが動的な行動を理解する 2017-12-07 CSAIL MITとIBM Researchの研究者たちは、AIシステムが動画を認識し理解するのに役立つ動画ベースの大規模なデータセット「Moments in Time Dataset」を公開しました。 論文も発表しました。 Moments in Time Dataset: one million videos for event understanding(PDF) 本稿では、映像内のアクションやイベントにラベル付けされた3秒以内の動画が100万点あるデータセットを紹介します。例えば、以下の図を確認します。左に動画内の出来事が書かれたテキストが表示され、横一列にその出来事の3秒動画シーンが羅列します。 「Flying」であれば
![MITとIBM、映像内で何が起きているのかにラベル付けされた3秒動画の大規模データセット100万点を発表。AIシステムが動的な行動を理解する](https://cdn-ak-scissors.b.st-hatena.com/image/square/a89dfdb5711ef373b21397234e5e8eff91d40031/height=288;version=1;width=512/https%3A%2F%2Fshiropen.com%2Fwp-content%2Fuploads%2F2017%2F12%2Fvideosteachingmachines-357x186.png)