この記事は、TensorFlow Advent Calendar 2016の18日目の記事です。 もともとはPredNetを実装しようと思ってConvLSTMを実装していたのですが、これ単体でも動画のフレーム予測ができるのでせっかくなので試してみようと思ってこの記事を書きました。 この前のTensorFlow UserGroupのイベント「NN論文を肴に飲む会」でも発表させていただきましたので、元となる論文の概要などが気になる方はこちらのスライドをご覧ください。 Convolutional LSTM(畳み込みLSTM) 名前からしてどんなものなのかという想像は簡単につくと思います。従来のLSTMでは時間遷移する状態は(バッチサイズ, 中間層のユニット数)の2階テンソルでしたが、それが(バッチサイズ,縦,横,チャンネル数)の4階テンソルになったものです。その際、扱う状態が画像情報なので、従来
![TensorFlowで畳み込みLSTMを用いた動画のフレーム予測 - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/ff8f205a29aac2cdb45f5ddb055a110199d634cd/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Fadvent-calendar-ogp-background-7940cd1c8db80a7ec40711d90f43539e.jpg%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTk3MiZoPTM3OCZ0eHQ9VGVuc29yRmxvdyVFMyU4MSVBNyVFNyU5NSVCMyVFMyU4MSVCRiVFOCVCRSVCQyVFMyU4MSVCRkxTVE0lRTMlODIlOTIlRTclOTQlQTglRTMlODElODQlRTMlODElOUYlRTUlOEIlOTUlRTclOTQlQkIlRTMlODElQUUlRTMlODMlOTUlRTMlODMlQUMlRTMlODMlQkMlRTMlODMlQTAlRTQlQkElODglRTYlQjglQUMmdHh0LWFsaWduPWxlZnQlMkN0b3AmdHh0LWNvbG9yPSUyMzNBM0MzQyZ0eHQtZm9udD1IaXJhZ2lubyUyMFNhbnMlMjBXNiZ0eHQtc2l6ZT01NiZzPWE2NzE3NzVmYjc4NTI3M2ViY2ZmMzc4YWVhNjU1ZDYy%26mark-x%3D120%26mark-y%3D96%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZoPTc2Jnc9OTcyJnR4dD0lNDB0X3NoaW1tdXJhJnR4dC1jb2xvcj0lMjMzQTNDM0MmdHh0LWZvbnQ9SGlyYWdpbm8lMjBTYW5zJTIwVzYmdHh0LXNpemU9MzYmdHh0LWFsaWduPWxlZnQlMkN0b3Amcz0yNGMwZTBiMDg0N2FiOTMzNTA0ZTQzOTBjN2FjOGU3OQ%26blend-x%3D120%26blend-y%3D500%26blend-mode%3Dnormal%26s%3Daf5b2f3783f387cc141b2907470885eb)