NeuralTalk2とは? Deep Learningを応用した画像認識や画像処理については、今や割と身近なものになってきている。ちょっとした処理であれば、ありもののサービスやライブラリを使って出来てしまうので、あとはアイデア次第で、いろいろなものに使えると思う。最近では、GoogleのCloud Vision APIが公開されたことなんかも話題になっている。 ということで、今回取り上げるNeuralTalk2も、そんなDeepを使った画像認識から、写っているものについてのキャプションをつけることができる実装の一つだ。作者はGoogleなどでもインターンとして働いたこともある、スタンフォード大学の博士過程学生のAndrej Karpathyという人だ。この人の名前で検索すると、Deepを使った画像認識系の論文もいくつか出てくる。というのと、ブログが参考になるので、この手の技術を追っかけて