Powered by DLHacks 見た目がなんとなく似ている物体の画像を持っていると、無性に位置の対応をとりたくなってきます。 今回は、Convolutional Neural Network (CNN) を使って画像間の位置の対応付けを行った論文を紹介します。 はじめに 下図のように、2枚の画像を入力して「意味的に」似ている部分(座標と座標の対応)を出力します。 位置の対応は、全 pixel に渡って求めるのではなく、確信度の高い点のみを出力します。 このスパースな位置の対応を Neural Best-Buddies (NBB) と呼びます。 下図では、5つの NBB を出力していることになります。 種類が違う物体であっても、それっぽい対応が取れていることが分かります。 (引用:https://github.com/kfiraberman/neural_best_buddies )