猫の顔のランドマーク検出をやってみました。ただのランドマーク検出のつもりでしたが、MSEと同一の最適解で別の側面からの魔改造した損失関数を投入すると学習を明らかにブーストできる(損失がMSEベースで1/5になる)ことに気づいたので、それがメインになっています。 今回はこれに加えて、ResNet-50から転移学習させ、Google ColabのTPUで訓練させました。 リポジトリ:https://github.com/koshian2/cats-face-landmarks 学習済み係数は一番最後のケース7の損失関数を使って訓練させたものです。 ランドマーク検出とは 画像から要所要所となる点(ランドマーク)を検出するアルゴリズム。顔なら、目、鼻、口、眉毛、輪郭といったポイントを検出します。例としてはOpenCVによる実装があります。 (https://docs.opencv.org/3.4/