Swin Transformerを超える最先端画像認識モデルDeformable Attention Transformerを詳細解説! 2022.01.13 AI論文 画像処理 はじめに 中国の清華大学を中心とした研究チームが、現在多くの画像認識タスクでSOATモデルとされる SwinTransformer を超える Deformable Attention Transformer(DAT)を発表しました。Attention 範囲をより妥当な範囲に絞り込む Deformable Attention を利用することで、性能改善を果たしています。 概要 近年 Attention 機構を利用した Transformer は自然言語処理の分野で目覚ましい性能をみせ、自然言語分野ではデファクトスタンダードとなりました。画像処理分野ではConvolution 機構を利用している CNN がデファクト
![Swin Transformerを超える最先端画像認識モデルDeformable Attention Transformerを詳細解説!](https://cdn-ak-scissors.b.st-hatena.com/image/square/d3b93fe140be4f55c54048d8d065b0cbfebb1591/height=288;version=1;width=512/https%3A%2F%2Fdeepsquare.jp%2Fwp-content%2Fuploads%2F2022%2F01%2FScreenshot-from-2022-01-12-15-09-38-1-591x410.jpg)