
エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
Transformer(ViT)系より良いConvだけのネットワーク出たよ(画像認識向け) - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
Transformer(ViT)系より良いConvだけのネットワーク出たよ(画像認識向け) - Qiita
追記2: EfficientNetV2も仲間に入るってTwitterで言うてるんで、さらに追記。 追記: ViTの中の人から... 追記2: EfficientNetV2も仲間に入るってTwitterで言うてるんで、さらに追記。 追記: ViTの中の人から物言いが入ってるんで、追記しました。 ViTが出てから、画像認識向けでもTransformer系が一気に流行り、Swine Transformerで、ピラミッド構造ありTransformer系がSOTAという流れになってたけれど、比較対象のCNNが古いResNetってどうよ? もう2020年代に入って随分経つんだし、ちゃんと新しい手法入れたConvと比べようよ。ってことで、FAIRからConvNeXtってのが出ました。 A ConvNet for the 2020s 同規模間の画像認識でSOTAだそうです。 Object detectionでもinstance segmentationでもsemantic segmentationでも、今までのと同じくらいか、更に良い