3つの要点 ✔️ 新しいadaptive gradient clipping法を用いたバッチ正規化の代替 ✔️ 正規化なしアーキテクチャNFNetsがSOTAを達成 ✔️ バッチ正規化を用いたモデルよりも、優れた学習速度と伝達学習能力を持つ High-Performance Large-Scale Image Recognition Without Normalization written by Andrew Brock, Soham De, Samuel L. Smith, Karen Simonyan (Submitted on 11 Feb 2021) Comments: Accepted to arXiv. Subjects: Computer Vision and Pattern Recognition (cs.CV); Machine Learning (cs.LG); Ma