0. 忙しい方へ SAMは損失が最小かつその周辺が平坦であるようなパラメータを目指すよ SAMは次の3ステップだよ パラメータ$\mathbf{w}$の周辺で最大の損失をとる$\mathbf{w+\hat{\epsilon}(w)}$を求めるよ $\mathbf{w+\hat{\epsilon}(w)}$における損失を求めるよ 2.の損失に対する勾配でパラメータ$\mathbf{w}$を更新するよ SAMは一言で言ってしまえば、「パラメータ周辺での最大の損失を求めて、それが下がる方向でパラメータを更新する」ものだよ ImageNetやCIFARを含む9つの画像分類データセットでSoTAを更新したよ ラベルへのロバスト性も高いよ 1. SAMの説明 SAMは至ってシンプルです。というのも、今までは損失が最小になるパラメータを学習させていました。ただ、SAMは損失が最小かつその周りも平坦となっ
![SoTAを総なめ!衝撃のオプティマイザー「SAM」爆誕&解説! - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/d9634221c04cb7be4c794e2022729a0c978cbcf9/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Fadvent-calendar-ogp-background-7940cd1c8db80a7ec40711d90f43539e.jpg%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTk3MiZoPTM3OCZ0eHQ9U29UQSVFMyU4MiU5MiVFNyVCNyU4RiVFMyU4MSVBQSVFMyU4MiU4MSVFRiVCQyU4MSVFOCVBMSU5RCVFNiU5MiU4MyVFMyU4MSVBRSVFMyU4MiVBQSVFMyU4MyU5NyVFMyU4MyU4NiVFMyU4MiVBMyVFMyU4MyU5RSVFMyU4MiVBNCVFMyU4MiVCNiVFMyU4MyVCQyVFMyU4MCU4Q1NBTSVFMyU4MCU4RCVFNyU4OCU4NiVFOCVBQSU5NSUyNiVFOCVBNyVBMyVFOCVBQSVBQyVFRiVCQyU4MSZ0eHQtY29sb3I9JTIzM0EzQzNDJnR4dC1mb250PUhpcmFnaW5vJTIwU2FucyUyMFc2JnR4dC1zaXplPTU2JnR4dC1hbGlnbj1sZWZ0JTJDdG9wJnM9OTU4ZWUxYjY4NjU5OTU1ZGRmZGE5YWM0NDg0NDkxMDc%26mark-x%3D142%26mark-y%3D100%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZoPTc2Jnc9OTcyJnR4dD0lNDBvbWlpdGEmdHh0LWNvbG9yPSUyMzNBM0MzQyZ0eHQtZm9udD1IaXJhZ2lubyUyMFNhbnMlMjBXNiZ0eHQtc2l6ZT0zNiZ0eHQtYWxpZ249bGVmdCUyQ3RvcCZzPTJlY2M1Mjk3MDE4NDIzNzNlZjI0Mzc0YzI1YmIyNGQ0%26blend-x%3D142%26blend-y%3D504%26blend-mode%3Dnormal%26s%3D1abf2d21ac0dfc14fcee0c29b7f6010c)