学習率のWarmupで大きいバッチサイズでもいい感じに訓練する - Qiita

テクノロジーカテゴリーの変更を依頼記事元:

qiita.com/koshian2

4 usersがブックマークコメント

コメント

1

記事へのコメント1件

注目コメント
新着コメント

mayo_yamasaki [Machine Learning]

Warmup

2020/04/07 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

学習率のWarmupで大きいバッチサイズでもいい感じに訓練する - Qiita

最近になって論文でたびたび目にする学習率のWarmupについて、CIFAR-10で実験してみました。その結果、W... 最近になって論文でたびたび目にする学習率のWarmupについて、CIFAR-10で実験してみました。その結果、Warmupを使うとバッチサイズの増加にともなう精度の急落を、ある程度緩和できることがわかりました。大きいバッチサイズで訓練したり、訓練を高速化したい場合は、このWarmupが非常に有効となるでしょう。きっかけ Google I/O'19の講演を聞いていたら、学習率のウォームアップについて話していました。RetinaNetをTPUで訓練する話です。曰く、「このケースではResNet50の訓練済みモデルを初期値として使い、レイヤーを固定せず、全てのレイヤーを訓練させる。大きいバッチサイズを使っているので、訓練済み係数が壊れてしまう可能性がある。学習の最初は低い学習率を使い、徐々にあげていくという学習率のコントロールを行う」（ビデオ39分付近）とのことです。このアイディアはこの講

ブックマークしたユーザー

minus9d2021/03/09
shikimihuawei2020/06/03
mayo_yamasaki2020/04/07

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx