エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント1件
- 注目コメント
- 新着コメント
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
PyTorchのAMPはbf16を使え.多分nanが出なくなる. - Qiita
最初からクライマックス 公式に書かれている利用方法は下.でもモデルが数値的に不安定な計算(Softmax,... 最初からクライマックス 公式に書かれている利用方法は下.でもモデルが数値的に不安定な計算(Softmax, division by epsilon...)を含んでるといつかnanが出る.ちなみにTransformer, AttentionはSoftmaxを含んでいるので不安定. # 公式の例.ダメではないがnanが出て死ぬことがある. with torch.autocast(): # モデル計算とか誤差逆伝搬とか ...
2023/10/12 リンク