エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
時系列基盤モデルへ①:MOMENT【論文】
事前学習前に重みをランダムに初期化します. 全ての設定で T=512, N=64, P=8 とし, 30%のパッチをマスク... 事前学習前に重みをランダムに初期化します. 全ての設定で T=512, N=64, P=8 とし, 30%のパッチをマスクします. モデルはAdamで最適化します. ハイパーパラメータは \lambda=0.05, \beta_1=0.9, \beta_2=0.999 です. 勾配は5.0でclippingし, batch sizeは2048です. 学習率は 1e-4 から 1e-5 まで減少するcosine schedulerを使用します. また, gradient checkpointingとlayer normなどの不安定な演算ではfloat32を, 安定な演算ではbfloat16を用いる混合精度の学習を行います. 全てのモデルで2 Epoch学習します. 何も紹介しないと新規手法のように聞こえてしまいますが, Masked Time series Modeling自体も例えば以下の