知識の蒸留では、タスクと蒸留の損失を介して、大規模なモデルから小規模なモデルに知識が転送されます。この論文では、タスク損失と蒸留損失の間のトレードオフを観察します。つまり、蒸留損失の導入によりタスク

arxiv_readerarxiv_reader のブックマーク 2023/07/18 12:20

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

DOT: 蒸留指向のトレーナー

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう