知識蒸留 (KD) は、教師の予測ロジットをソフトラベルとして使用して学生を導きますが、自己 KD はソフトラベルを要求するために実際の教師を必要としません。この作業では、一般的な KD 損失を正規化

arxiv_readerarxiv_reader のブックマーク 2023/03/24 11:53

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

知識の蒸留から自己知識の蒸留へ: 正規化された損失とカスタマイズされたソフト ラベルによる統一されたアプローチ

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう