大規模なニューラルネットワークは、計算コストが高く、推論が遅いため、モバイルデバイスに展開するのは実用的ではありません。知識蒸留(KD)は、大きな「教師」モデルから小さな「学生」モデルに知識を転送する

arxiv_readerarxiv_reader のブックマーク 2021/01/07 12:23

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

MSD:マルチモーダル理解のための顕著性を意識した知識の抽出

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう