Take1のBERTの事前学習はTPUの方が随分低コストだけど、Take2のBERTのファインチューニングは、大きな差はないと言う感じかしら。逆転するタスクもあるだろうから、ちゃんと事前に費用計算しといたほうがいいという結論かな

theatricaltheatrical のブックマーク 2020/10/31 03:45

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

TPU VS GPU(日本語版)

    はじめに(この記事の英語版はTPU VS GPU(English Edition)にあります。) Machine Learning部門の江間見です。ストックマークでは、自然言語処理技術の研究開発を行っています。 昨今、大規模データでニューラルネ...

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう