“大規模言語モデル RWKV-worldで学習で巨大なデータ(学会の予稿集のpdf)をファインチューニング(LoRA)する”

gengohousegengohouse のブックマーク 2023/07/18 17:07

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

大規模言語モデル RWKV-worldで学習で巨大なデータ(学会の予稿集のpdf)をファインチューニング(LoRA)する|Kan Hatakeyama

    概要学会の予稿集のような、大規模な文章(pdf)データを大規模言語モデルに学習させてみます 1.5 M tokenほどあります モデルは、学習と出力が高速なRWKVにしました 他のタスクでGPUリソースを使っているので、0.1B/ ...

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう