言語メディア研究室[B!]新着記事・評価 - はてなブックマーク

『言語メディア研究室 - LANGUAGE MEDIA PROCESSING LAB』

BART日本語Pretrainedモデル - LANGUAGE MEDIA PROCESSING LAB
8 users
nlp.ist.i.kyoto-u.ac.jp

BART日本語Pretrainedモデル † BARTは、encoder-decoder型のpretrainingモデルで、BARTの公式サイトでは英語pretrainedモデルと多言語pretrainedモデルが公開されています。今回、日本語テキストのみを使ってpretrainingしましたので公開します。 2023/05/09追記: Hugging Face hubでも公開しています (Base, Large)。 ↑ 詳細 † 入力テキスト: 日本語Wikipedia全て (約1800万文、半角を全角に正規化) Juman++ (v2.0.0-rc3) で形態素に分割し、さらにSentencePieceでsubwordに分割したもの Base: 6 encoder-decoder layers, 768 hidden, Large: 12 encoder-decoder layers
- テクノロジー
- 2021/02/27 09:50

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx