tnalのブックマーク / 2020年3月13日 - はてなブックマーク

NICT BERT 日本語 Pre-trained モデル

25 users
alaginrc.nict.go.jp
テクノロジー

概要このページでは、日本語Wikipediaを対象に情報通信研究機構データ駆動知能システム研究センターで事前学習を行ったBERTモデルをクリエイティブ・コモンズ表示 4.0 国際ライセンス (CC BY 4.0)のもとで公開しています。 BERTモデル [1] の学習では、バッチサイズやステップ数を増やすことで性能が向上することが報告されています [2]。そこで本ページのモデルでは、[2] のRoBERTa-500Kと同等の計算量となるよう、ステップ数を [1] と同様に100万に保ちつつ、バッチサイズを [1] の16倍の4,096にして学習を行いました。作成したBERTモデルの評価として、NICTで作成した (fine-tuning用) 学習データと評価データ (これらのデータは大規模Web情報分析システムWISDOM X、対災害SNS情報分析システムDISAANA、災害状況要

はてなブックマーク

タグ

2020年3月13日のブックマーク (1件)

NICT BERT 日本語 Pre-trained モデル

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第3週）

今週のはてなブックマーク数ランキング（2024年8月第2週）

今週のはてなブックマーク数ランキング（2024年8月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス