Webサイト閉鎖のお知らせ[B!]新着記事・評価 - はてなブックマーク

『Webサイト閉鎖のお知らせ』

8. 大規模教師なし言語モデルの脅威
5 users
www.bcm.co.jp

今回は、OpenAIの大規模教師なし言語モデルGPT-2の実験成果について紹介する[1-3]。この言語モデルでは、タスクに特化した学習の必要がなく、首尾一貫した複数の段落からなる一連の文章を生成でき、初歩的な文章理解、機械翻訳、質問応答、要約ができる。 GPT-2 GPT-2は、800万Webページのインターネット文章（40GB）から次の文章を予測するように訓練されるだけである。GPT-2には、15億個のパラメータがあるという。4Bが1語だとすると、40GBは100憶語になるから、15語で１文が構成されると仮定すると、約6億7千万文の訓練データがあるともいえる。 GPT-2のモデルは、与えられた文章に含まれる単語から次の単語を予測するという単純なものである。GPT-2では、先代のGPTからパラメータと訓練データセットをそれぞれ10倍以上にしている。 GPT-2は、ドメイン固有の訓練データセ
- テクノロジー
- 2019/08/21 22:02
- 機械学習

次のページ

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx