[B! あとで読む][gpt] zex5yoのブックマーク

zex5yo id:zex5yo

あとで読むとgptに関するzex5yoのブックマーク (3)

GPT-3
Language Models are Few-Shot Learners https://arxiv.org/abs/2005.14165
zex5yo 2021/01/18
gpt

あとで読む

機械学習

GPT-3
リンク
OpenAIが発見したScaling Lawの秘密 - ディープラーニングブログ
OpenAIはGPT-3の次の研究を始めています．世間がGPT-3のデモに湧き上がる中，OpenAIはScaling Lawに関する2本の論文をひっそりと公開しました． Scaling Lawを一言で説明するなら「Transf ormerの性能はたった3つの変数のべき乗則に支配されている」というものです． Scaling Lawはそれ単体だけなら興味深い話で終わるかもしれません．実際に英語圏でもあまり話題にあがっていません．しかし，この法則の本当の凄さに気づいている研究者もいて，なぜ話題にならないのか困惑しています． I am curious why people are not talking more about the OpenAI scaling law papers. For me, they seem very significant. What I heard so far:
zex5yo 2021/01/18
transformer

機械学習

あとで読む

gpt
リンク
RNNからTransformerまでの歴史を辿る～DNNを使ったNLPを浅く広く勉強～ - arutema47's blog
Amazon Prime 一ヶ月無料 Seq2seqからBERTまでのNLPモデルの歴史をざっとまとめる。 DNNは知ってるけどTransf ormerってなんだかわからない、って人におすすめです。 Abst. 画像認識にもTransf ormerが使われることが多く、DeepRLやGPT-3といったNLPモデルも身近になってきています。"Attention is 何?"と言えなくなってきたので勉強しました。 Feedforward NetworksからSeq2Seq, Attention機構からTransf ormer登場、そしてBERT GPTといった最新モデルまでの流れを広く浅く記述する予定。またKaggle NLPコンペの上位解法から利用例を探る。 Tl;DR Transf ormerはSelf-Attentionという機構でデータ内の時系列的特徴を抽出でき、従来のRNNを始めとするNN
zex5yo 2021/01/08
NLP

transformer

attention

BERT

gpt

あとで読む
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx