BERT2BERTによるニュース記事のタイトル生成 - Qiita

テクノロジーカテゴリーの変更を依頼記事元:

qiita.com/m__k

17users がブックマークコメント

記事へのコメント3件

注目コメント
新着コメント

misshiki チュートリアル。日本語使用。

BERT

2022/04/27 リンク

UDONCHAN 面白い

2022/04/25 リンク

sh19910711 "BERT2BERT: Encoder層もDecoder層もBERTのアーキテクチャーを採用したモデル / 正直生成文章はとてもイマイチな結果 > データ量が少ない + 学習の仕方ももう少し工夫が必要なのかも / GPT-2のほうが日本語が流暢だった"

2022/04/25 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

BERT2BERTによるニュース記事のタイトル生成 - Qiita

はじめに huggingfaceを使ったEncoder-Decoderモデルの練習の一貫として、BERT2BERTによる文章生成をや... はじめに huggingfaceを使ったEncoder-Decoderモデルの練習の一貫として、BERT2BERTによる文章生成をやってみました。 BERT2BERTはEncoder-Decoderモデルの一種で、Encoder層もDecoder層もBERTのアーキテクチャーを採用したモデルのことを言います。ただし、Decoder層のBERTは通常のBERTと以下の2点で異なります。最初のMutil Head AttentionがMusked Multi Head Attenion(単方向)になってる MMHAとFFNの間にCross Attention層があり、Encoderの特徴量を受け取れるようになってるアーキテクチャーはほぼほぼTransf ormerと同様の認識ですかね。この辺の構造も含めて、Encoder-DecoderモデルやBERT2BERTの理論的なお話やhuggin