[B! attention] ni66lingのブックマーク

【深層学習】Transformer - Multi-Head Attentionを理解してやろうじゃないの【ディープラーニングの世界vol.28】#106 #VRアカデミア #DeepLearning

Transf ormer のモデル構造とその数理を完全に解説しました。このレベルの解説は他にないんじゃないかってくらい話しました。結局行列と内積しか使ってないんですよ。すごくないですか？ ※行列の転値は、「左上に小文字の t 」という文化で生きています。 ☆お知らせ☆ AIcia Solid Project 公式HPが出来ました！！！ https://sites.google.com/view/aicia-official/top HPでは私たちや動画コンテンツの紹介、板書データの公開などをしています。是非ご活用ください！！ ▼関連動画忙しい人向けはこちら → https://www.youtube.com/watch?v=FFoLqib6u-0 Multi-Head Attention は 15:27 から！ Deep Learning の世界 https://www.yout

ni66ling 2021/08/07

リンク

【深層学習】Attention - 全領域に応用され最高精度を叩き出す注意機構の仕組み【ディープラーニングの世界 vol. 24】#095 #VRアカデミア #DeepLearning

▼テーマ Transf ormer や BERT で爆発的な利用を獲得した Attention の祖となるネットワーク RNNsearch について解説します。 Attention は自然言語で GPT-3 の化け物的な精度を出したのみならず、画像や生成モデルなど、超広い領域に応用されています。今の Deep Learning を語る上では外せない要素！　要チェック！ ▼関連プレイリスト Deep Learning の世界 https://www.youtube.com/playlist?list=PLhDAH9aTfnxKXf__soUoAEOrbLAOnVHCP 自然言語処理シリーズ https://www.youtube.com/playlist?list=PLhDAH9aTfnxL4XdCRjUCC0_flR00A6tJR ▼目次 (後で追加します。暫くお待ちください)

ni66ling 2021/08/07

リンク

自然言語処理の巨獣「Transformer」のSelf-Attention Layer紹介

全てのTransf ormer記事はTransf ormerから始まる「Transf ormer」概要2017年中旬、Googleが発表した論文「Attention is all you need」で提出されたモデル「Transf ormer」は、深層学習の自然言語処理(NLP)分野でいまはデファクトスタンダードとして使われています。Transf ormerは要するに、過去の自然言語処理(NLP)で多く使われる再帰型ニューラルネットワーク(RNN)や畳み込みニューラルネットワーク(CNN)を「Self-Attention Layer」に入れ替えたモデルです。それ以降、大抵の自然言語処理(NLP)分野で発表された研究や論文は、Transf ormerで再構築して発表されています。期待を裏切らなく、再構築されたモデルの結果は、以前の結果を上回っています。 Transf ormerは2017年に公開され、今

ni66ling 2020/11/17

リンク

BERTのAttentionは何を見ているのか？

3つの要点 ✔️BERTのAttention機構の分析手法の提案 ✔️Attentin機構は全体的には区切り文字や[CLS]、[SEP]を見ている ✔️特定のAttention機構では「動詞とその目的語」、「名詞と修飾語」、「前置詞とその目的語」などの簡単な文法関係から、照応関係などの複雑な文法関係も獲得している前書き現在の自然言語処理ではTransf ormer以降、Attention機構を用いたモデルが流行となっています。その中でも最近はBERTなどの巨大な事前学習済みのモデルが大きな成功を収めています。それらモデルが何を学習しているのかを分析する取り組みは行われてきましたが、モデルの出力自体や隠れ層でのベクトル表現に焦点を当てた分析手法が中心でした。この論文では、Attention機構が何を見ているのかに焦点を当てたモデルの分析手法が提案されており、BERTのAttention

ni66ling 2020/09/25

リンク

PyTorchで日本語BERTによる文章分類＆Attentionの可視化を実装してみた - Qiita

目次本記事はPyTorchを使って自然言語処理 $\times$ DeepLearningをとりあえず実装してみたい、という方向けの入門講座になっております。以下の順番で読み進めていただくとPyTorchを使った自然言語処理の実装方法がなんとなくわかった気になれるかもしれません。 PyTorchを使ってLSTMで文章分類を実装してみた PyTorchを使ってLSTMで文章分類を実装してみた（バッチ化対応ver） PyTorchでSeq2Seqを実装してみた PyTorchでAttention Seq2Seqを実装してみた PyTorchのBidirectional LSTMのoutputの仕様を確認してみた PyTorchでSelf Attentionによる文章分類を実装してみた PyTorchで日本語BERTによる文章分類＆Attentionの可視化を実装してみた ←イマココはじめに