otori334のブックマーク - はてなブックマーク

seq2seq で長い文の学習をうまくやるための Attention Mechanism について - Qiita
概要シーケンス（例えば文章）のペアを関連付けて学習させる DeepLearning の手法 sequence-to-sequence learning において、長いシーケンスでの学習の精度を上げると言われている Attention Mechanism の論文を読んだので備忘録を兼ねて概要を書いておきます。元論文: Neural Machine Translation By Jointly Learning To Align And Translate そもそも seq2seq とはシーケンスのペアを大量に学習させることで、片方のシーケンスからもう一方を生成するモデルです。元論文： Sequence to Sequence Learning with Neural Networks tensorflow 上にも実装があります。実用例としては以下のようなものがあります。翻訳: 英
otori334 2022/03/21
機械学習

言葉

あとで読む
リンク
作って理解する Transformer / Attention - Qiita
こんにちは。ミクシィ AI ロボット事業部でしゃべるロボットを作っているインコです。この記事はミクシィグループ Advent Calendar 2018 の5日目の記事です。この記事の目的この記事では2018年現在 DeepLearning における自然言語処理のデファクトスタンダードとなりつつある Transf ormer を作ることで、 Attention ベースのネットワークを理解することを目的とします。機械翻訳などの Transf ormer, 自然言語理解の BERT やその他多くの現在 SoTA となっている自然言語処理のモデルは Attention ベースのモデルです。 Attention を理解することが今後の自然言語処理 x Deep Learning の必須になってくるのではないでしょうか。この記事にかかれているコード (Github) 歴史 - RNN から
otori334 2022/03/20
機械学習

言葉

Python

あとで読む
リンク
1

はてなブックマーク

タグ

ブックマーク / qiita.com/halhorn (2)

お知らせ

月間はてなブックマーク数ランキング（2024年8月）

今週のはてなブックマーク数ランキング（2024年9月第1週）

今週のはてなブックマーク数ランキング（2024年8月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

ブックマーク / qiita.com/halhorn (2)

seq2seq で長い文の学習をうまくやるための Attention Mechanism について - Qiita

作って理解する Transformer / Attention - Qiita

お知らせ

月間はてなブックマーク数ランキング（2024年8月）

今週のはてなブックマーク数ランキング（2024年9月第1週）

今週のはてなブックマーク数ランキング（2024年8月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス