Transformer のモデル構造とその数理を完全に解説しました。このレベルの解説は他にないんじゃないかってくらい話しました。 結局行列と内積しか使ってないんですよ。すごくないですか? ※行列の転値は、「左上に小文字の t 」という文化で生きています。 ☆お知らせ☆ AIcia Solid Project 公式HPが出来ました!!! https://sites.google.com/view/aicia-official/top HPでは私たちや動画コンテンツの紹介、板書データの公開などをしています。是非ご活用ください!! ▼関連動画 忙しい人向けはこちら → https://www.youtube.com/watch?v=FFoLqib6u-0 Multi-Head Attention は 15:27 から! Deep Learning の世界 https://www.yout