鈴木大慈 / Taiji Suzuki (東京大学) [Webサイト] 東京大学大学院情報理工学系研究科数理情報学専攻教授および理化学研究所・革新知能統合研究センター・深層学習理論チーム・チームリーダー.深層学習を含む様々な学習機構について理論的側面から研究を進めている.より少ないデータでより精度良く学習するにはどうすればよいか.学習理論を通じて各種学習手法の性能を解明し複雑な学習過程の本質への理解を深め,さらに理論をもとに新しい機械学習手法の構築や応用への還元を行っている.また,確率的最適化などの方法論により大規模かつ複雑な機械学習問題を効率的に解く手法の開発も行っている. 概要 In-context leaningを主たる題材として,Transformerの学習能力を理論的に明らかにする最近の理論研究を紹介する.まず表現力の理論として,Transformerは非等方的滑らかさを持つ関数