小さいモデルが絶対位置をより正確にエンコードする一方で、大きなモデルは絶対位置よりも「意味のある何か」に依存している可能性が高いことを示唆

isrc のブックマーク 2023/09/12 19:33

<blockquote class="hatena-bookmark-comment"><a class="comment-info" href="https://b.hatena.ne.jp/entry/4742096473005149871/comment/isrc" data-user-id="isrc" data-entry-url="https://b.hatena.ne.jp/entry/s/note.com/hamachi_jp/n/n54248ffce6d9" data-original-href="https://note.com/hamachi_jp/n/n54248ffce6d9" data-entry-favicon="https://cdn-ak2.favicon.st-hatena.com/64?url=https%3A%2F%2Fnote.com%2Fhamachi_jp%2Fn%2Fn54248ffce6d9" data-user-icon="/users/isrc/profile.png">【論文紹介】大規模言語モデルにおけるニューロンの挙動について｜はまち</a><ul class="comment-tag" style="list-style: none; margin: 0px;"><li style="float: left">[<a href="https://b.hatena.ne.jp/q/%E6%A9%9F%E6%A2%B0%E5%AD%A6%E7%BF%92">機械学習</a>]</li><li style="float: left">[<a href="https://b.hatena.ne.jp/q/%E8%84%B3">脳</a>]</li><li style="float: left">[<a href="https://b.hatena.ne.jp/q/%E8%A8%80%E8%AA%9E">言語</a>]</li></ul><br><p style="clear: left">小さいモデルが絶対位置をより正確にエンコードする一方で、大きなモデルは絶対位置よりも「意味のある何か」に依存している可能性が高いことを示唆</p><a class="datetime" href="https://b.hatena.ne.jp/isrc/20230912#bookmark-4742096473005149871"><span class="datetime-body">2023/09/12 19:33</span></a></blockquote><script src="https://b.st-hatena.com/js/comment-widget.js" charset="utf-8" async></script>

このブックマークにはスターがありません。
最初のスターをつけてみよう！