モデルパラメータの算術 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

テクノロジーカテゴリーの変更を依頼記事元:

joisino.hatenablog.com

45 usersがブックマークコメント

コメント

2

記事へのコメント2件

注目コメント
新着コメント

misshiki “深層モデルのパラメータは意味のない数値の羅列のように考えがちですが、よく分析すると理論的にも実験的にも深い意味があるというのはとても面白い”

2024/01/12 リンク

stealthinu すごく面白い。ファインチューニングモデルは重みの足し算して平均するとアンサンブルしたのと同じ効果があるとか、タスクベクトルの足し算引き算できるとか、いやー、これは面白いね。

deeplearning

2024/01/09 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

モデルパラメータの算術 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ

深層モデルのパラメータを一列に並べてベクトルにします。このベクトルは大規模なモデルであれば何十億... 深層モデルのパラメータを一列に並べてベクトルにします。このベクトルは大規模なモデルであれば何十億次元にもなります。一見、意味のない数値の羅列のようですが、このベクトルはベクトルとして深い意味があることが分かってきています。例えば、とを異なるパラメータベクトルとすると、やをパラメータとして持つモデルはちゃんと機能します。本稿では、このようなモデルパラメータの算術を用いた手法とその背後にある理論について解説します。モデルスープタスクベクトルモデルパラメータとニューラルタンジェントカーネルおわりにモデルスープモデルスープ [Wortsman+ ICML 2022] は複数のモデルパラメータを平均することで性能を上げる手法です。事前学習モデルからはじめて、様々なハイパーパラメータで訓練した結果のパラメータをとします。これらを平均したベクトルは個々のモデルよりも性能が高く、

ブックマークしたユーザー

kenta19842024/04/25
kenmatsu42024/04/18
hach8i2024/04/17
yuiseki2024/03/25
kybernetes2024/03/25
ZAORIKU2024/03/22
imyutaro2024/03/22
taka8hiroshi2024/02/13
knok2024/01/15
misshiki2024/01/12
xiangze2024/01/11
questbeat2024/01/10
abrahamcow2024/01/10
todesking2024/01/10
satojkovic2024/01/10
ducky199992024/01/10
takmin2024/01/10
dhesusan46492024/01/10

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx