Embarrassingly Simple Self-Distillation Improves Code Generation

テクノロジーカテゴリーの変更を依頼記事元:

arxiv.org

2users がブックマークコメント

コメント

1

記事へのコメント1件

注目コメント
新着コメント

misshiki 自己蒸留（SSD）でコード生成性能向上。モデル自身の出力で再学習し、Qwen3-30Bのpass@1が42.4→55.3%。検証器・RL不要。精度と探索のトレードオフ再調整が効果。

2026/04/07 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

Embarrassingly Simple Self-Distillation Improves Code Generation

Can a large language model (LLM) improve at code generation using only its own raw outputs, witho... Can a large language model (LLM) improve at code generation using only its own raw outputs, without a verifier, a teacher model, or reinforcement learning? We answer in the affirmative with simple self-distillation (SSD): sample solutions from the model with certain temperature and truncation configurations, then fine-tune on those samples with standard supervised fine-tuning. SSD improves Qwen3-3

ブックマークしたユーザー

misshiki2026/04/07
door-s-dev2026/04/06

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

いま人気の記事 - 企業メディア

企業メディアをもっと読む

設定を変更しましたx