【論文読み】NVIDIA TiDAR: 拡散モデルと思考し、自己回帰で語る (arXiv:2511.08923) はじめに NVIDIAから2025年11月に発表された論文 TiDAR: Think in Diffusion, Talk in Autoregression (arXiv:2511.08923) が、ローカルLLM界隈で大きな話題になりそうです。 既存のLLMの課題である推論速度を、拡散モデルとのハイブリッド化で解決する手法について、技術的な仕組みとハードウェアへの影響をまとめました。 *Gemini Pro3 に論文見てもらって会話してまとめてました。間違いあったらごめんなさい。 背景:なぜ拡散モデルなのか? 現在の主流である自己回帰 (Auto Regressive: AR) モデルは、1トークンずつ順番に生成する仕組み上、メモリ帯域幅に律速(Memory Bound)さ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く