エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
Gemma 4 MTP を DGX Spark で動かして日本語生成の高速化を実測してみた | DevelopersIO
はじめに こんにちは、クラスメソッド製造ビジネステクノロジー部の森茂です。 先日の Gemma 4 ベンチマ... はじめに こんにちは、クラスメソッド製造ビジネステクノロジー部の森茂です。 先日の Gemma 4 ベンチマーク記事 の続編です。Google が 2026-05-05 に発表した Gemma 4 MTP(Multi-Token Prediction)を DGX Spark で動かしてみました。 ざっくり言うと MTP は、本体モデルとは別に「次のトークンを先回りして予測する軽量な下書き役」を用意して、本体モデルがまとめて検証することで生成を速くする仕組みです。この種の技術は speculative decoding(投機的デコーディング)と呼ばれていて、Gemma 4 では本体(target)と下書き役(drafter)のペアモデルが Google から公式に配布されているのがポイントです。 Google の公式ブログでは「最大 3 倍の高速化」と謳っていますが、個人的に気になったのは「






2026/05/10 リンク