scalingintelligence.stanford.edu[B!]新着記事・評価 - はてなブックマーク

『scalingintelligence.stanford.edu』

Tokasaurus: An LLM Inference Engine for High-Throughput Workloads
5 users
scalingintelligence.stanford.edu

Tokasaurus: An LLM Inference Engine for High-Throughput Workloads Jordan Juravsky Stanford Ayush Chakravarthy Stanford Ryan Ehrlich Stanford Sabri Eyuboglu Stanford Bradley Brown Stanford Joseph Shetaye Stanford Christopher Ré Stanford Azalia Mirhoseini Stanford TL;DR We’re releasing Tokasaurus, a new LLM inference engine optimized for throughput-intensive workloads. With small models, Tokasaurus
- テクノロジー
- 2025/06/06 10:05

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx