Google DeepMind DiffusionGemma: parallele Textgenerierung auf lokalen GPUs

10. June 202610. June 2026
AI Models, Google

DiffusionGemma denoisiiert bis zu 256 Token parallel pro Schritt statt einzeln und erreicht auf NVIDIA H100 1.000 Token/Sekunde bei Batch-Size 1 — ohne Cloud-Abhängigkeit.

Share on:

Google DeepMind DiffusionGemma: parallele Textgenerierung auf lokalen GPUs

Lumi AI News

Rechtliches

Themenbereiche