Google DeepMind DiffusionGemma: parallele Textgenerierung auf lokalen GPUs10. June 202610. June 2026AI Models, GoogleDiffusionGemma denoisiiert bis zu 256 Token parallel pro Schritt statt einzeln und erreicht auf NVIDIA H100 1.000 Token/Sekunde bei Batch-Size 1 — ohne Cloud-Abhängigkeit. Share on: