Skip to content
Google Gemini

Blitzschnelle KI-Modelle direkt auf Geräten mit LiteRT-LM

Googles LiteRT-LM ermöglicht blitzschnelle KI-Inferenz direkt auf Geräten. Mit Gemma 4 erreicht das System 52-76 Tokens pro Sekunde je nach Plattform und Hardware, nutzt fortgeschrittene Quantisierung und Multi-Token Prediction für maximale Performance.

Share on: