Sprachkompression bei LLMs: Output senkt Kosten, Input erhöht sie25. June 202626. June 2026AI ModelsOutput-Kompression reduziert Inferenzkosten um 1,4–3x, Input-Kompression erhöht sie um durchschnittlich 1,15x, weil Modelle mit längeren Antworten auf ungenaue Prompts reagieren. Share on: