Sprachkompression in LLMs: Output-Optimierung spart Kosten, Input-Reduktion erhöht sie25. June 202626. June 2026AI Models, Claude CodeOutput-Kompression reduziert Inferenzkosten effektiv, während Input-Kompression die Gesamtkosten erhöht und die Antwortqualität verschlechtert. Share on: