SEVRA: Selektive Verifikation für effizientere KI-Reasoning bei Inferenzzeit19. June 202619. June 2026AI ModelsSEVRA spart beim Inferenzen durch selektive Verifikation 26–91 Prozent Tokens ein, ohne die Genauigkeit zu beeinträchtigen, stellt aber längere initiale Lösungsversuche als teilweise kostengünstiger dar. Share on: