LoopCoder-v2 mit zwei Schleifen verbessert Code-Reasoning-Benchmarks erheblich (SWE-bench Verified: 43,0 → 64,4 Punkte), während drei oder mehr Schleifen durch wachsende Positionsfehler kontraproduktiv sind.
Die neue API ermöglicht es, Safeguards granular an jedem Punkt in Multi-Turn-Agent-Schleifen anzuwenden und basierend auf numerischen Scores eigene Schwellwerte sowie Aktionen (Block, Bypass, Retry) zu definieren.
AWS hat mit P-EAGLE eine parallelisierte Variante von Speculative Decoding entwickelt, die Draft-Tokens in einem Forward-Pass statt sequenziell erzeugt und damit Inferenzdurchsatz auf SageMaker AI um bis zu 1,69x erhöht.
Post-Training migriert von monolithischen RL-Pipelines zu dezentralisierten Spezialistensystemen, die durch On-Policy-Distillation zu einer Generalistenschüler verschmolzen werden – ein Skalierungsmuster, das Konflikte zwischen Fähigkeitsbereichen auflöst.
KI entfaltet ihr Potenzial in der Produktentwicklung erst, wenn sie strukturiert auf Produktdaten über den gesamten Lebenszyklus hinweg zugreift – nicht als isoliertes Tool, sondern als integrierter Bestandteil einer durchgehenden Lifecycle-Plattform.
Tangram statisch vorhersagbare Speicherbudgets pro Attention-Head, um Fragmentierung und Latenzverschleppung zu eliminieren, die dynamische KV-Cache-Kompression verursacht.
Dedizierte Explorations-Modelle (4B–30B Parameter) können Code-Suche in Repositories effizienter handhaben als allgemeine Solver-Modelle und reduzieren dabei Context-Pollution erheblich.
Eine Verkettung von drei Schwachstellen in LiteLLM ermöglicht die Übernahme des Proxy-Servers und damit den Zugriff auf alle verwalteten API-Schlüssel von über 100 KI-Modellanbietern.