AWS dokumentiert fünf Resilienz-Muster für produktive LLM-Inferenz, die automatische Cross-Region-Verteilung, Failover und Multi-Model-Orchestrierung kombinieren, um Verfügbarkeit, Latenz und Kosten in Produktion zu optimieren.
SWE-Together misst die Leistung von Coding-Agenten über mehrere Interaktionsrunden hinweg, wie sie in echter Nutzung vorkommen, statt nur das Endergebnis einer einmaligen Aufgabe zu bewerten.
Ein 35B-Agentenmodell mit Horizon-Skalierung und Multi-Teacher-Destillation erreicht vergleichbare Leistung zu 1-Billionen-Parameter-Modellen auf Long-Horizon-Benchmarks.
Asynchrone Pipeline-Parallelisierung mit PipeDream-2BW und neueren Optimizern überwindet die Gradienten-Staleness-Problematik und erlaubt effizientes Pretraining großer Sprachmodelle ohne GPU-Idle-Zeit.
Zehn der elf getesteten Open-Source-KI-Agenten lassen sich durch eine klassische Shell-Injection-Technik dazu bringen, Sicherheitsprüfungen zu umgehen.
Vision-AI-Agenten brauchen systematische Wege zur Datensynthese und Fine-Tuning, um seltene Fälle zu erkennen und sich an lokale Bedingungen anzupassen.
PAR Technology behandelt LLM-Modelle nicht als Sicherheitsgrenzen für Multi-Tenant-Daten, sondern sperrt Datenzugriff durch kryptographische Signierung, semantische Validierung und programmatische SQL-Isolation ab.
Ornith-1.0 bietet in den Größen 9B, 31B, 35B MoE und 397B MoE agentengesteuerte Fähigkeiten für Code-Aufgaben und erreicht bei vergleichbarer Größe State-of-the-Art-Performance auf Coding-Benchmarks.
KI-Modelle produzieren funktionsfähigen Code, implementieren aber systematisch keine Sicherheitsschutzmaßnahmen wie Rate-Limiting oder Input-Validierung, weil sie auf öffentlichem Code trainiert sind, der diese Aspekte nicht strukturiert abbildet.
Die Qualität lokaler Open-Source-LLMs hängt weniger vom Modell ab als vielmehr von der Codequalität, Fehlerbehandlung und API-Integration rund um die Modellanfrage.
KI-basierte Code-Agenten können durch präparierte GitHub-Repositories zur Ausführung verborgenerer Malware bewogen werden, ohne dass gängige Sicherheitsprüfungen das Risiko erkennen.