NEUSWE-Together: Benchmark für Coding-Agenten in interaktiven Nutzersitzungen30. June 202630. June 2026AI Models, Claude CodeSWE-Together misst die Leistung von Coding-Agenten über mehrere Interaktionsrunden hinweg, wie sie in echter Nutzung vorkommen, statt nur das Endergebnis einer einmaligen Aufgabe zu bewerten. Share on: