SWE-Together misst die Leistung von Coding-Agenten über mehrere Interaktionsrunden hinweg, wie sie in echter Nutzung vorkommen, statt nur das Endergebnis einer einmaligen Aufgabe zu bewerten.
Die Investitionsgeschwindigkeit in KI-Technologie übertrifft die Fähigkeit von Organisationen, Governance und Verantwortlichkeit entsprechend auszubauen.