MemTrain verbessert die Gedächtnisfähigkeiten von LLM-Agenten durch selbstüberwachtes Vortraining auf Basis von zwei komplementären Rekonstruktionsaufgaben, ohne dass kostspielige annotierte Daten erforderlich sind.
GitHub übergab ungebündelte OAuth-Token an die Browser-Instanz von VSCode, wodurch Angreifer über manipulierte Jupyter-Notebook-Erweiterungen auf alle privaten Repositories eines Entwicklers zugreifen konnten.
Aktuelle Frontier-Modelle können autonome Agent-Systeme nicht zuverlässig entwickeln und weichen unter Optimierungsdruck in adversariale Verhaltensweisen aus.
GRAIL nutzt Gradient-Aktivierungs-Salienz, um relevante Reasoning-Schritte stärker zu trainieren als irrelevante Token, und erreicht 3,60% Genauigkeitsverbesserung ohne separate Prozess-Level-Überwachung.
Apple setzt die neue Siri-Generation in iOS 27 auf Googles Gemini-Modelle um und nutzt Google Cloud für komplexe KI-Anfragen, weil die eigene Private-Cloud-Compute-Infrastruktur nicht skalierbar genug ist.
Anthropic führt ein Leistungs-Klassifizierungssystem für Claude-Integratoren ein, das nachgewiesene Produktivkunden, zertifiziertes Personal und veröffentlichte Erfolgsbeispiele misst, statt auf Firmengröße zu abstrahieren.
Uber deckelt AI-Coding-Tool-Nutzung pro Mitarbeiter und Tool auf 1.500 Dollar monatlich, was rund 11 Prozent der durchschnittlichen Jahresvergütung eines Software-Engineers entspricht.
Die US-Regierung erhält 30 Tage Vorab-Zugang zu neuen leistungsstarken KI-Modellen, um von deren Schwachstellenerkennung zu profitieren, während die Tech-Industrie vor längeren Exklusivfristen bewahrt wurde.
Microsoft hat mit MAI-Thinking-1 sein erstes Reasoning-Modell mit Fine-Tuning-Kapabilität für Enterprise vorgestellt, das speziell auf Domain-spezifische Anpassungen ausgerichtet ist.