
Amazon Bedrock AgentCore: Versionierte Test-Datasets für zuverlässige Agent-Evaluierung
Amazon Bedrock AgentCore führt versionierte Test-Datasets ein, die stabile Evaluierung von Agenten ermöglichen. Mit unveränderlichen Versionen für CI/CD-Gates und Draft-Modus für Entwicklung bietet es Ground Truth für verifiable Messungen statt subjektiver Bewertungen – optimal für Inner-Loop-Iterat
Bewertung von Deep Agents mit LangSmith auf AWS
AWS und LangChain zeigen in einem neuen Leitfaden, wie Entwickler KI-Agenten systematisch evaluieren und überwachen können. Mit LangSmith auf AWS, Amazon Nova 2 Lite und strukturierten Evaluierungsmustern lässt sich die Zuverlässigkeit von komplexen Multi-Step-Agenten deutlich erhöhen – vom Developm
Bausteine für Foundation-Model-Training und Inferenz auf AWS
Foundation-Model-Entwicklung skaliert heute über drei Kanäle: Pre-Training, Post-Training und Test-Zeit-Compute. AWS zeigt, wie ihre Infrastruktur – Beschleuniger, Netzwerk, Speicher – mit Open-Source-Tools wie PyTorch, Kubernetes und Prometheus zusammenwirkt, um effizientes Training und Inferenz zu
- « Previous
- 1
- …
- 3
- 4
- 5







