Google nutzt automatisch aktivierte KI-Funktionen zur Datensammlung aus Gmail und Suchdiensten — eine Praxis, die selbst der hauseigene Gemini als „Privacy-verletzende Opt-out-Müdigkeit” einstuft.
Massenkäufe von antiquarischen Büchern durch einen kanadischen Händler deuten auf destruktives Scannen für KI-Training hin und stellen regulatorische Compliance in Frage.
Bright Data integriert ein SDK in kostenlose Apps, das Smart-TVs und Smartphones ohne ausreichende Transparenz als Exit-Nodes für ein globales Proxy-Netzwerk mit 400 Millionen IP-Adressen zweckentfremdet – auch wenn VPN-Verbindungen aktiviert sind.
Der BfDI bewertet das direkte Training von KI-Modellen mit echten Steuerdaten als datenschutzrechtlich kritisch, da Memorisierung von Bürgerdaten ein bekanntes Risiko darstellt.
RACES ermöglicht die automatische Komposition verifizierbarer Umgebungen durch rekursive Kombination, worauf hin DeepSeek-R1-Distill-Qwen-14B um 3,1 Punkte und Qwen3-14B um 2,3 Punkte bei sechs Benchmarks zulegte.
Finanzbehörden verwenden echte Steuerdaten nicht nur zum KI-Training, sondern auch im laufenden Betrieb zur Validierung, was datenschutz- und AI-Act-Compliance erfordert.