Auf den Punkt: KI-Modelle produzieren funktionsfähigen Code, implementieren aber systematisch keine Sicherheitsschutzmaßnahmen wie Rate-Limiting oder Input-Validierung, weil sie auf öffentlichem Code trainiert sind, der diese Aspekte nicht strukturiert abbildet.

Eine Analyse von 50 realen GitHub-Projekten, die mit KI-Coding-Werkzeugen entstanden sind, offenbart ein strukturelles Problem: 88 Prozent enthalten kritische Schwachstellen. Die häufigsten Lücken entstehen durch fehlende Schutzlogik, nicht durch Implementierungsfehler.

Bei der Sicherheitsanalyse von 50 öffentlichen GitHub-Projekten, die anhand von Konfigurationsdateien wie .cursorrules oder CLAUDE.md als KI-generiert identifiziert wurden, ergab sich ein konsistentes Muster: Der durchschnittliche Sicherheits-Score betrug 34 von 100 Punkten. 88 Prozent der Projekte wiesen mindestens eine Schwachstelle mit hohem Schweregrad auf, 52 Prozent enthielten direkt ausnutzbare kritische Lücken. Bei 36 Prozent lagen API-Keys, Datenbankpasswörter oder Zugangsdaten im Klartext im Quellcode vor. 46 Prozent der Projekte lagen unter einem Score von 30, lediglich 8 Prozent über 90.

Die häufigsten Schwachstellenkategorien waren Injection-Angriffe (200 Findings), Path-Traversal-Lücken (87), Authentifizierungsprobleme (39) und hart codierte Zugangsdaten (38). Das Auffällige: Diese Mängel entstehen überwiegend nicht durch fehlerhafte Implementierung, sondern durch strukturell fehlende Schutzlogik. Wer ein KI-Modell beispielsweise zum Schreiben eines API-Endpunkts auffordert, erhält einen funktionsfähigen Endpunkt, aber nicht automatisch Rate-Limiting, Input-Validierung oder andere Schutzmaßnahmen. Das Modell gelernt hat, welcher Code häufig vorkommt und als syntaktisch korrekt gilt – nicht jedoch, welche Sicherheitsanforderungen eine Produktionsumgebung hat.

Das liegt am Trainings-Setup der Modelle: Sie werden auf öffentlichem Code trainiert, der zwar funktionierende Beispiele enthält, aber keinen Sicherheitskontext mitbringt. Fragen wie „Wie verhält sich dieses System unter Last?” oder „Wie validiere ich externe Eingaben?” werden vom Modell nicht proaktiv gestellt oder beantwortet.

Ein weiterer kritischer Befund: Konventionelle statische Code-Analyse-Tools (SAST) wie Semgrep arbeiten regelbasiert und können dieses Problem systematisch nicht erkennen. Sie identifizieren bekannte fehlerhafte Muster im Code – aber nicht das, was fehlt. Um diesen Blindfleck zu offenbaren, wurde in der Studie eine KI-basierte Validierungsschicht eingesetzt. Von 1.087 automatisch generierten Findings waren 486 (45 Prozent) falsch positive. Ein Beispiel: „Der SQL-Query nutzt parametrisierte Abfragen, keine Injection möglich” oder „Das Secret steht in einer Beispieldatei mit Platzhalter your_key_here und ist nicht produktiv.” Konventionelle Scanner hätten diese Meldungen ungefiltert ausgegeben und damit zu Alert Fatigue geführt.

Für CTOs bedeutet das konkret: KI-generierter Code erfordert einen zusätzlichen Validierungsschritt, der über regelbasierte SAST-Tools hinausgeht. Ohne explizite Sicherheits-Prompts und Architektur-Review bleibt ein großer Teil der Risiken unsichtbar. Code-Reviews sollten gezielt auf fehlende Schutzlogik abzielen, nicht nur auf Fehler in vorhandenem Code.

Quelle: www.it-daily.net · Erschienen 29. Juni 2026
Lumi AI News — KI-assistierte Kuratierung gemaess Art. 50 EU AI Act. Paraphrase und Klassifikation durch Lumi News Pipeline v1.7.2.

Share on:

KI-generierte Codeprojekte zeigen systematische Sicherheitsmängel

Lumi AI News

Rechtliches

Themenbereiche