Compliance
DSGVO-konform mit KI programmieren
Zuletzt aktualisiert: 2026-07-02Lesezeit ca. 4 Min.
DSGVO-konformes KI-Coding beginnt mit einer Beobachtung: Code selbst ist selten ein personenbezogenes Datum – aber der Kontext, den KI-Tools einlesen (Testdaten, Tickets, Commit-Historie, Logs), ist es oft. Compliance-Arbeit ist deshalb Datenfluss-Arbeit: wissen, was die Umgebung verlässt, einen AVV nach Art. 28 und einen Transfermechanismus dahinterlegen, die Eingaben minimieren und alles dokumentieren. Die abschließende Bewertung gehört eurem Datenschutzbeauftragten.
Inhalt
Wann die DSGVO beim KI-Coding überhaupt greift
Rechtsstand: 2. Juli 2026. Dieser Artikel beschreibt Regulierung zur Orientierung – er ist keine Rechtsberatung; die Bewertung für euer Setup gehört zu eurem DSB.
Der Auslöser ist personenbezogenes Datum erreicht Tool. Ein Algorithmus hat keine betroffene Person – aber moderne Coding-Assistenten sehen keine isolierten Algorithmen. Sie lesen Repository-Kontext, Tickets, Commit-Messages, Seeds und eingefügte Logs, und genau dort wohnen Namen, E-Mail-Adressen, IDs und Verhaltensdaten. Die Orientierung der Aufsichtsbehörden baut auf demselben Prinzip: Die Analyse folgt den Daten, nicht der Tool-Kategorie. Die erste ehrliche Frage lautet also nicht „ist Copilot konform?“, sondern „was sendet unsere Konfiguration tatsächlich?“
Die Acht-Punkte-Checkliste
| # | Prüfpunkt | Was er praktisch bedeutet |
|---|---|---|
| 1 | Datenfluss kartieren | Was die Umgebung verlässt: Prompts, Repo-Kontext, Telemetrie, Logs – pro Tool und Konfiguration |
| 2 | Personenbezug darin lokalisieren | Testdaten, Seeds, Tickets, Commit-Historie, eingefügte Logs – nicht der Algorithmus, sein Umfeld |
| 3 | Vor der Übertragung minimieren | Anonymisierte Testdaten, Kontext-Excludes, Secret-Filter, lokale Verarbeitung wo machbar |
| 4 | Auftragsverarbeitung (Art. 28) | AVV mit dem Anbieter – Business-/Enterprise-Tarife bieten ihn, Consumer-Tarife oft nicht |
| 5 | Transfermechanismus (Kapitel V) | EU-Verarbeitung, Angemessenheit (z. B. DPF-Zertifizierung) oder SCC + Bewertung – bei jeder Nicht-EU-Verarbeitung |
| 6 | Trainings-Opt-out, dokumentiert | Anbieter-Zusage, dass Eingaben nicht ins Modell-Training gehen – schriftlich, nicht im Marketing |
| 7 | Beschäftigten-Anweisung | Was in Prompts darf und was nie – kurz, schriftlich, Teil des Onboardings |
| 8 | Dokumentation | VVT-Eintrag (Art. 30), DSFA wo das Risiko es verlangt, Belege pro Run über das Angefasste |
Die klassischen Verstoß-Muster
- Consumer-Accounts im Berufsumfeld. Free-Tarife kommen oft ohne AVV und mit Training auf Eingaben – dasselbe Modell hinter einem Business-Tarif mit beidem ist eine völlig andere Rechtslage.
- Echtdaten in Testfixtures. Das Tool hat nie echte Kundendatensätze gebraucht, um eine Migration zu schreiben – aber sobald sie im Repo liegen, liest jeder kontextbewusste Assistent sie ein.
- Logs zum Debuggen eingefügt. Produktions-Logs sind dicht an Personenbezug; sie in einen Prompt zu kopieren ist eine Übermittlung wie jede andere. Die BSI/ANSSI-Empfehlungen markieren genau diese Klasse unbeabsichtigter Offenlegung.
Lokale Verarbeitung als Minimierungs-Strategie
Der stärkste einzelne Hebel der Checkliste ist Punkt 3, und seine stärkste Form ist Verarbeitung, die eure Umgebung nie verlässt: Kein Anbieter-Datenfluss heißt kein Art.-28-Vertragspartner, keine Transfer-Analyse, keine Trainingsfrage. Diese Logik – und ihre ehrlichen Grenzen, denn auch lokales Tooling braucht Rechtsgrundlagen, Zugriffskontrolle und Telemetrie-Hygiene – steht im Guide zur lokalen KI-Code-Prüfung. Für die meisten Teams ist der realistische Endzustand gemischt: Cloud-Assistenz, wo der Datenfluss sauber ist, lokale Prüfung, wo nicht – und eine schriftliche Richtlinie, die sagt, was wohin gehört.
Wo Reality Graph ansetzt
Reality Graph ist local-first ausgelegt: Die Verifikation von KI-Coding-Runs gegen ihre schriftlichen Aufträge passiert in eurer Umgebung – die Verifikationsschicht selbst fügt eurer Analyse also keinen neuen Anbieter-Datenfluss hinzu. Ihre Prüfberichte dokumentieren pro Run, was angefasst und geprüft wurde – brauchbares Material für Checklisten-Punkt 8. Es ist kein Compliance-Produkt und fällt keine DSGVO-Urteile; die Bewertung bleibt bei euch und eurem DSB.
Diese Checkliste gibt euch
- Die Datenfluss-zuerst-Sicht, mit der Aufsichtsbehörden arbeiten
- Acht Prüfpunkte in Arbeitsreihenfolge, formale Seite benannt
- Die klassischen Verstoß-Muster für die Suche im eigenen Team
- Eine Minimierungs-Strategie, die die juristische Fläche verkleinert
Sie gibt euch nicht
- Rechtsberatung oder ein Konformitätsurteil für irgendein Tool
- Einen Ersatz für die Bewertung eures DSB
- Anbieter-spezifische Vertragsanalyse – Bedingungen ändern sich
- Einen Freifahrtschein für interne Pflichten, nur weil lokal verarbeitet wird
Wenn diese Grenzen zu eurem Team passen:
FAQ
- Wie setzt man KI-Coding-Tools DSGVO-konform ein?
- Indem man es als Datenfluss-Problem behandelt, bevor es ein Tool-Problem wird: kartieren, was die eigene Umgebung tatsächlich verlässt (Prompts, Repository-Kontext, Telemetrie), bestimmen, wo sich darin personenbezogene Daten verstecken können (Testdaten, Tickets, Logs, Commit-Historie), und dann die formale Seite schließen – Auftragsverarbeitungsvertrag nach Art. 28 mit dem Anbieter, ein tragfähiger Transfermechanismus bei Verarbeitung außerhalb der EU, dokumentierte Trainings-Opt-outs und eine Anweisung für die Beschäftigten. Ob das Ergebnis konform ist, bewertet euer Datenschutzbeauftragter.
- Ist Quellcode ein personenbezogenes Datum?
- Code als solcher meist nicht – ein Algorithmus hat keine betroffene Person. Personenbezug versteckt sich in dem, was den Code umgibt: echte Kundendatensätze in Testdaten und Seeds, Namen und E-Mail-Adressen in Commit-Historie und Tickets, die das Tool als Kontext einliest, Nutzerdaten in Logs, die zum Debuggen eingefügt werden. Deshalb ist die ehrliche Analyseeinheit das komplette Kontextfenster des Tools, nicht die .ts-Datei.
- Brauchen wir einen AVV für Copilot, Claude oder Cursor?
- Wenn das Tool personenbezogene Daten in eurem Auftrag verarbeitet – und mit Repository-Kontext, Tickets und Logs kann es das realistisch –, verlangt Art. 28 DSGVO einen Auftragsverarbeitungsvertrag mit dem Anbieter. Business- und Enterprise-Tarife der großen Anbieter bieten AVVs; Free- und Consumer-Tarife oft nicht, und sie behalten sich häufig Training auf Eingaben vor. Dieser Unterschied – nicht die Modellqualität – macht Consumer-Accounts im Berufsumfeld zum klassischen Verstoß-Muster.
- Was ist mit Datentransfers zu US-Anbietern?
- Werden personenbezogene Daten außerhalb der EU verarbeitet, braucht ihr einen tragfähigen Mechanismus nach Kapitel V DSGVO – Stand Juli 2026 typischerweise ein Angemessenheitsbeschluss (etwa das EU-US Data Privacy Framework für zertifizierte Anbieter) oder Standardvertragsklauseln plus Transfer-Bewertung. Einige Anbieter bieten inzwischen EU-Verarbeitung oder EU-Deployments an, was die Analyse vereinfacht. Welcher Mechanismus für euer Setup trägt, ist eine Frage für DSB und Justiziariat – die Checkliste stellt sicher, dass sie gestellt wird.
- Löst lokales KI-Coding die DSGVO-Frage?
- Es verkleinert sie erheblich – Verarbeitung, die eure Umgebung nie verlässt, hat keinen Anbieter-Datenfluss, keinen Art.-28-Vertragspartner und keinen Drittlandtransfer. Verschwinden lässt es die DSGVO nicht: Auch interne Verarbeitung braucht Rechtsgrundlage, Minimierung und Zugriffskontrolle, und Telemetrie- oder Update-Kanäle eines „lokalen“ Tools können trotzdem nach Hause funken. Local-first ist eine starke Datenminimierungs-Strategie, kein automatisches Konformitätsurteil.
- Was gehört in die Dokumentation?
- Vier Artefakte decken die meisten Prüfungen ab: der Eintrag im Verzeichnis von Verarbeitungstätigkeiten (Art. 30) für das KI-Tool; AVV und Transfermechanismus mit dem Anbieter; die Anweisung an die Beschäftigten, was in Prompts darf und was nie; und, wo das Risiko es verlangt, eine Datenschutz-Folgenabschätzung. Teams, die zusätzlich pro Run festhalten, was das Tool tatsächlich angefasst hat, beantworten Rückfragen schneller als Teams, die aus dem Gedächtnis rekonstruieren.
Weiterlesen
Quellen
- LfDI Baden-Württemberg – Rechtsgrundlagen im Datenschutz beim Einsatz von KI (Aufsichtsbehörde, abgerufen 2026-07)
- DSGVO, Art. 28 – Auftragsverarbeiter und AVV
- Dr. Schwenke – Checkliste KI & Datenschutz (Praktiker-Sekundärquelle, abgerufen 2026-07)
- BSI/ANSSI – gemeinsame Empfehlungen zu KI-Programmierassistenten: Datenflüsse und Risiken (2024)