Datenschutz fortgeschritten

Trainingsverbot

Ein Trainingsverbot ist eine vertragliche Zusicherung eines KI-Anbieters, dass Kundendaten nicht zur Verbesserung oder zum Training der KI-Modelle verwendet werden. Diese Klausel ist in Enterprise-Tarifen und Data Processing Agreements (DPA) von KI-Diensten häufig verankert und dient dem Datenschutz.

Ausführliche Erklärung

Das Trainingsverbot ist eine zentrale datenschutzrechtliche Schutzmaßnahme beim Einsatz generativer KI-Dienste. KI-Modelle wie ChatGPT, Claude oder Gemini werden in der Regel durch maschinelles Lernen kontinuierlich verbessert, indem sie aus Nutzereingaben lernen. Ohne Trainingsverbot können personenbezogene oder vertrauliche Unternehmensdaten, die Sie einem KI-Dienst übermitteln, in künftigen Modellversionen landen und möglicherweise in Antworten an andere Nutzer einfließen. Ein wirksames Trainingsverbot verhindert diese Weiterverwendung rechtlich bindend.

In der Praxis unterscheiden die meisten Anbieter zwischen Verbraucher- und Unternehmenstarifen. Bei kostenlosen oder Consumer-Accounts ist die Nutzung von Eingabedaten zum Training oft standardmäßig aktiviert und kann nur über Einstellungen oder Widerspruch deaktiviert werden. Enterprise- und API-Tarife hingegen enthalten das Trainingsverbot üblicherweise im Data Processing Agreement. Anthropic trainiert beispielsweise standardmäßig nicht auf API- oder Claude.ai-Konversationen, OpenAI schließt das Training in Enterprise-Verträgen aus, und Google Workspace bietet explizite Trainingsverbote für Kundendaten.

Für KMU ist das Trainingsverbot aus mehreren Gründen relevant. Erstens kann die Verwendung von Kundendaten zum KI-Training einen Verstoß gegen die DSGVO darstellen, insbesondere wenn keine Rechtsgrundlage für diese Weiterverarbeitung besteht. Aufsichtsbehörden können bei Verstößen Bußgelder verhängen und im Extremfall die Löschung von Datensätzen oder ganzen Modellen anordnen. Zweitens birgt das Fehlen eines Trainingsverbots Risiken für Geschäftsgeheimnisse: Wenn vertrauliche Produktinformationen, Kalkulationen oder Kundenkorrespondenz in ein öffentliches Modell einfließen, kann dies Wettbewerbsvorteile gefährden.

Ein Trainingsverbot bedeutet jedoch nicht automatisch, dass keine Daten gespeichert werden. Viele Anbieter behalten sich vor, Eingaben für eine begrenzte Zeit zu Sicherheitszwecken oder zur Missbrauchserkennung aufzubewahren. OpenAI speichert API-Daten beispielsweise standardmäßig 30 Tage lang, Anthropic reduzierte diese Frist 2025 auf 7 Tage. Für besonders sensible Szenarien bieten manche Anbieter Zero Data Retention (ZDR) an, bei der auch diese temporäre Speicherung entfällt. Achten Sie darauf, dass das Trainingsverbot nicht nur in Marketing-Unterlagen erwähnt, sondern im DPA selbst verankert ist.

Praxisbeispiel

Eine 35-köpfige Steuerberatungskanzlei in Wien nutzt ChatGPT, um Entwürfe für Mandantenkorrespondenz zu erstellen. Dabei werden teils personenbezogene Daten wie Namen, Steuernummern und Einkommensverhältnisse eingegeben. Im kostenfreien Account würden diese Eingaben standardmäßig zum Training verwendet und könnten theoretisch in Antworten an Dritte auftauchen. Die Kanzlei wechselt daher zu ChatGPT Enterprise mit DPA und explizitem Trainingsverbot, um sicherzustellen, dass Mandantendaten ausschließlich für die Anfrage verwendet und nicht in künftige Modellversionen übernommen werden.

Ausführliche Erklärung

Praxisbeispiel

Quellen

Vertiefende Artikel im KI-Hub

DSGVO & ChatGPT im Unternehmen: Was gilt 2026?

KI DSGVO-konform einsetzen: Leitfaden für KMU

KI-Anbieter & Datenschutz: Pflichtklauseln im Vertrag