Zum Inhalt springen
Alle Beiträge
Datenschutz & Compliance10 Minuten Lesezeit

Zero Data Retention erklärt: US-Modelle DSGVO-konform auf deutschen Servern

Alexander Berkov

CTO, DeutschlandGPT

8. April 2026

Eine der häufigsten Fragen, die wir von Kunden hören: „Wie kann es sein, dass ihr US-Modelle wie GPT-4 oder Claude anbietet und gleichzeitig DSGVO-konform seid?" Die Antwort liegt in zwei Konzepten, die zusammen den entscheidenden Unterschied machen: Zero Data Retention (ZDR) und souveräne persistente Datenspeicherung.

Zwei Arten von Daten: Verarbeitung vs. Speicherung

Um zu verstehen, warum ZDR funktioniert, muss man zunächst eine grundlegende Unterscheidung treffen. Bei der Nutzung eines KI-Chatbots entstehen zwei fundamental verschiedene Datenflüsse.

Transiente Daten (Verarbeitung): Das ist der Moment, in dem eine Anfrage an ein KI-Modell geschickt und eine Antwort generiert wird. Der Nutzer stellt eine Frage, der Text wird an das Modell gesendet, das Modell verarbeitet den Input und liefert eine Antwort zurück. Dieser Vorgang ist stateless — das KI-Modell selbst speichert keine Daten zwischen einzelnen Anfragen.

Persistente Daten (Speicherung): Das sind alle Daten, die dauerhaft gespeichert werden: Chatverläufe, Nutzerprofile, hochgeladene Dokumente, Konfigurationen. Diese Daten bleiben bestehen, damit Nutzer auf ihre bisherigen Gespräche zugreifen können.

Worauf Sie achten sollten

Das DSGVO-Risiko liegt vor allem bei den persistenten Daten. Die transiente Verarbeitung dauert Sekunden. Die persistente Speicherung dauert Monate oder Jahre — und genau hier greift der US CLOUD Act.

Was ist Zero Data Retention?

Zero Data Retention ist eine vertragliche und technische Vereinbarung mit den Modell-Anbietern (OpenAI, Anthropic, Google etc.), die besagt: Nach der Verarbeitung einer Anfrage werden keine Daten beim Anbieter gespeichert.

Konkret bedeutet das:

  • Der Prompt wird an das Modell gesendet. Das Modell generiert eine Antwort.
  • Sobald die Antwort zurückgeliefert wurde, werden alle Daten der Anfrage beim Anbieter gelöscht.
  • Es findet kein Logging der Anfrage statt — das standardmäßige Logging ist durch die ZDR-Vereinbarung deaktiviert.
  • Es gibt kein Training mit den übermittelten Daten.
  • Caching existiert in begrenztem Umfang — Tokens können für maximal eine Stunde zwischengespeichert werden, um schnellere Antworten zu ermöglichen. Danach werden auch diese Daten vollständig gelöscht.

Warum funktioniert das? Weil Large Language Models grundsätzlich stateless sind. Ein LLM hat kein „Gedächtnis" zwischen einzelnen Anfragen. Jeder Request wird unabhängig verarbeitet. Es gibt keinen technischen Grund, Nutzerdaten nach der Verarbeitung zu behalten — die einzigen Gründe wären Logging, Monitoring oder Training. Genau das schließt ZDR vertraglich aus.

Praxis-Tipp

Der Effekt von ZDR: Selbst wenn ein US-Modell-Anbieter durch den CLOUD Act zur Herausgabe von Daten verpflichtet würde, gäbe es nichts herauszugeben. Die Daten existieren schlicht nicht mehr.

Warum ZDR allein nicht reicht

ZDR löst das Problem der transienten Datenverarbeitung. Aber ein KI-Chatbot besteht nicht nur aus dem Modell. Nutzer erwarten, dass ihre Chatverläufe gespeichert werden, dass sie auf frühere Gespräche zugreifen können, dass hochgeladene Dokumente verfügbar bleiben.

Diese persistenten Daten müssen irgendwo liegen. Und genau hier wird es kritisch: Wenn diese Daten auf der Infrastruktur eines US-Unternehmens gespeichert werden — sei es Azure, AWS oder Google Cloud — greift der CLOUD Act.

Der CLOUD Act unterscheidet nicht zwischen US-Servern und EU-Servern eines US-Unternehmens. Er verpflichtet US-Unternehmen und deren Tochtergesellschaften zur Herausgabe von Daten, unabhängig vom physischen Speicherort:

  • Daten auf Azure Deutschland (Frankfurt) → Microsoft ist ein US-Unternehmen → CLOUD Act greift
  • Daten auf AWS Europe (Frankfurt) → Amazon ist ein US-Unternehmen → CLOUD Act greift
  • Daten auf Google Cloud Europe → Alphabet ist ein US-Unternehmen → CLOUD Act greift

Für die transiente Verarbeitung ist das durch ZDR kein Problem. Für die persistente Speicherung ist es ein fundamentales Problem — denn hier liegen die Daten dauerhaft vor.

Souveräne Infrastruktur für persistente Daten

Die Lösung besteht darin, die persistente Datenspeicherung auf Infrastruktur zu betreiben, die nicht dem CLOUD Act unterliegt. In Deutschland bedeutet das: Anbieter, die zu 100% in deutschem Besitz sind und keine US-Muttergesellschaft haben.

Bei DeutschlandGPT nutzen wir dafür die Open Telekom Cloud, betrieben von T-Systems — einer 100% deutschen Tochter der Deutschen Telekom. Die Open Telekom Cloud wird in den Rechenzentren Magdeburg und Biere betrieben, ist BSI C5-zertifiziert und unterliegt nicht dem US CLOUD Act, da kein US-Unternehmen in der Eigentümerstruktur existiert.

Auf dieser Infrastruktur liegen alle persistenten Daten: Chatverläufe, Nutzerprofile, Dokumente, Konfigurationen. Selbst wenn sämtliche US-Modell-Anbieter gleichzeitig zur Herausgabe von Daten verpflichtet würden — bei ihnen liegt durch ZDR nichts. Und die Open Telekom Cloud unterliegt dem CLOUD Act nicht.

So sieht der Datenfluss in der Praxis aus

Um das Zusammenspiel von ZDR und souveräner Speicherung greifbar zu machen, hier der vereinfachte Datenfluss einer typischen Anfrage:

Schritt 1 — Nutzeranfrage: Ein Mitarbeiter stellt eine Frage im DeutschlandGPT-Chat. Die Anfrage wird über eine TLS 1.3-verschlüsselte Verbindung an die DeutschlandGPT-Plattform gesendet.

Schritt 2 — Verarbeitung auf der Open Telekom Cloud: Die DeutschlandGPT-Plattform läuft auf der Open Telekom Cloud. Hier wird die Anfrage entgegengenommen und an das gewählte KI-Modell weitergeleitet.

Schritt 3 — API-Call an den Modell-Anbieter (ZDR): Die Anfrage wird über eine ZDR-geschützte API an den jeweiligen Modell-Anbieter gesendet — beispielsweise Anthropic (Claude) über einen europäischen Endpoint. Der Anbieter verarbeitet die Anfrage und liefert die Antwort zurück. Danach werden alle Daten beim Anbieter gelöscht. Kein Logging, kein Training, kein Speichern.

Schritt 4 — Antwort und Speicherung: Die Antwort wird an den Nutzer zurückgeliefert. Der Chatverlauf wird auf der Open Telekom Cloud gespeichert — auf souveräner, deutscher Infrastruktur.

PhaseWo?DauerCLOUD Act?
Verarbeitung durch LLMEU-Endpoint des AnbietersSekundenIrrelevant (ZDR, keine Speicherung)
Temporäres CachingEU-Endpoint des AnbietersMax. 1 StundeIrrelevant (automatische Löschung)
Persistente SpeicherungOpen Telekom Cloud (DE)DauerhaftNein (100% deutsch)

Häufige Fragen und Missverständnisse

„Wenn das LLM stateless ist, warum weiß ChatGPT dann meine vorherigen Gespräche?"

Weil ChatGPT die Chatverläufe separat speichert und bei jeder neuen Nachricht den bisherigen Verlauf als Kontext an das Modell mitsendet. Das Modell selbst hat kein Gedächtnis — der Kontext wird von der Plattform bereitgestellt. Genau deshalb ist die Frage, wo dieser Kontext gespeichert wird, so entscheidend.

„Kann ich ZDR auch direkt bei OpenAI oder Anthropic bekommen?"

Ja, im Enterprise-Bereich bieten die Anbieter ZDR-Vereinbarungen an. Aber das löst nur die Hälfte des Problems. Wenn Sie die OpenAI API direkt nutzen und Ihre Chatverläufe auf Azure oder AWS speichern, greift der CLOUD Act bei der persistenten Speicherung trotzdem.

„Was ist mit dem Caching? Sind die Daten dann nicht doch kurz gespeichert?"

Ja, für maximal eine Stunde können Tokens gecacht werden. Das dient der Performance-Optimierung. Nach Ablauf der Stunde werden die Daten automatisch gelöscht. Dieses kurze Caching-Fenster stellt kein relevantes DSGVO-Risiko dar, da es keine persistente Speicherung ist.

„Wie kann ich sicher sein, dass ZDR wirklich eingehalten wird?"

ZDR ist eine vertragliche Vereinbarung. Die großen Modell-Anbieter haben ein enormes wirtschaftliches Interesse daran, diese Vereinbarungen einzuhalten — ein Verstoß würde ihr Enterprise-Geschäft in Europa gefährden. Zusätzlich sind die Vereinbarungen durch Zertifizierungen wie ISO 27001 und SOC 2 flankiert.

Fazit

DSGVO-konforme KI erfordert keinen Verzicht auf leistungsstarke US-Modelle. Es erfordert die richtige Architektur.

Für die transiente Verarbeitung: Zero Data Retention stellt sicher, dass keine Daten beim Modell-Anbieter verbleiben. LLMs sind stateless — ZDR schließt jede Speicherung vertraglich aus.

Für die persistente Speicherung: Souveräne Infrastruktur eines 100% deutschen Anbieters stellt sicher, dass die dauerhaft gespeicherten Daten nicht dem US CLOUD Act unterliegen.

Nur die Kombination aus beiden Ansätzen ergibt eine wirklich DSGVO-konforme Lösung. EU-Server eines US-Konzerns reichen nicht. Und ZDR ohne souveräne Speicherung löst nur die Hälfte des Problems. Wenn Sie wissen möchten, wie DeutschlandGPT diese Architektur in Ihrer Organisation umsetzt, sprechen Sie mit unserem Team in einer Demo.

Zero Data RetentionDSGVOCLOUD ActDatenschutzKI-Compliance

Alexander Berkov

CTO, DeutschlandGPT

Alexander ist CTO von DeutschlandGPT und verantwortet die technische Architektur der Plattform. Er hat die ZDR- und Souveränitäts-Infrastruktur von DeutschlandGPT konzipiert und aufgebaut, damit deutsche Organisationen die besten KI-Modelle der Welt DSGVO-konform nutzen können.

Wie DSGVO-konform ist Ihre KI-Nutzung heute?

Unser KI-Readiness-Check zeigt Ihnen in 2 Minuten, wo Ihre Organisation steht und wo Datenschutz-Risiken lauern.