Anonymisierung verstehen

Wie Zeuslock sensible Werte in strukturell gültige Fälschungen umschreibt, damit die KI weiterhin nützliche Antworten liefert, ohne dass das Original Ihren Rechner verlässt.

Die drei Richtlinienmodi in einer Minute

Jeder Detektor in Zeuslock arbeitet in einem von drei Modi, und Sie können sie pro Datentyp kombinieren. Monitor lässt den Prompt passieren und protokolliert den Fund für das Sicherheitsteam. Anonymisieren schreibt den sensiblen Wert vor dem Versand um, sodass die KI die echten Daten nie sieht, aber dennoch eine sinnvolle Frage erhält. Blockieren stoppt den Prompt vollständig und zeigt Ihnen den Grund an.

Dieser Artikel widmet sich dem mittleren Modus, weil er die meisten Fragen aufwirft. Monitor ist unsichtbar. Blockieren ist offensichtlich. Anonymisieren ist der Modus, der unauffällig die eigentliche Arbeit erledigt.

Was die Anonymisierung tatsächlich tut

Wenn Zeuslock einen sensiblen Wert in Ihrem Prompt erkennt, löscht er ihn nicht und ersetzt ihn auch nicht durch ein generisches [GESCHWÄRZT]-Tag. Beides würde dazu führen, dass die KI Unsinn antwortet oder die Hilfe verweigert. Stattdessen ersetzt Zeuslock den Wert durch eine strukturell gültige Fälschung — eine Zeichenkette, die wie das Original aussieht und sich so verhält, aber ohne den geheimen Anteil.

Konkret heißt das:

  • Der neue Wert behält dasselbe Format, dieselbe Länge und die Prüfziffern dort, wo sie zählen.
  • Der nicht sensible Kontext (Ländercode, Marke, letzte 4 Ziffern) bleibt erhalten, damit die KI weiter darüber argumentieren kann.
  • Die wirklich geheimen Bytes — Kartennummer, API-Schlüssel, Telefonziffern — verschwinden.

Beispiele

TypOriginalAnonymisiertWarum diese Umschreibung
Kreditkarte4111-1111-1111-11114xxx-xxxx-xxxx-1111Die Luhn-Prüfung bleibt gültig, die Marke ist an der führenden 4 erkennbar, die letzten 4 Ziffern bleiben für den Kundenkontext erhalten.
E-Mailalice@acme.comuser@example.comWeiterhin gültige E-Mail-Form, keine echte Identität, keine echte Domain.
AWS-ZugangsschlüsselAKIAIOSFODNN7EXAMPLEAKIA****************Das Präfix bleibt, damit die KI weiß, dass es sich um einen AWS-Schlüssel handelt; die geheime Entropie wird entfernt.
IBANFR76 3000 6000 0123 4567 8901 234FR76 XXXX XXXX XXXX XXXX XXXX XXXLändercode und Bankleitzahl bleiben erhalten, Kontonummern werden zerstört.
Telefonnummer+33 6 12 34 56 78+33 6 XX XX XX XXLänder- und Netzvorwahl bleiben, Teilnehmerziffern werden zerstört.

Warum wir es formatbewahrend nennen

Der Sinn, Präfix, Länge und Prüfsumme zu erhalten, ist, dass die KI weiterhin Fragen über den Wert beantworten kann, ohne den Wert selbst zu sehen. Fragen Sie ChatGPT „Aus welchem Land stammt diese IBAN?", antwortet die redigierte Fassung weiterhin „Frankreich" — weil FR76 erhalten geblieben ist. Bitten Sie Claude, eine Rückerstattungsmail zu verfassen, die „die Karte endend auf 1111" erwähnt, funktioniert das ebenfalls — weil die letzten vier Ziffern erhalten geblieben sind.

Anonymisierung ist also keine Steuer auf den Nutzen. Sie ist das Gegenteil eines schwarzen Balkens auf dem Bildschirm. Ihr Prompt funktioniert weiter; nur das Geheimnis reist nicht mit.

Die Vorschau vor dem Senden

Anonymisierung passiert nie im Stillen. Bevor ein umgeschriebener Prompt Ihren Browser oder Desktop-Agent verlässt, zeigt Zeuslock ein Vorschaufenster mit dem exakten Text, der gerade gesendet wird. Sie sehen Stück für Stück, welche Teilzeichenketten ersetzt wurden. Sie können abbrechen, den Prompt bearbeiten und erneut senden oder bestätigen.

Das hat zwei Zwecke. Es schafft Vertrauen — Sie wissen immer, was die KI gesehen hat. Und es schult: nach ein paar Vorschauen erkennen Sie ganz von selbst die Arten von Werten, die Sie beinahe preisgegeben hätten.

Was nicht anonymisiert wird

Nur die erkannten Werte werden umgeschrieben. Der Fließtext drumherum bleibt unangetastet. Ein Prompt wie:

Mein Kunde bei acme.com hat gestern mit 4111-1111-1111-1111 bezahlt, kannst du mir eine Dankesmail entwerfen?

wird zu:

Mein Kunde bei user@example.com hat gestern mit 4xxx-xxxx-xxxx-1111 bezahlt, kannst du mir eine Dankesmail entwerfen?

Die Absicht des Prompts bleibt erhalten. Die KI verfasst die Mail. Weder die Kartennummer noch die Kunden-E-Mail verlassen Ihren Rechner.

Einwegig und lokal

Anonymisierung ist einwegig. Der originale sensible Wert erreicht weder den LLM-Anbieter noch die Server von Zeuslock. Die Zuordnung zwischen echtem und falschem Wert lebt ausschließlich in Ihrem Browser oder Desktop-Agent für die Dauer des Prompts und wird danach verworfen. Es gibt keine Rückwärtssuche, weder bei uns noch sonst irgendwo.

Wenn Anonymisierung nicht ausreicht

Anonymisierung funktioniert hervorragend für Werte mit klarer Struktur: Karten, Schlüssel, IBANs, E-Mails, Telefonnummern. Sie funktioniert weniger gut für zwei Inhaltskategorien:

  • Quellcode. Eine proprietäre Funktion ist als Ganzes sensibel — man anonymisiert „den geheimen Algorithmus" nicht, indem man Variablen umbenennt. Für Code verwenden Sie den Blockieren-Modus oder eine organisationsweite Richtlinie, die Code ausschließlich an freigegebene Tools routet.
  • Freier proprietärer Text. Interne Strategiememos, unveröffentlichte Produktdetails, vertrauliche Kundentexte. Hier liegt das Sensible in der Bedeutung, nicht in einem Token. Blockieren ist hier die richtige Antwort.

Der empfohlene Rollout gilt weiterhin: starten Sie in den ersten zwei Wochen mit Monitor, um zu sehen, was durchläuft; schalten Sie auf Anonymisieren um für alles, was eine brauchbare Umschreibung hat; und behalten Sie Blockieren für die Kategorien vor, in denen keine sichere Umschreibung existiert.