- Einführung in synthetische Daten:
- Definiere synthetische Daten und ihre Relevanz für datenschutzkonforme Anwendungen.
- ChatGPT befragen:
- Stelle ChatGPT die Frage: „Für welche Use Cases könnte man personenbezogene synthetische Daten brauchen?“
- Sammle Ideen für Anwendungsfälle, z.B. Softwareentwicklung, Schulung von KI-Modellen, datenschutzkonforme Datenanalyse, etc.
- Relevante Datenpunkte definieren:
- Frage ChatGPT nach wichtigen Datenpunkten, z.B. demografische Daten, sozioökonomische Daten, Gesundheitsdaten, etc.
- Erstelle eine Liste der notwendigen Datenpunkte.
- Daten generieren lassen:
- Nutze den Prompt: „Ich benötige synthetische personenbezogene Daten mit einer breiten demografischen Verteilung inklusive Bildungsstand, Alter und so weiter.“
- Lasse ChatGPT eine Tabelle mit zehn synthetischen Personen erstellen.
- Daten in Deutsch konvertieren:
- Verwende den Prompt: „Bitte erstelle die Tabelle auf Deutsch.“
- Tabelle exportieren:
- Sage ChatGPT, eine Excel-Datei zu erstellen: „Bitte erstelle eine Excel-Datei, damit ich die Daten runterladen kann.“
- Lade die Excel-Datei herunter und speichere sie.
- Python-Code für Datenautomation:
- Frage ChatGPT nach Python-Code für die Datenautomation: „Bitte gib mir ein Beispiel-Code, wie man diese Daten generieren kann.“
- Nutze die Bibliothek Faker, um den Code auszuführen und die Daten zu generieren.
- Verstehen, was synthetische Daten sind und warum sie wichtig sind.
- Lernen, wie man mit ChatGPT relevante Use Cases identifiziert.
- Erstellen von synthetischen Datensätzen mit verschiedenen demografischen Datenpunkten.
- Export von Daten in Excel.
- Automatisierung der Datengenerierung mit Python.
- ChatGPT
- Excel