Quelldaten - Fuenfgeld/DMA2024TeamB GitHub Wiki

Quelldaten

Beschreibung

Die synthetischen Quelldaten, die im Projekt verwendet werden, wurden durch die Anwendung Synthea generiert und zu einem Quelldatensatz mit der Bezeichnung "Breast Cancer" zusammengefasst.

Der "Breast Cancer" Datensatz enthält Informationen zu fiktiven Patienten, die mit Brustkrebs diagnostiziert wurden. Die Daten umfassen verschiedene Aspekte des Gesundheitswesens, darunter Patientenprofile, medizinische Encounters (Behandlungsfälle), Diagnosen, Prozeduren, Medikationen und weitere relevante Informationen.

Jeder Patient im Datensatz hat eine eindeutige Identifikationsnummer, und für jeden Patienten gibt es eine oder mehrere Encounters, die verschiedene medizinische Ereignisse darstellen. Innerhalb jedes Encounters sind detaillierte Informationen zu Diagnosen, durchgeführten Prozeduren, verabreichten Medikamenten und anderen relevanten medizinischen Daten enthalten.

Der Datensatz ermöglicht die Simulation von Szenarien im Zusammenhang mit Brustkrebs, von der Diagnose über die Behandlung bis zur Nachsorge. Diese synthetischen Daten tragen dazu bei, Datenschutzbestimmungen zu wahren, während gleichzeitig eine realistische Basis für die Analyse und Entwicklung von Gesundheitslösungen geboten wird.

Herkunft

Der Synthea Breast Cancer Datensatz ist Teil des Synthea-Projekts, einer Open-Source-Initiative zur Erstellung von synthetischen, aber realistischen Patientendaten für die Gesundheitsinformatik-Forschung. Die zugehörigen Daten wurden in Form von CSV-Dateien zur Verfügung gestellt.

Daten

Folgende relevanten Datensätze wurden identifiziert:

Dateiname Beschreibung
conditions.csv Patientenzustände oder Diagnosen.
encounters.csv Patientenkontaktinformationen.
medications.csv Patientenmedikamentendaten.
observations.csv Patientenbeobachtungen, einschließlich Vitalwerte und Laborberichte.
patients.csv Patientendemografiedaten.
procedures.csv Patientenprozedurendaten, einschließlich Operationen.

Data Dictionaries

Das Data Dictionary zu den Quelldaten liegt unter folgender GitHub Seite ab: CSV-File-Data-Dictionary

Im folgenden sind die relevanten Beschreibungen zu den Datensätzen dargestellt:

Conditions

Column Name Data Type Required? Description
Start Date (YYYY-MM-DD) true Das Datum, an dem die Erkrankung diagnostiziert wurde.
Stop Date (YYYY-MM-DD) false Das Datum, an dem die Erkrankung gelöst wurde, falls zutreffend.
🗝️ Patient UUID true Fremdschlüssel zum Patienten.
🗝️ Encounter UUID true Fremdschlüssel zur Begegnung, bei der die Erkrankung diagnostiziert wurde.
Code String true Diagnosecode aus SNOMED-CT.
Description String true Beschreibung der Erkrankung.

Encounters

Column Name Data Type Required? Description
🔑 Id UUID true Primärschlüssel. Eindeutige Kennung des Behandlungsfalls.
Start iso8601 UTC Date (yyyy-MM-dd'T'HH:mm'Z') true Das Datum und die Uhrzeit, an dem der Behandlungsfall begonnen hat.
Stop iso8601 UTC Date (yyyy-MM-dd'T'HH:mm'Z') false Das Datum und die Uhrzeit, an dem der Behandlungsfall abgeschlossen wurde, falls zutreffend.
🗝️ Patient UUID true Fremdschlüssel zum Patienten.
🗝️ Organization UUID true Fremdschlüssel zur Organisation.
🗝️ Provider UUID true Fremdschlüssel zum Leistungserbringer.
🗝️ Payer UUID true Fremdschlüssel zur Zahlungsorganisation.
EncounterClass String true Die Klasse des Behandlungsfalls, wie ambulant, Notfall, stationär, Wellness oder Urgent Care.
Code String true Behandlungsfallcode aus SNOMED-CT.
Description String true Beschreibung des Typs des Behandlungsfalls.
Base_Encounter_Cost Numeric true Die Grundkosten des Behandlungsfalls, ohne Berücksichtigung von Kosten für Medikamente, Impfungen, Prozeduren oder andere Dienstleistungen.
Total_Claim_Cost Numeric true Die Gesamtkosten des Behandlungsfalls, einschließlich aller Kostenpositionen.
Payer_Coverage Numeric true Der Betrag der Kosten, der von der Zahlungsorganisation übernommen wird.
ReasonCode String false Diagnosecode aus SNOMED-CT, nur wenn dieser Behandlungsfall auf einen bestimmten Zustand abzielt.
ReasonDescription String false Beschreibung des Grundcodes.

Medication

Column Name Data Type Required? Description
Start iso8601 UTC Date (yyyy-MM-dd'T'HH:mm'Z') true Das Datum und die Uhrzeit, zu der das Medikament verschrieben wurde.
Stop iso8601 UTC Date (yyyy-MM-dd'T'HH:mm'Z') false Das Datum und die Uhrzeit, zu der das Rezept endete, falls zutreffend.
🗝️ Patient UUID true Fremdschlüssel zum Patienten.
🗝️ Payer UUID true Fremdschlüssel zur Zahlungsorganisation.
🗝️ Encounter UUID true Fremdschlüssel zum Behandlungsfall, in dem das Medikament verschrieben wurde.
Code String true Medikamenten-Code aus RxNorm.
Description String true Beschreibung des Medikaments.
Base_Cost Numeric true Der Einzelposten-Kosten des Medikaments.
Payer_Coverage Numeric true Der Betrag, der von der Zahlungsorganisation übernommen oder erstattet wird.
Dispenses Numeric true Die Anzahl der Male, die das Rezept eingelöst wurde.
TotalCost Numeric true Die Gesamtkosten des Rezepts, einschließlich aller Einlösungen.
ReasonCode String false Diagnosecode aus SNOMED-CT, der angibt, warum dieses Medikament verschrieben wurde, falls zutreffend.
ReasonDescription String false Beschreibung des Grundcodes, falls zutreffend.

Observations

Column Name Data Type Required? Description
Date iso8601 UTC Date (yyyy-MM-dd'T'HH:mm'Z') true Das Datum und die Uhrzeit, zu der die Beobachtung durchgeführt wurde.
🗝️ Patient UUID true Fremdschlüssel zum Patienten.
🗝️ Encounter UUID true Fremdschlüssel zum Behandlungsfall, in dem die Beobachtung durchgeführt wurde.
Category String false Beobachtungskategorie.
Code String true Beobachtungs- oder Laborcode aus LOINC.
Description String true Beschreibung der Beobachtung oder des Labors.
Value String true Der aufgezeichnete Wert der Beobachtung.
Units String false Die Maßeinheiten für den Wert.
Type String true Der Datentyp des Werts: Text oder numerisch.

Patients

Column Name Data Type Required? Description
🔑 Id UUID true Primärschlüssel. Eindeutige Kennung des Patienten.
BirthDate Date (YYYY-MM-DD) true Das Geburtsdatum des Patienten.
DeathDate Date (YYYY-MM-DD) false Das Sterbedatum des Patienten, falls zutreffend.
SSN String true Sozialversicherungsnummer des Patienten.
Drivers String false Führerscheinnummer des Patienten.
Passport String false Passnummer des Patienten.
Prefix String false Namenspräfix, wie Herr, Frau, Dr., etc.
First String true Vorname des Patienten.
Last String true Nachname oder Familienname des Patienten.
Suffix String false Namenssuffix, wie PhD, MD, JD, etc.
Maiden String false Geburtsname des Patienten.
Marital String false Familienstand. M steht für verheiratet (Married), S steht für ledig (Single). Derzeit keine Unterstützung für Scheidung (D) oder Witwenschaft (W).
Race String true Beschreibung der primären Rasse des Patienten.
Ethnicity String true Beschreibung der primären Ethnizität des Patienten.
Gender String true Geschlecht. M steht für männlich (Male), F steht für weiblich (Female).
BirthPlace String true Name der Stadt, in der der Patient geboren wurde.
Address String true Straßenadresse des Patienten ohne Kommas oder Zeilenumbrüche.
City String true Stadt der Adresse des Patienten.
State String true Bundesland der Adresse des Patienten.
County String false Landkreis der Adresse des Patienten.
FIPS County Code String false FIPS-Landkreiscode des Patienten.
Zip String false Postleitzahl des Patienten.
Lat Numeric false Breitengrad der Adresse des Patienten.
Lon Numeric false Längengrad der Adresse des Patienten.
Healthcare_Expenses Numeric true Die Gesamtkosten für Gesundheitsversorgung im Laufe des Lebens des Patienten (d.h., was der Patient bezahlt hat).
Healthcare_Coverage Numeric true Die Gesamtkosten für von Zahlungsorganisationen abgedeckte Gesundheitsdienstleistungen im Laufe des Lebens des Patienten (d.h., was die Krankenversicherung bezahlt hat).
Income Numeric true Jährliches Einkommen des Patienten.

Procedures

Column Name Data Type Required? Description
Start iso8601 UTC Date (yyyy-MM-dd'T'HH:mm'Z') true Das Datum und die Uhrzeit, zu der die Prozedur durchgeführt wurde (vor Version 3.0.0 als "Date" bezeichnet).
Stop iso8601 UTC Date (yyyy-MM-dd'T'HH:mm'Z') false Das Datum und die Uhrzeit, zu der die Prozedur abgeschlossen wurde, falls zutreffend.
🗝️ Patient UUID true Fremdschlüssel zum Patienten.
🗝️ Encounter UUID true Fremdschlüssel zum Behandlungsfall, in dem die Prozedur durchgeführt wurde.
Code String true Prozedurcode aus SNOMED-CT.
Description String true Beschreibung der Prozedur.
Base_Cost Numeric true Der Einzelposten-Kosten der Prozedur.
ReasonCode String false Diagnosecode aus SNOMED-CT, der angibt, warum diese Prozedur durchgeführt wurde, falls zutreffend.
ReasonDescription String false Beschreibung des Grundcodes, falls zutreffend.