Quelldaten - Fuenfgeld/DMA2024TeamB GitHub Wiki
Quelldaten
Beschreibung
Die synthetischen Quelldaten, die im Projekt verwendet werden, wurden durch die Anwendung Synthea generiert und zu einem Quelldatensatz mit der Bezeichnung "Breast Cancer" zusammengefasst.
Der "Breast Cancer" Datensatz enthält Informationen zu fiktiven Patienten, die mit Brustkrebs diagnostiziert wurden. Die Daten umfassen verschiedene Aspekte des Gesundheitswesens, darunter Patientenprofile, medizinische Encounters (Behandlungsfälle), Diagnosen, Prozeduren, Medikationen und weitere relevante Informationen.
Jeder Patient im Datensatz hat eine eindeutige Identifikationsnummer, und für jeden Patienten gibt es eine oder mehrere Encounters, die verschiedene medizinische Ereignisse darstellen. Innerhalb jedes Encounters sind detaillierte Informationen zu Diagnosen, durchgeführten Prozeduren, verabreichten Medikamenten und anderen relevanten medizinischen Daten enthalten.
Der Datensatz ermöglicht die Simulation von Szenarien im Zusammenhang mit Brustkrebs, von der Diagnose über die Behandlung bis zur Nachsorge. Diese synthetischen Daten tragen dazu bei, Datenschutzbestimmungen zu wahren, während gleichzeitig eine realistische Basis für die Analyse und Entwicklung von Gesundheitslösungen geboten wird.
Herkunft
Der Synthea Breast Cancer Datensatz ist Teil des Synthea-Projekts, einer Open-Source-Initiative zur Erstellung von synthetischen, aber realistischen Patientendaten für die Gesundheitsinformatik-Forschung. Die zugehörigen Daten wurden in Form von CSV-Dateien zur Verfügung gestellt.
Daten
Folgende relevanten Datensätze wurden identifiziert:
Dateiname | Beschreibung |
---|---|
conditions.csv | Patientenzustände oder Diagnosen. |
encounters.csv | Patientenkontaktinformationen. |
medications.csv | Patientenmedikamentendaten. |
observations.csv | Patientenbeobachtungen, einschließlich Vitalwerte und Laborberichte. |
patients.csv | Patientendemografiedaten. |
procedures.csv | Patientenprozedurendaten, einschließlich Operationen. |
Data Dictionaries
Das Data Dictionary zu den Quelldaten liegt unter folgender GitHub Seite ab: CSV-File-Data-Dictionary
Im folgenden sind die relevanten Beschreibungen zu den Datensätzen dargestellt:
Conditions
Column Name | Data Type | Required? | Description |
---|---|---|---|
Start | Date (YYYY-MM-DD) | true | Das Datum, an dem die Erkrankung diagnostiziert wurde. |
Stop | Date (YYYY-MM-DD) | false | Das Datum, an dem die Erkrankung gelöst wurde, falls zutreffend. |
🗝️ Patient | UUID | true | Fremdschlüssel zum Patienten. |
🗝️ Encounter | UUID | true | Fremdschlüssel zur Begegnung, bei der die Erkrankung diagnostiziert wurde. |
Code | String | true | Diagnosecode aus SNOMED-CT. |
Description | String | true | Beschreibung der Erkrankung. |
Encounters
Column Name | Data Type | Required? | Description |
---|---|---|---|
🔑 Id | UUID | true | Primärschlüssel. Eindeutige Kennung des Behandlungsfalls. |
Start | iso8601 UTC Date (yyyy-MM-dd'T'HH:mm'Z') | true | Das Datum und die Uhrzeit, an dem der Behandlungsfall begonnen hat. |
Stop | iso8601 UTC Date (yyyy-MM-dd'T'HH:mm'Z') | false | Das Datum und die Uhrzeit, an dem der Behandlungsfall abgeschlossen wurde, falls zutreffend. |
🗝️ Patient | UUID | true | Fremdschlüssel zum Patienten. |
🗝️ Organization | UUID | true | Fremdschlüssel zur Organisation. |
🗝️ Provider | UUID | true | Fremdschlüssel zum Leistungserbringer. |
🗝️ Payer | UUID | true | Fremdschlüssel zur Zahlungsorganisation. |
EncounterClass | String | true | Die Klasse des Behandlungsfalls, wie ambulant, Notfall, stationär, Wellness oder Urgent Care. |
Code | String | true | Behandlungsfallcode aus SNOMED-CT. |
Description | String | true | Beschreibung des Typs des Behandlungsfalls. |
Base_Encounter_Cost | Numeric | true | Die Grundkosten des Behandlungsfalls, ohne Berücksichtigung von Kosten für Medikamente, Impfungen, Prozeduren oder andere Dienstleistungen. |
Total_Claim_Cost | Numeric | true | Die Gesamtkosten des Behandlungsfalls, einschließlich aller Kostenpositionen. |
Payer_Coverage | Numeric | true | Der Betrag der Kosten, der von der Zahlungsorganisation übernommen wird. |
ReasonCode | String | false | Diagnosecode aus SNOMED-CT, nur wenn dieser Behandlungsfall auf einen bestimmten Zustand abzielt. |
ReasonDescription | String | false | Beschreibung des Grundcodes. |
Medication
Column Name | Data Type | Required? | Description |
---|---|---|---|
Start | iso8601 UTC Date (yyyy-MM-dd'T'HH:mm'Z') | true | Das Datum und die Uhrzeit, zu der das Medikament verschrieben wurde. |
Stop | iso8601 UTC Date (yyyy-MM-dd'T'HH:mm'Z') | false | Das Datum und die Uhrzeit, zu der das Rezept endete, falls zutreffend. |
🗝️ Patient | UUID | true | Fremdschlüssel zum Patienten. |
🗝️ Payer | UUID | true | Fremdschlüssel zur Zahlungsorganisation. |
🗝️ Encounter | UUID | true | Fremdschlüssel zum Behandlungsfall, in dem das Medikament verschrieben wurde. |
Code | String | true | Medikamenten-Code aus RxNorm. |
Description | String | true | Beschreibung des Medikaments. |
Base_Cost | Numeric | true | Der Einzelposten-Kosten des Medikaments. |
Payer_Coverage | Numeric | true | Der Betrag, der von der Zahlungsorganisation übernommen oder erstattet wird. |
Dispenses | Numeric | true | Die Anzahl der Male, die das Rezept eingelöst wurde. |
TotalCost | Numeric | true | Die Gesamtkosten des Rezepts, einschließlich aller Einlösungen. |
ReasonCode | String | false | Diagnosecode aus SNOMED-CT, der angibt, warum dieses Medikament verschrieben wurde, falls zutreffend. |
ReasonDescription | String | false | Beschreibung des Grundcodes, falls zutreffend. |
Observations
Column Name | Data Type | Required? | Description |
---|---|---|---|
Date | iso8601 UTC Date (yyyy-MM-dd'T'HH:mm'Z') | true | Das Datum und die Uhrzeit, zu der die Beobachtung durchgeführt wurde. |
🗝️ Patient | UUID | true | Fremdschlüssel zum Patienten. |
🗝️ Encounter | UUID | true | Fremdschlüssel zum Behandlungsfall, in dem die Beobachtung durchgeführt wurde. |
Category | String | false | Beobachtungskategorie. |
Code | String | true | Beobachtungs- oder Laborcode aus LOINC. |
Description | String | true | Beschreibung der Beobachtung oder des Labors. |
Value | String | true | Der aufgezeichnete Wert der Beobachtung. |
Units | String | false | Die Maßeinheiten für den Wert. |
Type | String | true | Der Datentyp des Werts: Text oder numerisch. |
Patients
Column Name | Data Type | Required? | Description |
---|---|---|---|
🔑 Id | UUID | true | Primärschlüssel. Eindeutige Kennung des Patienten. |
BirthDate | Date (YYYY-MM-DD) | true | Das Geburtsdatum des Patienten. |
DeathDate | Date (YYYY-MM-DD) | false | Das Sterbedatum des Patienten, falls zutreffend. |
SSN | String | true | Sozialversicherungsnummer des Patienten. |
Drivers | String | false | Führerscheinnummer des Patienten. |
Passport | String | false | Passnummer des Patienten. |
Prefix | String | false | Namenspräfix, wie Herr, Frau, Dr., etc. |
First | String | true | Vorname des Patienten. |
Last | String | true | Nachname oder Familienname des Patienten. |
Suffix | String | false | Namenssuffix, wie PhD, MD, JD, etc. |
Maiden | String | false | Geburtsname des Patienten. |
Marital | String | false | Familienstand. M steht für verheiratet (Married), S steht für ledig (Single). Derzeit keine Unterstützung für Scheidung (D) oder Witwenschaft (W). |
Race | String | true | Beschreibung der primären Rasse des Patienten. |
Ethnicity | String | true | Beschreibung der primären Ethnizität des Patienten. |
Gender | String | true | Geschlecht. M steht für männlich (Male), F steht für weiblich (Female). |
BirthPlace | String | true | Name der Stadt, in der der Patient geboren wurde. |
Address | String | true | Straßenadresse des Patienten ohne Kommas oder Zeilenumbrüche. |
City | String | true | Stadt der Adresse des Patienten. |
State | String | true | Bundesland der Adresse des Patienten. |
County | String | false | Landkreis der Adresse des Patienten. |
FIPS County Code | String | false | FIPS-Landkreiscode des Patienten. |
Zip | String | false | Postleitzahl des Patienten. |
Lat | Numeric | false | Breitengrad der Adresse des Patienten. |
Lon | Numeric | false | Längengrad der Adresse des Patienten. |
Healthcare_Expenses | Numeric | true | Die Gesamtkosten für Gesundheitsversorgung im Laufe des Lebens des Patienten (d.h., was der Patient bezahlt hat). |
Healthcare_Coverage | Numeric | true | Die Gesamtkosten für von Zahlungsorganisationen abgedeckte Gesundheitsdienstleistungen im Laufe des Lebens des Patienten (d.h., was die Krankenversicherung bezahlt hat). |
Income | Numeric | true | Jährliches Einkommen des Patienten. |
Procedures
Column Name | Data Type | Required? | Description |
---|---|---|---|
Start | iso8601 UTC Date (yyyy-MM-dd'T'HH:mm'Z') | true | Das Datum und die Uhrzeit, zu der die Prozedur durchgeführt wurde (vor Version 3.0.0 als "Date" bezeichnet). |
Stop | iso8601 UTC Date (yyyy-MM-dd'T'HH:mm'Z') | false | Das Datum und die Uhrzeit, zu der die Prozedur abgeschlossen wurde, falls zutreffend. |
🗝️ Patient | UUID | true | Fremdschlüssel zum Patienten. |
🗝️ Encounter | UUID | true | Fremdschlüssel zum Behandlungsfall, in dem die Prozedur durchgeführt wurde. |
Code | String | true | Prozedurcode aus SNOMED-CT. |
Description | String | true | Beschreibung der Prozedur. |
Base_Cost | Numeric | true | Der Einzelposten-Kosten der Prozedur. |
ReasonCode | String | false | Diagnosecode aus SNOMED-CT, der angibt, warum diese Prozedur durchgeführt wurde, falls zutreffend. |
ReasonDescription | String | false | Beschreibung des Grundcodes, falls zutreffend. |