Forschungsergebnisse - Fuenfgeld/DMA2022DataProjectB GitHub Wiki

Hintergrund

In Rahmen der Mastervorlesung Datenmanagement und Archivierung im Umfeld der Medzin gehen wir der Fragen nach, ob Patienten, die an Brustkrebs erkrankt sind und vergleichbare Krankheitszustände vorweisen, auch die gleiche Behandlung bzw. Medikation erhalten?

Forschungsergebnisse

Die Daten, die wir vom Krebszentrum erhalten haben, wurden gemäß dem ETL-Prozess bearbeitet und das entstandene Datenmodell in einer Datenbank abgelegt. Die Daten des Datensatzes wurden zunächst einer deskriptive Analysen unterzogen. Diese ist im Notebook Analysis.ipynb zu finden.

Die untenstehende Grafik zeigt die verschiedene Erkrankungen, mit der entsprechenden Patientenanzahl. In unseren Daten haben wir acht verschiedenen Krankheiten/Zuständen: Atrial Fibrillation, Cardiac Arrest, Coronary Heart Disease, History of cardiac arrest (situation), History of myocardial infarction (situation), Malignant neoplasm of breast (disorder), Myocardial Infarction und Stroke.

image

Abbildung 1: Anzahl der Patienten, gruppiert nach ihrer Erkrankung/ihrem Zustand


Für unsere Studie ist es wichtig zu wissen, wie die Patienten mit verschiedenen Erkrankungen behandelt werden. Die nächsten zwei Abbildungen zeigen, dass Patienten mit unterschiedlichen Krankheiten auch unterschiedlichen Verfahren unterzogen wurden, was aus medizinischer Sicht logisch ist. Im Notebook Analysis.ipynb sind weitere Grafiken über die Verfahren, Beobachtung und die Gabe von Medikamenten bei verschiedenen Krankheiten dargestellt.

image

Abbildung 2: Durchgeführte Verfahren bei Brustkrebs (Malignant neoplasm of breast)

image

Abbildung 3: Durchgeführte Verfahren bei koronaren Herzkrankheiten (Coronary Heart Disease)


Nun betrachten wir, an Brustkrebs erkrankte Patienten etwas näher. Uns interessiert in welchem Zusammenhang die Behandlungen der Patienten zueinander stehen.

image

Abbildung 4: Balkendiagramm über die Medikamentengabe an Brustkrebspatienten


Hypothese

Forschungsfrage: Erhalten, an Brustkrebs erkrankte Patienten mit vergleichbarem Krankheitszustand, die gleiche Behandlung bzw. Medikation?

Als Pharmaunternehmen interessiert uns vor Allem die Analyse der Medikation der unterschiedlichen Patienten. Wir haben die Brustkrebspatienten (Malignant neoplasm of breast) ausgewählt und die Ähnlichkeit der Behandlung mit Medikamenten analysiert. Zu diesem Zweck haben wir die Patienten nach verschiedenen Kriterien über die Medikamentengabe gruppiert. Hierfür haben wir das k-means-Verfahren genutzt und die sog. Methode zur Berechnung der Kosten angewandt. Das k-means-Verfahren ist ein unüberwachtes Lernverfahren, welches zusammenhängende Gruppen (Cluster genannt) zusammenfügt und sie von anderen zusammenhängende Gruppen trennt. Wir haben die Kosten für eine Reihe von K-Werten berechnet. Der Parameter K entspricht der Anzahl an Gruppen (= Cluster). Die entstehenden Kosten entsprechen der Summe aller Unterschiede zwischen den Clustern. Abbildung 5 zeigt, dass die optimale Anzahl an Clustern 3 ist.

Abbildung 5: Kosten in Abhängigkeit von der Clusteranzahl

Mit dem k-means clustering teilen wir die Patienten in 3 Cluster auf. Nach der Analyse der Medikamentengabe mittels k-means-Clustering, wird ersichtlich, wie in Abbildung 6 dargestellt, dass lediglich zwei Cluster mehrere Patienten beinhalten, der dritte Cluster enthält nur einen Patienten der einen Ausreißer darstellt. Daraus lässt sich ableiten, dass die Patienten in zwei Gruppen aufgeteilt werden konnten, die jeweils ähnliche Medikationen erhalten. Dies deutet auf eine Korrelation zwischen den Behandlungen hin.

Abbildung 6: Darstellung der Clustern hinsichtlich der Medikamentengabe

Somit lässt sich zusammenfassend sagen, dass die Forschungsfrage positiv beantwortet werden kann. Nach Analyse der Medikamentengabe, kann attestiert werden, dass Pateienten mit gleichem oder vergleichbarem Krankheitszustand die gleiche Medikation erhielten. Diese gilt zumindest für Patienten mit Brustkrebserkrankungen.