Systemumgebung - Fuenfgeld/DMA2024TeamB GitHub Wiki

ALlgemeines

Die einzelnen Schritte dieses Projektes wurden mit verschiedener Software und in der Programmiersprache Python sowie mit SQL Commands durchgeführt.

Die gemeinsame Arbeitsumgebung für die Entwicklung und Versionierung der Codes erfolgte über das GitHub-System mithilfe von Branches und push und pull Requests via GitHub Desktop Client.

Als Entwicklungsumgebung diente Google Colaboratory, eine Google Cloud Lösung. Im Rahmen der Google Cloud Lösungen werden sämtliche Serverstrukturen inklusive Hardware, sowie Back-up Lösungen zur Verfügung gestellt.

Im Folgenden finden Sie eine differenzierte Auflistung und Beschreibung.

Verwaltung und Verarbeitung der Rohdaten

Die Rohdaten für das Projekt wurden im öffentlichen GitHub Repository dieser Projektgruppe, DMA2024TeamB im Ordner Daten/Quelldaten, sowie in einer geteilten Google Drive Ablage gespeichert und sind über GitHub frei zugänglich. Weshalb es unbedenklich ist diese Daten öffentlich zu teilen, können der Datenschutzfolgeabschätzung entnommen werden.

Die Rohdaten werden im Skript "teamb_import_csv_into_sql.ipynb" weiter verabeitet. Als Datenbankmanagementsystem wurde sqlite in der Version 3.45.1 verwendet.

Pakete und unterstützende Software

Zum Zeitpunkt des Projekts wurde die Programmiersprache Python in der Version 3.10.12 verwendet. Die genutzten Python-Pakete und die Python-Version sind in der nachfolgenden Tabelle gelistet:

Paket Version Verwendung
sqlite3 3.45.1 Datenbankinteraktion (z.B. Anbindung, Änderung, Operationen)
pandas 1.5.3 Datenanalyse, Data Wrangling, Einlesen von csv-Dateien
google.colab na Zum Mounten von Google-Drive-Ordnern und Verzeichnissen
matplotlib 3.7.1 Graphische Darstellung von Ergebnissen
numpy 1.23.5 Datenverarbeitung außerhalb SQLite
seaborn 0.12.2 Graphische Darstellung von Ergebnissen