Systemumgebung - Fuenfgeld/DMA2024TeamB GitHub Wiki
ALlgemeines
Die einzelnen Schritte dieses Projektes wurden mit verschiedener Software und in der Programmiersprache Python sowie mit SQL Commands durchgeführt.
Die gemeinsame Arbeitsumgebung für die Entwicklung und Versionierung der Codes erfolgte über das GitHub-System mithilfe von Branches und push und pull Requests via GitHub Desktop Client.
Als Entwicklungsumgebung diente Google Colaboratory, eine Google Cloud Lösung. Im Rahmen der Google Cloud Lösungen werden sämtliche Serverstrukturen inklusive Hardware, sowie Back-up Lösungen zur Verfügung gestellt.
Im Folgenden finden Sie eine differenzierte Auflistung und Beschreibung.
Verwaltung und Verarbeitung der Rohdaten
Die Rohdaten für das Projekt wurden im öffentlichen GitHub Repository dieser Projektgruppe, DMA2024TeamB im Ordner Daten/Quelldaten, sowie in einer geteilten Google Drive Ablage gespeichert und sind über GitHub frei zugänglich. Weshalb es unbedenklich ist diese Daten öffentlich zu teilen, können der Datenschutzfolgeabschätzung entnommen werden.
Die Rohdaten werden im Skript "teamb_import_csv_into_sql.ipynb" weiter verabeitet. Als Datenbankmanagementsystem wurde sqlite in der Version 3.45.1 verwendet.
Pakete und unterstützende Software
Zum Zeitpunkt des Projekts wurde die Programmiersprache Python in der Version 3.10.12 verwendet. Die genutzten Python-Pakete und die Python-Version sind in der nachfolgenden Tabelle gelistet:
Paket | Version | Verwendung |
---|---|---|
sqlite3 | 3.45.1 | Datenbankinteraktion (z.B. Anbindung, Änderung, Operationen) |
pandas | 1.5.3 | Datenanalyse, Data Wrangling, Einlesen von csv-Dateien |
google.colab | na | Zum Mounten von Google-Drive-Ordnern und Verzeichnissen |
matplotlib | 3.7.1 | Graphische Darstellung von Ergebnissen |
numpy | 1.23.5 | Datenverarbeitung außerhalb SQLite |
seaborn | 0.12.2 | Graphische Darstellung von Ergebnissen |