Datenvisualisierungen - od-ms/resources GitHub Wiki

Online-Kurs "Datenvisualisiserung Tutorial" vom ODIS Berlin: https://odis-berlin.de/module/05-daten-visualisieren/ - https://www.youtube.com/embed/4bQ2DniKfHU

Open-Source-Software zum Auswerten/Visualisieren von Daten

Die folgende Auswertung berücksichtigt die Anforderungen, die sich für die Visualisierung von Open-Data-Datensätzen des DKAN-Datenportals ergeben.

Es gibt einige Features, die solche Systeme haben können, die für die Betrachtung irrelevant sind:

  • Anbindung an Unternehmens-Benutzermanagement (LDAP, ..)
  • Auswertungen erstellen mit "LOW-Code" (keine SQL-Eingabe notwendig)

Unsere "Must-have"-Anforderungen:

  • Die Möglichkeit zur Einbindung externer Datenquellen (z.B. CSV-Dateien per https)
  • Öffentlich zugreifbare Dashboards erstellen können, die ohne Benutzeranmeldung abrufbar sind

Redash

Apache Superset

  • ⭐⭐ Visualisierungen: SEHR Umfangreich -- aber auch sehr komplex zu bedienen
  • Installation: Einfach mit Docker Compose
  • Datenquellen: 🥵 Nur Datenbanken, keine CSV oder JSON Dateien per HTTP. Man benötigt also zusätzlich ein ELT Tool wie z.B. meltano.
  • Dashboards: Öffentlichen Dashboards scheinen möglich, s.u. (..aber Dokumentation nur mittelgut)
  • Beispiel, wie andere das nutzen: https://plattform.wattbewerb.de/ranking (auf eine Stadt klicken)

Python + Jupyter Notebooks

R + Shiny

  • Die Programmiersprache R ist sehr mächtig und benötigt tendenziell etwas weniger Code als Python, man kann fast von Low-Code sprechen.
  • Features:
    • Reports generieren funktioniert relativ gut mit R im Zusammenspiel mit LaTex
    • Zusammen mit der Bibliothek "Shiny" kann man gute Dashboards erstellen
    • RStudio Server ist eine gute Lösung um direkt auf dem Server zu programmieren

Weitere Ideen / OSS Projekte

Kibana, Grafana => vmtl. zu technisch & speziell?
Limbas Open Source
Lightdash
Chartbrew
Metabase
EDA - Web application for data analysis and visualization. (https://github.com/jortilles/EDA

Mehr Python:

    Streamlit - Scheint ähnlich wie R/Shiny zu sein, sehr gut geeignet für rapid Prototyping, aber weniger für produktive Anwendungen
    Plotly Dash - Gute Lösung für Dashboards in Python? Lese mehr hier: https://databasecamp.de/python/streamlit

Ebenfalls berücksichtigenswert:

CKAN bekommt bald ein Visualisierungsmodul mit Plotly
https://www.piveau.de/
modul-f low code 

Open Source Datenbanktools

Spreadsheets / No Code / Visualizations