Themen für das nächste Arbeitstreffen - bausteine-der-datenanalyse/bcd-dokumentation GitHub Wiki

Reihenfolge für das Protokoll: MP, FB, MF

Treffen am 24.07.2024 (Protokoll: MP)

  1. Aktuelles

Treffen am 26.06.2024 (Protokoll: MF)

  1. Aktuelles
  • NumPy Baustein ist gut angekommen.
  • Marc stellt Fragebogen rein, damit Maik da mal reinschauen kann
  • Maik kontaktiert Umfragen-Beauftragte
  1. Vorgehensweise bei zu großen Rohdaten für Github?
  • Florian hat große Datensätze (>300 Mb)
  • MP: Option geteilter Sciebo-Ordner https://hochschulcloud.nrw/de/hilfe/webinterface/teilen-link.html
    • Nachteil: man braucht einen Sciebo-Zugang
    • Marc schlägt öffentliche Links vor
  • Alternative Datensatztypen? Es gibt ein R Datenformat. Maik schlägt vor, dass wir direkt auch auf den Ursprung verlinken.
  • Datensätze nur das nötigste Speichern um Daten klein zu halten.
  • MP: Datei packen?!
  1. Lizenzdatei (MF)
  • Lizensdatei in jedes Repository packen (siehe NumPy-Baustein). Regel erstellen, das jeder Baustein automatisch mit licence Datei erstellt wird.
  1. pd.Series.plot.bar() vs. pd.Series.plot.line()
import pandas as pd
pd.set_option("display.precision", 2) # places after decimal for floats
import matplotlib.pyplot as plt
import random as rd

# Testdaten erzeugen.
n_values = 100
data = []
for i in range(n_values):
  zahl = rd.random()
  data.append(zahl)

data = pd.Series(data)
print(data)

# plotten
plt.subplot(2, 1, 1)
data.sort_values(ascending = False)[::4].plot.bar()
plt.title(label="Ein sortiertes Balkendiagramm für jeden 4. Wert")

plt.subplot(2, 1, 2)
data.sort_values(ascending = False)[::4].plot.line()
plt.title(label="pd.Series.plot.line(): Sortierung funktioniert nicht")

plt.tight_layout()
plt.show()

pd Series plot line Fehler

Die Erklärung / Lösung: pd.Series.plot.line() stellt xy-Koordinaten dar. Werden keine x-Koordinaten übergeben, wird der Index benutzt. Der Index wird in sortierter Reihenfolge dar. Dadurch wird sort_values rückgängig gemacht. Man kann das mit reset_index(drop = True) umgehen.

(MF) Alternativ geht auch: data.sort_values(ascending = False,ignore_index=True)[::4].plot.line()

  1. Marc Stellt Profiles vor und zeigt, dass man mehrere Bücher mit unterschiedlichem Inhalt rendern kann.

Treffen am 12.06.2024 (Protokoll: MP)

  1. Aktuelles
  • Marc hat den NumPy-Baustein hochgeladen.
  1. Farbpalette standardisieren (Python und R, hauptsache barrierefrei)?
  • Florian verwendet aktuell: https://ggplot2.tidyverse.org/reference/scale_viridis.html
  • Diese ist seit Version 2.0 die default colormap in matplotlib.
  • Die Farbpalette soll Farbenblindheit entsprechen, das entspricht aber nicht dem Empfinden von MP
  • Probieren, ob einfarbige Paletten wie "Blues" besser funktionieren. Diese können bei Bedarf um eine weitere Palette wie "Reds" erweitert werden.
  1. Querverweise im Text - Gestaltungsoptionen (Hyperlink?).
  • Hyperlinks klappen nur, wenn das Zielrepo Teil des Buches ist.
  • Querverweise in _voraussetzungen.md sammeln --> ggf. Skript erstellen, dass die Zielkapitel mit in ein Projekt holt bzw. einen Hinweis darauf ausgibt.
  1. Zweisprachigkeit Python und R?!
  • Erst mal alles in der jeweiligen Sprache bauen und dann muss man sich im Dreierteam absprechen, wie die Übersetzung umgesetzt wird.
  • Für die englischsprachige Übersetzung muss vermutlich auch der Code überarbeitet werden (Variablenbezeichnungen)

Treffen am 29.05.2024 (Protokoll: FB) Teilnehmer: FB, MF, MP

  1. Aktuelles
  2. Verständnisfrage von FB zum Kanban-Board bei fertigen Bausteine, die noch Referenzen zu noch nicht erstellten Inhalten benötigen.
  • MF und MP sagen Baustein als fertig deklarieren und dann neues To-Do mit Referenzen erstellen
  1. Datensätze einlesen in R und Python als Bausteine getrennt oder gemeinsam?
  • vermutlich zuerst getrennt und dann später kombinieren
  1. Numpy-Baustein von MF kurz vor Fertigstellung und wird als eigenes repository bald hochgeladen.

Treffen am 15.05.2024 (Protokoll: MP) Teilnehmer: FB, MF, MP

  1. Aktuelles

  2. Bug, Feature oder User Error: Quarto Issues für Anfänger

Vorgehen allgemein:

  • Testen mit der aktuellen Quarto-Version, auf der Quarto-GitHub-page https://github.com/quarto-dev/quarto-cli gucken, ob schon jemand issues und discussions ein ähnliches Problem angemerkt hat (auch is:open entfernen, falls es schon ein gefixtes Problem gibt)
  • Meldung via Issues - New Issue - Bug report
  • Code um den Fehler zu reproduzieren + Umgebung angeben + Quarto check ausführen

Treffen am 24.04.2024 (Protokoll: MF) Teilnehmer: FB, MF, MP

  1. Aktuelles
  • Maik teilt mit, dass studentische Hilfskraft Pilotbaustein durchgearbeitet hat. Anmerkung kleine Beispielaufgaben in regelmäßigen Abständen einbinden, da sonst Übungsaufgaben nur am Ende kommen -> zu lang bis Wissen abgefragt wird.
  • Marc teilt mit, dass Frontseite der Organisation nun schicker aussieht (keine Einrichteseite mehr und Titel angepasst)
  1. Styleguide
  • Marc schlägt Änderung vor für Vektrographiken. Quarto kann automatisch SVG in PDF umwandeln (Quarto). Dazu muss aber Dateiendung .svg an Datei beibehalten werden und librsvg installiert sein. Marc kümmert sich um Änderung des Styleguides.
  • Maik fügt Zitiervorschlag zu Stylguide hinzu
  • CSS-Hinweis kann aus Styleguide entfernt werden
  • yml Option: engine Knitr braucht zusätzlichen Kommentar
  • Tabsets Beispiel sollte nicht für unterschiedliche Programmiersprachen sein (Python und R wird ja getrennt gehandhabt) sondern allgemein gehalten werden.
  • Optionen für Codeblöcke sind soweit vollständig und werden aber ergänzt sollten weitere Optionen benötigt werden.
  1. GitHub Push eines neuen Repos (Pseudocode)
  • Unklar wie Bausteine in Github abgelegt werden. Maik lädt Testbaustein hoch, damit andere diesen schonmal einsehen können. Maik wird diesen Baustein aber noch aktualisieren. Gemeinsames pushen des Repositorys.
  1. Vorplanung Werkzeugbaustein BOW/DO Python
  • Marc hat mit numpy-Baustein "begonnen" und Maik setzt sich an Energiedatenanalyse-Baustein sobald Pseudocode fertig ist.

Treffen am 10.04.2024 (Protokoll: FB) Teilnehmer: FB, MF, MP

  1. Aktuelles
  2. Git für Dummies
  • MP hat git grundlegend verstanden
  1. Migration von diesem Wiki zu bausteine-der-datenanalyse/bcd-dokumentation (Marc)
  • Wiki umziehen zur Organisation. BCD-Dokumentation erstellen: Agendapunkt für Projektreffen am 11.04.
  • Dieses Repository redundant/komplett löschen?
  1. Stand der Pilotbausteine
  • MP plant nächster Woche mit einer ersten vorstellbare Version und Testung der SHK :
    • Momentane Arbeit Flussdiagramme mit mermaid
    • Aufpassen bei Syntax und Kommentaren
    • Theme von mermaid immer in quarto anpassen

Treffen am 03.04.2024 (Protokoll: MP) Teilnehmer: FB, MF, MP

  1. Aktuelles
  • FB ist mit Kapiteln 1 und 2 des Skripts von MB fertig
    • die optische Gestaltung wird noch abgestimmt
    • Der Block zu Wahrscheinlichkeitstheorie wird mglw. verschoben
  1. Styleguide
  • Umgang mit dekorativen Grafiken: Lizenzhinweis nach TULLU-Regel in Div ::: {.border}

grafik

  • Dadurch wird das Quellenverzeichnis nicht mit inhaltlich unbedeutenden Quellen gefüllt
  • MF hat den Styleguide gepusht unter BCD Styleguide --> FB übernimmt
  1. Quarto Profiles https://quarto.org/docs/projects/profiles.html
  • MF: Man kann verschiedene YAML-Dateien definieren, z. B. für ein Buch mit mehreren Kapiteln. Dann kann man sich ein Buch mit ausgewählten Kapiteln erstellen lassen. Ebenfalls ist es möglich, verschiedene Variablen zu übergeben, um z. B. nur R-Code rendern zu lassen, etwa um einen Kurs Datenanalyse mit R zu erstellen.
    • MP: Problematisch bleiben dann die Formulierung in den Texten, z. B.: „Im Folgenden finden Sie ein Beispiel für R und Python“ (auch: Querverweise auf andere Bausteine)
  1. Beschreibbares Textfeld: H5P-Element exportable text area kann nicht in tabset panel integriert werden
  • MF: HTML-Textfeld geht
<textarea id=“test” name=“test” rows="4" cols="50"></textarea>
  1. GitHub Actions, Desktop Clients und Mergen
  • In VS Code kann man sich in GitHub einloggen – da kann man alle Aktionen für GitHub auswählen
  • Mit RStudio muss man den Client benutzen.
    • Wenn eine Datei mehrfach parallel bearbeitet wird, müssen die Änderungen gemerged werden – das war nach den Erfahrungen von FB nicht so einfach
    • MF: Es hat sich bewährt, auf verschiedenen Branches zu arbeiten.
      • Main Branch: das, was die Leute später sehen und nie kaputt gehen sollte
      • 2 Development Branches für Florian und Matthias, auf denen gearbeitet wird und deren Entwicklungen regelmäßig in den Main Branch gemerged werden.
    • MF: Im GitHub-Ordner werden die Branches zusammen gespeichert. Um in einen anderen Development Branch zu schauen, muss der eigene Development Branch vorher gepusht werden.
    • MF: Bei Arbeitsbeginn sollte zunächst GitPull ausgeführt werden, um den aktuellen Stand vom Repo lokal zu holen. Vorher kann mit GitStatus geprüft werden, ob die lokale Version niedriger ist als die im Repo.

Treffen am 13.03.2024 (Protokoll: MF)

Teilnehmer: FB, MF, MP

  1. Aktuelles
  • Zoom löscht je nach Accountart die Chatnachrichten nach 7 bzw. 14 Tagen. Es wird nochmal nach permanenter Verängerung gefragt.
  1. Erster Entwurf Styleguide
  • Maik stellt aktuellen Stand des Styleguides vor. Muss von Florian und Marc gesichtet und ergänzt (z.B. Codeblöcke) werden. Marc fängt an mit Sichtung und leitet Dokument dann an Florian weiter.
  1. Callout-Boxen
  • Marc stellt kurz vor das callout-Boxen nur mit Hilfe von Filtern zu implementieren sind und Forderungen nach einer vereinfachten Lösungen stetig in github eintrudeln.
  1. Besprechungstermin für pdd Dokument noch offen.

Treffen am 06.03.2024 (Protokoll: FB)

Teilnehmer: FB, MF, MP

  1. Aktuelles
  2. Soll das PDD in das Wiki überführt werden?
  3. Handreichungen zu einzelnen Bausteinen erstellen / Vollständiges PDF als Handreichung für Lernende deklarieren?
  4. Ersteindruck: Typst keine sinnvolle Alternative zur LaTeX PDF-Erstellung
  5. Erstellung von interaktiven Aufgaben :
  6. Serifenlose Schriften verwenden für Barrierefreiheit

Treffen am 21.02.2024 (Protokoll: MP)

Teilnehmer: FB, MF, MP

  1. Aktuelles
  2. Zoom-Chat-Gruppe einrichten (erledigt)
  • Chat-Gruppe für die kleine Frage zwischendurch - Einrichtung durch Marc Fehr. Unverschlüsselte Kommunikation funktioniert, sobald man sich wechselseitig als Kontakt hinzugefügt hat.
  1. Minesweeper in JavaScript mit Quarto
  • MP: Idee, im Baustein Pseudocode einen Lösungsalgorithmus für das Spiel Minesweeper entwickeln zu lassen. Problem: Es gibt mehrere Varianten des Spiels.
  1. Verfahren für Formatvorlage / Styleguide
  • MP erarbeitet eine erste Vorlage, die dann in der Gruppe abgestimmt / weiterbearbeitet und dann im Projekttreffen vorgestellt wird
    • Bereitstellung via GitHub
⚠️ **GitHub.com Fallback** ⚠️