2. Termin (29.04.2022) - DlieBG/tagesschau_dashboard GitHub Wiki

Bis zu diesen Termin wurde bereits erledigt:

  • Tagesschau-Crawler erstellt
    • Abrufen via tagesschau.de/api/v2
    • Speichern der Einträge in MongoDB
    • Update der Status:
      • IN - der Artikel ist neu dazugekommen
      • STAY IN - der Artikel ist unverändert im Feed geblieben
      • UPDATE - der Artikel wurde aktualisiert
      • OUT - der Artikel wurde entfernt
      • STAY OUT - der Artikel wurde nicht wieder hinzugefügt
  • docker-compose für MongoDB, PostgresDB und PGAdmin
  • Crawling gestartet: Aktuell > 4000 Einträge vorhanden

Heute:

  • Suche nach weiteren APIs, um ebenfalls Daten von private Nachrichtenkanälen abrufen zu können
    • NEWS-API: NEWS-API Kanäle
  • Crawler für NEWS-API geschrieben und gestartet