Probleme und Lösungen - DlieBG/tagesschau_dashboard GitHub Wiki
Was für Probleme sind aufgetreten und wie können wir diese ausdribbeln?
NEWS-API
Request-Limit
- Das Request Limit beträgt 100 Requests pro Tag
- Idee: Automatisiert neuen API_KEY generieren
- automatisches generieren schwierig
- pro IP pro Tag nur 4 erstellbar mit CAPTCHA
- Idee Ein paar erstellen und damit durchwechseln
- Ein API-Key der fortlaufend nach vorne in 15 Minuten Intervallen Nachrichten holt
- ein paar API-Keys, die einmal am Tag nach in die Vergangenheit gerichtet jeweils 100 mal 15 min Intervalle Nachrichten sammeln
- die 4 übrigen Anfragen (100 pro Tag Limit 96 für die 15 Min Intervalle) vom ersten API-Key für Fehler nutzen
- Fehler bedeutet API-Key Limit erreicht oder mehr wie 100 Ergebnisse in der Antwort
Pagesize
- Maximal 100 Einträge pro Request
- Lösung: Setzen von Zeitintervallen, um die Pagesize zu reduzieren. Dies wird in 15 Minuten Intervalle aufgeteilt
Archivdaten
- Wir können Daten maximal einen Tag aus der Vergangenheit abrufen
- Lösung: Wir starten frühzeitig mit dem Crawling, um schnell eine große Datenbasis aufzubauen