rollout plan - smart-village-solutions/sva-studio GitHub Wiki
Dieser Plan beschreibt die schrittweise Einführung der neuen Branching-Strategie und Preview-Governance für das SVA Studio Projekt. Ziel ist eine risikoarme Umstellung, die die Entwicklungsgeschwindigkeit erhöht, ohne die Stabilität des Hauptzweigs (main) zu gefährden.
Die Governance ist bewusst fuer kleine Teams und wachsende Maintainer-Strukturen ausgelegt. Rollen in diesem Dokument sind funktionsbasiert definiert und koennen in fruehen Projektphasen von derselben Verantwortungsgruppe wahrgenommen werden. Verschaerfte Gates und organisatorische Trennung werden risikobasiert und nach Reifegrad aktiviert.
| Phase | Fokus | Dauer (geschätzt) | Status |
|---|---|---|---|
| 1. Pilot | Validierung mit Kern-Verantwortungsgruppe | 14 Tage | Ausstehend |
| 2. Transition | Onboarding aller aktiven Mitwirkenden | 30 Tage | Ausstehend |
| 3. Enforcement | Verbindliche Durchsetzung (Gates) | Kontinuierlich | Ausstehend |
| 4. Standard | Operative Exzellenz & Optimierung | Kontinuierlich | Ausstehend |
In dieser Phase testet eine kleine Kern-Verantwortungsgruppe die neuen Prozesse unter realen Bedingungen.
- Verantwortlich: Plattform-/Maintainer-Verantwortung
-
Eintrittskriterien:
- Dokumente T1 bis T10 sind finalisiert und abgenommen.
- Preview-Infrastruktur ist bereitgestellt (gemäß T6/T7).
- Monitoring-Dashboards für Kosten und Kapazität sind aktiv (gemäß T8).
-
Exit-Kriterien:
- Mindestens 10 PRs wurden erfolgreich über die Merge-Queue verarbeitet.
- Keine kritischen Fehler in den Preview-Lifecycle-Automatisierungen.
-
KPIs:
- PR Cycle Time: Durchschnittlich < 48 Stunden.
- Queue Eject Rate: < 10 % (PRs, die die Queue wegen Testfehlern verlassen).
-
Rollback-Trigger:
-
broken-mainVorfälle > 3 innerhalb von 7 Tagen. - Kostenüberschreitung der Preview-Budgets um > 50 % in der ersten Woche.
-
Ausweitung auf alle aktiven Mitwirkenden. Fokus liegt auf Schulung, Feedback-Integration und robuster Alltagsanwendung.
- Verantwortlich: Maintainer-Gruppe
-
Eintrittskriterien:
- Erfolgreicher Abschluss der Pilotphase.
- Durchführung eines Onboarding-Formats für alle aktiven Mitwirkenden.
-
CODEOWNERS(T5) sind aktiv hinterlegt.
-
Exit-Kriterien:
- 100 % der aktiven PRs nutzen die neue Branch-Taxonomie (T2).
- Feedback-Loop etabliert (wöchentliches Sync-Meeting).
-
KPIs:
- Preview-Adoption: 100 % der PRs verfügen über eine aktive Preview-Umgebung.
- Security-Compliance: 0 PII-Leaks oder Secret-Exposures in Previews (T9).
-
Rollback-Trigger:
- Queue Eject Rate > 20 % über einen Zeitraum von 3 aufeinanderfolgenden Tagen.
- Systemweite Ablehnung durch die Entwickler aufgrund von Performance-Einbußen.
Die Regeln werden technisch über Branch-Protection-Regeln und automatisierte Hooks erzwungen. Vollständige Scharfschaltung erfolgt erst, wenn die Pilot- und Transition-Phasen ohne strukturelle Blocker durchlaufen wurden.
- Verantwortlich: GitHub-Administrationsrolle / Maintainer-Verantwortung
-
Eintrittskriterien:
- Stabiler Betrieb in der Transition-Phase (mind. 14 Tage ohne Rollback-Trigger).
- Dokumentation in
DEVELOPMENT_RULES.mdaktualisiert.
-
Exit-Kriterien:
- Branch-Protection ist fuer
mainscharf geschaltet; zusaetzliche Zielbranches nur falls organisatorisch und technisch weiter benoetigt. - Manuelle Bypasses sind auf P0-Notfälle begrenzt (T10).
- Branch-Protection ist fuer
-
KPIs:
- CI Green Rate: > 95 % (Erfolgsquote der Pipeline-Checks).
- Unused Previews: < 5 % (Effektives Cleanup gemäß T7).
-
Rollback-Trigger:
- Blockade des Release-Zyklus durch fehlerhafte Governance-Automatisierung für > 4 Stunden.
- Kritische Sicherheitslücke, die direkt auf die Preview-Isolierung zurückzuführen ist.
Ziel ist die kontinuierliche Verbesserung der Prozesse und Werkzeuge.
- Verantwortlich: Alle Teams (Community-Modell)
-
KPIs:
-
MTTR (Mean Time To Recovery): < 30 Minuten bei
broken-main. - Kosten-Effizienz: Stetige Reduktion der Preview-Kosten pro PR durch optimiertes Sizing.
-
MTTR (Mean Time To Recovery): < 30 Minuten bei
Sollte eine Phase aufgrund der definierten Rollback-Trigger abgebrochen werden müssen, tritt folgender Plan in Kraft:
- Deaktivierung der Merge-Queue: Rückkehr zum klassischen "Merge nach Review"-Modell.
- Lockerung der Branch-Naming-Hooks: Umstellung der Hooks auf Warnungen statt harter Ablehnung.
- Preview-Pause: Automatisches Erstellen von Previews wird deaktiviert; nur manuelles Triggern ist erlaubt.
- Kommunikation: Sofortige Benachrichtigung aller Teams über den Rollback-Status via Slack/GitHub-Discussions.
- Re-Entry: Ein erneuter Versuch des Rollouts erfolgt erst nach Behebung der Ursache und erneuter Freigabe durch das Platform-Team.
-
Training: Vor Phase 2 müssen alle Beteiligten die neuen
Stacked PRRegeln (T3) undSecurity Guidelines(T9) verstanden haben. - Monitoring: Real-time Monitoring der GitHub Actions Kontingente und Preview-Ressourcen.
- Escape Hatches: Administratoren behalten das Recht, die Policy bei kritischen Bugfixes (Hotfixes) zu umgehen, wobei jeder Bypass dokumentiert werden muss.
- Reifegradprinzip: Neue Gates werden erst von "empfohlen" auf "verbindlich" gestellt, wenn Nutzen und operative Tragfaehigkeit im laufenden Betrieb belegt sind.