Sprint 3 - EthicsAI-UCM/ISA-HOME GitHub Wiki

Sprint 3

Documentación asociada al Sprint 3, desarrollado entre el 23/10/2025 al 18/11/2025. Se incluyen los informes de Sprint Planning, Sprint Review y Sprint Retrospective.

Sprint Planning

Para el sprint 3 hemos seleccionado las siguientes tareas de usuario:

Tarea 1

Descripción: Como equipo, queremos redactar el Sprint Review y el Sprint Retrospective del sprint 2, dejando constancia de los avances y conclusiones obtenidas.
Estimación: 0.5 horas
Criterios de aceptación: El documento debe incluir los apartados de aciertos, errores y mejoras, redactados con claridad y con formato adecuado para la wiki.
Motivo de selección: Es fundamental documentar los resultados del sprint anterior para mantener la trazabilidad del proyecto y facilitar la planificación del siguiente.

Tarea 2

Descripción: Como equipo, queremos redactar y estructurar la wiki del proyecto con la información actualizada del sprint.
Estimación: 0.25 horas
Criterios de aceptación: La wiki debe incluir las secciones de organización del equipo, tareas realizadas y próximos objetivos.
Motivo de selección: Mantener una documentación clara y accesible permite al equipo y a terceros entender el estado del proyecto.

Tarea 3

Descripción: Como equipo, queremos mejorar el archivo README del repositorio para que refleje con claridad los objetivos, instalación y uso del proyecto ISA - Home.
Estimación: 1 hora
Criterios de aceptación: El README debe incluir una descripción concisa del proyecto, pasos de instalación, uso básico, y enlaces a documentación relevante.
Motivo de selección: Un README claro y completo mejora la comprensión del proyecto por parte de colaboradores y evaluadores.

Tarea 4

Descripción: Como equipo, queremos mejorar el diseño de nuestro producto añadiendo un nuevo modelo de producto con más avances tecnológicos.
Estimación: 5 horas
Criterios de aceptación: Producto capaz de subir escaleras y manejarse sin problema.
Motivo de selección: El producto debe poder subir escaleras para que sea un producto que pueda adaptarse a distintos hogares.

Tarea 5

Descripción: Como equipo, queremos estimar el hardware necesario para entrenar nuestro sistema si comenzáramos hoy, calculando FLOPs, horas de GPU, energía consumida, coste económico en la nube y huella de carbono asociada.
Estimación: 6 horas
Criterios de aceptación: El documento debe incluir cálculos detallados, supuestos usados, referencias a precios de proveedores cloud y herramientas de huella de carbono, además de una tabla resumen.
Motivo de selección: Esta estimación es clave para dimensionar la viabilidad técnica y económica del proyecto, así como su impacto ambiental.

Tarea 6

Descripción: Como equipo, queremos identificar datasets adecuados para entrenar el sistema, incluyendo enlaces, licencias y un análisis de qué datos adicionales hacen falta y cómo se obtendrán.
Estimación: 4 horas
Criterios de aceptación: Listado mínimo de 6–10 datasets con enlaces verificados, tipo de licencia, calidad, tamaño y justificación de uso; además de una sección describiendo los datos faltantes y su estrategia de adquisición.
Motivo de selección: El entrenamiento del modelo depende de datos adecuados, legales y diversos; documentarlo asegura transparencia y planificación.

Tarea 7

Descripción: Como equipo, queremos definir en detalle el plan de evaluación del modelo, especificando métricas, benchmarks, criterios de éxito y umbrales de “go/no-go” para el paso a producción.
Estimación: 5 horas
Criterios de aceptación: Documento que incluya métricas cuantitativas, pruebas de estrés, referencias a benchmarks existentes y definición explícita de los objetivos mínimos aceptables.
Motivo de selección: Es necesario evaluar rigurosamente el rendimiento del modelo para asegurar su calidad y seguridad antes de su despliegue.

Tarea 8

Descripción: Como equipo, queremos profundizar en los desafíos éticos identificando riesgos sociales, abusos potenciales y colectivos afectados si el sistema llegara a utilizarse a gran escala.
Estimación: 3 horas
Criterios de aceptación: Apartado con análisis de riesgos realistas (no ciencia ficción), impacto potencial sobre millones de usuarios y tabla de beneficios vs. perjuicios para distintos actores.
Motivo de selección: Este análisis permite anticipar externalidades negativas y diseñar medidas preventivas.

Tarea 9

Descripción: Como equipo, queremos definir el nivel de personalización del modelo para usuarios, evaluando riesgos como ideologías extremas, psicopatologías o pérdida de neutralidad.
Estimación: 3 horas
Criterios de aceptación: Documento que especifique qué tipo de personalización se permite, qué no, por qué, y los límites establecidos para evitar comportamientos peligrosos.
Motivo de selección: La personalización es crítica para la experiencia de usuario, pero debe ser segura y controlada.

Tarea 10

Descripción: Como equipo, queremos analizar la robustez del sistema definiendo 10 prompts de jailbreak o casos límite, explicando cómo debería reaccionar el modelo ante cada uno.
Estimación: 4 horas
Criterios de aceptación: Lista de 10 prompts reales o inspirados en ejemplos históricos con su riesgo asociado y la respuesta esperada del sistema.
Motivo de selección: La seguridad frente a jailbreaks es indispensable para evitar usos indebidos o dañinos.

Sprint Review

1. Objetivo del Sprint

El objetivo principal del Sprint 3 fue profundizar en las bases técnicas y éticas del proyecto, integrar los aprendizajes del sprint anterior y avanzar tanto en la documentación como en el diseño del producto. Este sprint también incorporó tareas avanzadas relacionadas con la estimación de hardware, la evaluación del modelo, la selección de datasets y el análisis ético. Además, se buscó mejorar la capacidad técnica del producto mediante el desarrollo de un nuevo modelo capaz de subir escaleras, resolviendo una de las limitaciones críticas identificadas anteriormente.

2. Tareas Planeadas (Sprint Backlog)

Durante el Sprint 3 se planificaron las siguientes tareas:

Tarea 1: Redactar el Sprint Review y el Sprint Retrospective del Sprint 2.
Tarea 2: Redactar y estructurar la wiki del proyecto con la información actualizada del sprint.
Tarea 3: Mejorar el archivo README del repositorio.
Tarea 4: Desarrollar un nuevo modelo de producto capaz de subir escaleras.
Tarea 5: Estimar el hardware necesario para entrenar el sistema, incluyendo cálculos de FLOPs, GPU-horas, energía, coste económico y huella de carbono.
Tarea 6: Identificar datasets adecuados para el entrenamiento, incluyendo licencias, enlaces y datos faltantes.
Tarea 7: Definir el plan detallado de evaluación del modelo, incluyendo métricas, benchmarks y criterios “go/no-go”.
Tarea 8: Analizar riesgos sociales y éticos a gran escala, identificando actores beneficiados y perjudicados.
Tarea 9: Establecer el nivel de personalización permitido para usuarios y sus límites.
Tarea 10: Diseñar 10 casos límite/jailbreak y la reacción esperada del sistema.

Todas las tareas fueron completadas con éxito. Destaca especialmente la Tarea 4, donde se consiguió desarrollar un nuevo modelo de producto capaz de subir escaleras, resolviendo una de las debilidades más señaladas del proyecto.

3. Trabajo Completado

Durante el sprint se completaron todas las tareas comprometidas dentro del Sprint Backlog.
Los principales entregables fueron:

Documentación formal del Sprint 2 (Review + Retrospective).
Wiki del proyecto actualizada con la estructura y contenido ampliado.
README del repositorio actualizado y reorganizado.
Nuevo diseño funcional del producto con capacidad de subir escaleras.
Informe completo de estimación de hardware, consumo energético y huella de carbono.
Catálogo de datasets con enlaces, licencias y análisis de carencias.
Documento de métricas, benchmarks y criterios de evaluación del modelo.
Análisis de riesgos éticos y sociales a gran escala.
Documento de límites de personalización y riesgos asociados.
Lista de 10 casos de jailbreak y comportamiento esperado ante cada uno.

4. Demostración del Incremento

El principal incremento demostrable del Sprint 3 fue:

Nuevo modelo de producto capaz de subir escaleras Se presentó un prototipo funcional y documentación técnica que permite demostrar:

Capacidad de ascenso y descenso seguro.
Estabilidad en distintos tipos de escaleras comunes en viviendas.
Mejor respuesta del sistema de movilidad.
Mayor versatilidad del producto para hogares con múltiples niveles.

Además, se presentaron las nuevas piezas documentales (wiki, diagramas, análisis ético, etc.) que mejoran la claridad global del proyecto y su preparación para fases posteriores.

5. Feedback Recibido

Durante la revisión con el Product Owner y stakeholders se destacó:

La documentación está clara, completa y bien estructurada.
Los avances técnicos en el modelo que sube escaleras representan un salto significativo en funcionalidad.
Se valoró positivamente la profundidad del análisis ético y la inclusión de una mini-deliberación democrática.
Se reconoció la necesidad de continuar refinando métricas y benchmarks a medida que el modelo avance hacia fases de prototipado.
Se sugirió consolidar una primera versión del plan de pruebas técnicas del hardware en sprints futuros.

6. Próximos Pasos

Para los próximos sprints se identificaron los siguientes pasos:

Continuar mejorando el producto en futuras iteraciones.
Ampliar y refinar la documentación según evolucione el proyecto.
Seguir profundizando en aspectos éticos y de seguridad conforme avancen los requisitos.
Ajustar las prioridades del siguiente sprint en función de las indicaciones del profesorado.

Sprint Retrospective (Sprint 3)

¿Qué salió bien en el Sprint 3?

Durante este sprint, el equipo ha logrado avanzar significativamente en la documentación y preparación del proyecto:

Documentación y Wiki: Se completó con éxito la actualización de la wiki y la mejora del README (Tareas 2 y 3), facilitando la comprensión del proyecto tanto para el equipo como para terceros.
Nuevo modelo del producto: El rediseño del producto para permitir que suba escaleras (Tarea 4) fue un gran logro, solucionando la mayor debilidad identificada en sprints anteriores.
Trabajo ético y técnico profundo: El análisis de hardware, datasets, evaluación del modelo, riesgos éticos y jailbreaks (Tareas 5–11) se completó de forma exhaustiva, aportando claridad y madurez al proyecto.
Mejor coordinación del equipo: La comunicación ha sido más fluida, permitiendo completar todas las tareas previstas en tiempo, aunque ajustado.

¿Qué no salió bien en el Sprint 3?

A pesar del progreso, se identificaron algunos puntos de mejora:

Gestión del tiempo: Aunque se completaron todas las tareas, se llegó bastante justo a la fecha de entrega, lo que generó presión en las últimas sesiones de trabajo.
Sobrecarga de tareas complejas: La gran cantidad de tareas éticas y técnicas (especialmente las de hardware, datasets y riesgos) hizo que algunos miembros del equipo sintieran exceso de carga.

¿Qué mejoras vamos a implementar en el próximo sprint?

Para el próximo sprint (Sprint 4), nos enfocaremos en:

Planificación más realista: Ajustar la cantidad de tareas para evitar acumulación al final del sprint y reducir el estrés.
Reparto equilibrado del trabajo: Mantener la buena distribución lograda este sprint, pero vigilando que nadie cargue con tareas excesivamente complejas.
Revisión temprana de entregables grandes: Empezar antes las tareas largas para evitar imprevistos a última hora.
Comunicación continua: Mantener reuniones breves entre sesiones para asegurar que todos estén alineados.

Conclusión

El Sprint 3 ha sido clave para consolidar el proyecto. El equipo ha trabajado mejor que en el sprint anterior, con un reparto de tareas más equitativo y una mejor coordinación general. Se logró completar todo el backlog planeado, aunque muy ajustados a la fecha de entrega. Para el siguiente sprint, buscaremos una planificación más equilibrada que permita mantener la calidad del trabajo sin llegar al límite del tiempo disponible.