Conclusiones - bernabe-ortega-tenezaca/HIA GitHub Wiki

5. Conclusiones

El proyecto logró establecer un flujo de trabajo completo, desde la adquisición y análisis de datos de energía renovable hasta el desarrollo y despliegue (local) de un modelo de Machine Learning a través de una aplicación web.

Se realizó un análisis exploratorio inicial que reveló tendencias en tipos de energía, inversiones y producción por país sobre una parte de los datos.

Se desarrolló un modelo de GradientBoostingRegressor para predecir la producción de energía solar en Brasil. Sin embargo, la evaluación del modelo arrojó un R² negativo -0.6110385117180295, lo que indica un rendimiento deficiente del modelo predictivo en su estado actual.

La aplicación Flask desarrollada permite una interacción práctica con el modelo, demostrando cómo se pueden consumir los artefactos de Machine Learning.

Posibles Razones del Bajo Rendimiento del Modelo y Pasos Futuros:

  • Cantidad de datos para el subconjunto: El DataFrame df_brasil_solar podría ser demasiado pequeño para entrenar un modelo robusto.
  • Selección de Características / Ingeniería de Características: Las 10 componentes principales podrían no capturar la información más relevante, o se podrían necesitar características adicionales/transformadas. Considerar el impacto de cada una de las 53 características originales.
  • Hiperparámetros del Modelo: El GradientBoostingRegressor fue usado con parámetros por defecto. Un ajuste de hiperparámetros (ej. usando GridSearchCV o RandomizedSearchCV) podría mejorar el rendimiento.
  • Complejidad del Problema: La producción de energía puede depender de factores no presentes o no bien representados en el dataset.
  • Explorar otros modelos: Probar con diferentes algoritmos de regresión (ej. Random Forest, SVM, Redes Neuronales).
  • Validación Cruzada: Implementar una validación cruzada más robusta durante el entrenamiento para obtener una estimación más fiable del rendimiento del modelo.

A pesar del resultado del modelo, el proyecto sienta las bases para futuras mejoras y exploraciones más profundas. La aplicación web es un componente valioso para la demostración y prueba de iteraciones futuras del modelo.