Marco Teórico - bernabe-ortega-tenezaca/HIA GitHub Wiki

2. Marco Teórico de las Tecnologías/Librerías Usadas

Descripción de las herramientas clave y su propósito en el proyecto.

  • Python: Lenguaje de programación principal.
  • Pandas: Librería para la manipulación y análisis de datos tabulares (DataFrames). Usada para cargar, limpiar, combinar y transformar los datos.
  • SQLite3: Módulo para trabajar con bases de datos SQLite. Usado para crear una base de datos a partir de un script SQL y extraer datos.
  • Matplotlib & Seaborn: Librerías para la visualización de datos. Usadas para generar gráficos exploratorios y de evaluación del modelo.
  • Scikit-learn: Librería de Machine Learning.
    • StandardScaler: Para la estandarización de características numéricas.
    • PCA (Principal Component Analysis): Para la reducción de dimensionalidad.
    • train_test_split: Para dividir los datos en conjuntos de entrenamiento y prueba.
    • GradientBoostingRegressor: Algoritmo de ensamble basado en árboles de decisión utilizado para la regresión.   - mean_squared_error, r2_score: Métricas para evaluar el rendimiento del modelo de regresión.
  • Joblib: Para serializar (guardar) y deserializar (cargar) objetos de Python (modelos entrenados, scalers, etc.).
  • Flask: Microframework web para Python, utilizado para desarrollar la aplicación que consume el modelo de predicción.
  • AdminLTE: Plantilla de panel de administración y dashboard basada en Bootstrap, utilizada para la interfaz de usuario de la aplicación Flask.
  • Jupyter Notebook / Google Colab: Entorno de desarrollo interactivo utilizado para escribir y ejecutar el código de análisis y modelado.