Marco Teórico - bernabe-ortega-tenezaca/HIA GitHub Wiki
2. Marco Teórico de las Tecnologías/Librerías Usadas
Descripción de las herramientas clave y su propósito en el proyecto.
- Python: Lenguaje de programación principal.
- Pandas: Librería para la manipulación y análisis de datos tabulares (DataFrames). Usada para cargar, limpiar, combinar y transformar los datos.
- SQLite3: Módulo para trabajar con bases de datos SQLite. Usado para crear una base de datos a partir de un script SQL y extraer datos.
- Matplotlib & Seaborn: Librerías para la visualización de datos. Usadas para generar gráficos exploratorios y de evaluación del modelo.
- Scikit-learn: Librería de Machine Learning.
- StandardScaler: Para la estandarización de características numéricas.
- PCA (Principal Component Analysis): Para la reducción de dimensionalidad.
- train_test_split: Para dividir los datos en conjuntos de entrenamiento y prueba.
- GradientBoostingRegressor: Algoritmo de ensamble basado en árboles de decisión utilizado para la regresión. - mean_squared_error, r2_score: Métricas para evaluar el rendimiento del modelo de regresión.
- Joblib: Para serializar (guardar) y deserializar (cargar) objetos de Python (modelos entrenados, scalers, etc.).
- Flask: Microframework web para Python, utilizado para desarrollar la aplicación que consume el modelo de predicción.
- AdminLTE: Plantilla de panel de administración y dashboard basada en Bootstrap, utilizada para la interfaz de usuario de la aplicación Flask.
- Jupyter Notebook / Google Colab: Entorno de desarrollo interactivo utilizado para escribir y ejecutar el código de análisis y modelado.