Dataset - bernabe-ortega-tenezaca/HIA GitHub Wiki
3. Descripción del Dataset
Fuentes de Datos:
- Archivo SQL (renewable_energy_dump.sql): Contiene datos históricos sobre energía renovable.
- Archivo CSV (renewable_energy_part2.csv): Contiene datos complementarios sobre energía renovable.
Ambos archivos obtenidos de https://github.com/bernabe-ortega-tenezaca/databases.
Combinación: Los datos de ambas fuentes se combinaron en un DataFrame único (df_combined
).
Estructura: El dataset combinado final (df_combined
) contiene 2500 filas y 54 columnas.
Columnas Relevantes (ejemplos):
country
,year
,energy_type
production_(gwh)
(variable objetivo para el modelo)installed_capacity_(mw)
,investments_(usd)
population
,gdp
- Indicadores económicos, sociales, ambientales y políticos.
Dataset para el Modelo (df_brasil_solar
): Para el modelo predictivo, se filtró df_combined
para obtener únicamente los registros correspondientes a country == 'Brazil'
y energy_type == 'Solar'
.