Dataset - bernabe-ortega-tenezaca/HIA GitHub Wiki

3. Descripción del Dataset

Fuentes de Datos:

  • Archivo SQL (renewable_energy_dump.sql): Contiene datos históricos sobre energía renovable.
  • Archivo CSV (renewable_energy_part2.csv): Contiene datos complementarios sobre energía renovable.

Ambos archivos obtenidos de https://github.com/bernabe-ortega-tenezaca/databases.

Combinación: Los datos de ambas fuentes se combinaron en un DataFrame único (df_combined).

Estructura: El dataset combinado final (df_combined) contiene 2500 filas y 54 columnas.

Columnas Relevantes (ejemplos):

  • country, year, energy_type
  • production_(gwh) (variable objetivo para el modelo)
  • installed_capacity_(mw), investments_(usd)
  • population, gdp
  • Indicadores económicos, sociales, ambientales y políticos.

Dataset para el Modelo (df_brasil_solar): Para el modelo predictivo, se filtró df_combined para obtener únicamente los registros correspondientes a country == 'Brazil' y energy_type == 'Solar'.