Herramientas Utilizadas - Chavic12/ProyectoData GitHub Wiki

Herramientas Utilizadas

Durante el proceso de extracción de datos, se emplearon diversas herramientas y un enfoque específico para asegurar la obtención precisa y estructurada de la información.

Exploración con Beautiful Soup

Inicialmente, se aprovechó la potencia de la biblioteca Python Beautiful Soup para explorar la estructura HTML de las páginas del sitio web de la UTPL.

Beautiful Soup

Desarrollo de Arañas Scrapy Personalizadas

Una vez se comprendió la estructura HTML de las páginas, se procedió a crear arañas Scrapy personalizadas.

Scrapy

Guardado de Datos en un Archivo CSV

Una vez que los datos fueron extraídos y procesados, se almacenaron en un archivo CSV.

CSV

Python: La Pieza Angular

El lenguaje de programación Python desempeñó un papel fundamental en todo el proceso.

Python