Tratado de Datos 💻 - David-informatica/Pruebas GitHub Wiki
Descripción de los datos
Análisis exploratorio de los datos (EDA)
Para realizar el análisis de los datos, se han considerado los siguientes campos clave:
-
Información técnica del vehículo🚗
- Edad promedio de los vehículos involucrados en los accidentes.
- Tipo de combustible más común.
- Presencia de carga articulada en los vehículos.
-
Información de la carretera🗺
- Estado de las carreteras en el Reino Unido.
- Límites de velocidad por tipo de carretera.
- Volumen de tráfico promedio anual.
- Presencia de obstáculos que podrían contribuir a los accidentes.
-
Información del conductor🚦
- Rango de edad de los conductores más involucrados en accidentes.
-
Nivel económico y contaminación🌫
- Demanda de vehículos y su relación con el número de accidentes.
- Infraestructuras de tráfico y su actualización.
- Niveles de CO2 en las áreas de estudio.
Análisis detallado de los datos
Los conjuntos de datos empleados incluyen:
- Muertes por accidentes de tráfico: Proporciona tasas de mortalidad globales (2000-2019).
- PIB per cápita: Indicador económico de países entre 1980 y 2029.
- Densidad de tráfico: Datos del flujo promedio diario anual en carreteras del Reino Unido.
- Emisiones de CO2: Registros de emisiones anuales en kilotoneladas por localidad.
- Víctimas y vehículos involucrados en accidentes: Información detallada sobre las víctimas y los vehículos.
- Colisiones: Detalles sobre condiciones de las carreteras, meteorología, y más.
Enriquecimiento de los datos
Para mejorar el análisis, se han incorporado datasets adicionales relacionados con las especificaciones de los vehículos, incluyendo:
- Fabricante y modelo: Identificación específica del vehículo.
- Tipo de transmisión: Manual, automática, etc.
- Tamaño del motor y tipo de combustible.
- Sistema de propulsión: Incluye potencia y emisiones de CO2 por kilómetro.
Estos datos complementan los conjuntos principales y permiten evaluar de manera más precisa las hipótesis planteadas.
Anexo
Diccionario de datos principal
Los atributos principales usados en los análisis son:
- Accident_index: Identificador único del accidente.
- Accident_year: Año en que ocurrió el accidente.
- Vehicle_reference: Referencia del vehículo involucrado.
Dataset de víctimas
- Casualty_class: Clasificación de la víctima (conductor, pasajero, peatón).
- Age_of_casualty: Edad de la víctima.
- Casualty_severity: Severidad de las lesiones.
Dataset de vehículos
- Vehicle_type: Tipo de vehículo.
- Engine_capacity_cc: Capacidad del motor en centímetros cúbicos.
- Age_of_vehicle: Edad del vehículo.
Dataset de colisiones
- Location: Coordenadas del lugar del accidente.
- Accident_severity: Nivel de severidad del accidente.
- Weather_conditions: Condiciones meteorológicas en el momento del accidente.
Estos diccionarios ofrecen una guía clara para interpretar los datos utilizados en el proyecto.