Tratado de Datos 💻 - David-informatica/Pruebas GitHub Wiki

Descripción de los datos

Análisis exploratorio de los datos (EDA)

Para realizar el análisis de los datos, se han considerado los siguientes campos clave:

  • Información técnica del vehículo🚗

    • Edad promedio de los vehículos involucrados en los accidentes.
    • Tipo de combustible más común.
    • Presencia de carga articulada en los vehículos.
  • Información de la carretera🗺

    • Estado de las carreteras en el Reino Unido.
    • Límites de velocidad por tipo de carretera.
    • Volumen de tráfico promedio anual.
    • Presencia de obstáculos que podrían contribuir a los accidentes.
  • Información del conductor🚦

    • Rango de edad de los conductores más involucrados en accidentes.
  • Nivel económico y contaminación🌫

    • Demanda de vehículos y su relación con el número de accidentes.
    • Infraestructuras de tráfico y su actualización.
    • Niveles de CO2 en las áreas de estudio.

Análisis detallado de los datos

Los conjuntos de datos empleados incluyen:

  • Muertes por accidentes de tráfico: Proporciona tasas de mortalidad globales (2000-2019).
  • PIB per cápita: Indicador económico de países entre 1980 y 2029.
  • Densidad de tráfico: Datos del flujo promedio diario anual en carreteras del Reino Unido.
  • Emisiones de CO2: Registros de emisiones anuales en kilotoneladas por localidad.
  • Víctimas y vehículos involucrados en accidentes: Información detallada sobre las víctimas y los vehículos.
  • Colisiones: Detalles sobre condiciones de las carreteras, meteorología, y más.

Enriquecimiento de los datos

Para mejorar el análisis, se han incorporado datasets adicionales relacionados con las especificaciones de los vehículos, incluyendo:

  • Fabricante y modelo: Identificación específica del vehículo.
  • Tipo de transmisión: Manual, automática, etc.
  • Tamaño del motor y tipo de combustible.
  • Sistema de propulsión: Incluye potencia y emisiones de CO2 por kilómetro.

Estos datos complementan los conjuntos principales y permiten evaluar de manera más precisa las hipótesis planteadas.

Anexo

Diccionario de datos principal

Los atributos principales usados en los análisis son:

  • Accident_index: Identificador único del accidente.
  • Accident_year: Año en que ocurrió el accidente.
  • Vehicle_reference: Referencia del vehículo involucrado.

Dataset de víctimas

  • Casualty_class: Clasificación de la víctima (conductor, pasajero, peatón).
  • Age_of_casualty: Edad de la víctima.
  • Casualty_severity: Severidad de las lesiones.

Dataset de vehículos

  • Vehicle_type: Tipo de vehículo.
  • Engine_capacity_cc: Capacidad del motor en centímetros cúbicos.
  • Age_of_vehicle: Edad del vehículo.

Dataset de colisiones

  • Location: Coordenadas del lugar del accidente.
  • Accident_severity: Nivel de severidad del accidente.
  • Weather_conditions: Condiciones meteorológicas en el momento del accidente.

Estos diccionarios ofrecen una guía clara para interpretar los datos utilizados en el proyecto.

faltan las silver aqui