STATE OF THE ART ‐ COMPUTER VISION DETECTION MODELS - Tha-Alpha-Project/Dataset-Benchmark GitHub Wiki

Estado del Arte en Detección para Baloncesto con Visión por Computador

Este documento resume el estado actual (2024–2025) de la visión por computador aplicada al baloncesto, con foco en la detección de jugadores, balón, posiciones y elementos del campo, usando cámaras fijas y móviles. Se presentan modelos, datasets, frameworks, papers y comparativas clave.


1. Modelos de detección utilizados

Modelos generales adaptados

  • YOLO (v5, v7, v8, YOLOX): Alta velocidad (30–60 FPS) con precisión competitiva (~50–60% mAP). Muy utilizados en contextos deportivos.
  • CenterNet / CenterTrack: Especialmente útiles para detectar objetos centrales como el balón.
  • Faster R-CNN / Mask R-CNN: Mayor precisión (~70–80% mAP), menor velocidad (~5–10 FPS). Ideales para análisis offline.
  • DETR / Deformable DETR: Modelos basados en transformers. Alta precisión pero mucho más lentos.

Modelos específicos

  • DeepSportLab (BMVC 2021): Detección unificada de balón, jugadores y pose. Ideal para deportes de equipo.
  • TrackID3x3 (2025): YOLOX + BoT-SORT + estimación de pose. Adaptado a baloncesto 3x3 indoor/outdoor.
  • YOLO modificado para balón: Ajustes para detectar objetos pequeños y rápidos en escenas deportivas.

2. Datasets relevantes

Dataset Descripción Tamaño aproximado Anotaciones
TeamTrack Videos multideporte (fútbol, baloncesto, balonmano) 279,900 frames / 4.3M cajas Detección y tracking
SportsMOT Escenas deportivas diversas incluyendo baloncesto 150,000 frames Jugadores
DeepSportRadar Baloncesto indoor con cámaras fijas profesionales 1,456 imágenes Segmentación de jugadores/ balón
TrackID3x3 Baloncesto 3x3 (indoor/outdoor/drone) 155,797 frames Caja, ID, rol, pose
DeepSport Escenarios con jugadores y balón Variable Anotaciones parciales públicas

3. Papers académicos destacados

  • TrackID3x3: Basketball Tracking Benchmark with Role and Pose Labels
    Yamada et al. (2025) – Introduce dataset con rol, ID y pose para baloncesto 3x3.

  • DeepSportLab: Joint Ball and Player Detection for Team Sports
    Ghasemzadeh et al. (BMVC 2021) – Red unificada para balón, jugadores, segmentación y pose.

  • TeamTrack Benchmark (CVPRW 2024)
    Scott et al. – Benchmark multideporte con 4.3 millones de cajas anotadas.

  • Hiemann et al. (Sensors 2021)
    Modificación de YOLOv3 para mejorar detección del balón.

  • MMSports Workshops (2022–2023)
    Métodos modernos de segmentación y pose aplicados a baloncesto.


4. Frameworks y herramientas utilizadas

Detección

Tracking

Pose Estimation

Otras herramientas


5. Comparación de precisión y velocidad

Modelo Precisión estimada (mAP / HOTA) Velocidad (FPS) Observaciones
YOLOv5 / v8 / YOLOX ~50–60% 30–60 Ideal para tiempo real
Faster R-CNN / Mask R-CNN ~70–80% 5–10 Precisión alta, baja velocidad
DETR / Deformable DETR ~65–75% 5–10 Transformers precisos pero lentos
DeepSportLab ~65% estimado ~20 Unificación detección + pose + balón
TrackID3x3 ~80.8% HOTA (indoor) ~30–40 Especializado para basket 3×3

Nota: los resultados varían según dataset, resolución, hardware y configuración.


6. Conclusiones

  • Los modelos basados en YOLO ofrecen la mejor relación entre precisión y rendimiento para aplicaciones en tiempo real.
  • Modelos especializados como DeepSportLab y TrackID3x3 están optimizados para el contexto deportivo.
  • Existe una clara tendencia a la integración de detección, seguimiento y estimación de pose.
  • Aún se requieren más datasets específicos de baloncesto para entrenamientos robustos.
  • El uso de transfer learning y augmentations personalizados es clave en este dominio.

Recursos útiles


Última actualización: Agosto 2025