STATE OF THE ART ‐ COMPUTER VISION DETECTION MODELS - Tha-Alpha-Project/Dataset-Benchmark GitHub Wiki
Estado del Arte en Detección para Baloncesto con Visión por Computador
Este documento resume el estado actual (2024–2025) de la visión por computador aplicada al baloncesto, con foco en la detección de jugadores, balón, posiciones y elementos del campo, usando cámaras fijas y móviles. Se presentan modelos, datasets, frameworks, papers y comparativas clave.
1. Modelos de detección utilizados
Modelos generales adaptados
- YOLO (v5, v7, v8, YOLOX): Alta velocidad (30–60 FPS) con precisión competitiva (~50–60% mAP). Muy utilizados en contextos deportivos.
- CenterNet / CenterTrack: Especialmente útiles para detectar objetos centrales como el balón.
- Faster R-CNN / Mask R-CNN: Mayor precisión (~70–80% mAP), menor velocidad (~5–10 FPS). Ideales para análisis offline.
- DETR / Deformable DETR: Modelos basados en transformers. Alta precisión pero mucho más lentos.
Modelos específicos
- DeepSportLab (BMVC 2021): Detección unificada de balón, jugadores y pose. Ideal para deportes de equipo.
- TrackID3x3 (2025): YOLOX + BoT-SORT + estimación de pose. Adaptado a baloncesto 3x3 indoor/outdoor.
- YOLO modificado para balón: Ajustes para detectar objetos pequeños y rápidos en escenas deportivas.
2. Datasets relevantes
Dataset | Descripción | Tamaño aproximado | Anotaciones |
---|---|---|---|
TeamTrack | Videos multideporte (fútbol, baloncesto, balonmano) | 279,900 frames / 4.3M cajas | Detección y tracking |
SportsMOT | Escenas deportivas diversas incluyendo baloncesto | 150,000 frames | Jugadores |
DeepSportRadar | Baloncesto indoor con cámaras fijas profesionales | 1,456 imágenes | Segmentación de jugadores/ balón |
TrackID3x3 | Baloncesto 3x3 (indoor/outdoor/drone) | 155,797 frames | Caja, ID, rol, pose |
DeepSport | Escenarios con jugadores y balón | Variable | Anotaciones parciales públicas |
3. Papers académicos destacados
-
TrackID3x3: Basketball Tracking Benchmark with Role and Pose Labels
Yamada et al. (2025) – Introduce dataset con rol, ID y pose para baloncesto 3x3. -
DeepSportLab: Joint Ball and Player Detection for Team Sports
Ghasemzadeh et al. (BMVC 2021) – Red unificada para balón, jugadores, segmentación y pose. -
TeamTrack Benchmark (CVPRW 2024)
Scott et al. – Benchmark multideporte con 4.3 millones de cajas anotadas. -
Hiemann et al. (Sensors 2021)
Modificación de YOLOv3 para mejorar detección del balón. -
MMSports Workshops (2022–2023)
Métodos modernos de segmentación y pose aplicados a baloncesto.
4. Frameworks y herramientas utilizadas
Detección
Tracking
Pose Estimation
Otras herramientas
5. Comparación de precisión y velocidad
Modelo | Precisión estimada (mAP / HOTA) | Velocidad (FPS) | Observaciones |
---|---|---|---|
YOLOv5 / v8 / YOLOX | ~50–60% | 30–60 | Ideal para tiempo real |
Faster R-CNN / Mask R-CNN | ~70–80% | 5–10 | Precisión alta, baja velocidad |
DETR / Deformable DETR | ~65–75% | 5–10 | Transformers precisos pero lentos |
DeepSportLab | ~65% estimado | ~20 | Unificación detección + pose + balón |
TrackID3x3 | ~80.8% HOTA (indoor) | ~30–40 | Especializado para basket 3×3 |
Nota: los resultados varían según dataset, resolución, hardware y configuración.
6. Conclusiones
- Los modelos basados en YOLO ofrecen la mejor relación entre precisión y rendimiento para aplicaciones en tiempo real.
- Modelos especializados como DeepSportLab y TrackID3x3 están optimizados para el contexto deportivo.
- Existe una clara tendencia a la integración de detección, seguimiento y estimación de pose.
- Aún se requieren más datasets específicos de baloncesto para entrenamientos robustos.
- El uso de transfer learning y augmentations personalizados es clave en este dominio.
Recursos útiles
- TrackID3x3 Paper (arXiv 2025)
- TeamTrack Benchmark (CVPRW 2024)
- DeepSportLab (BMVC 2021)
- Ultralytics YOLOv8
- SportsMOT Dataset
Última actualización: Agosto 2025