| Título : | Evaluación automatizada de técnica en ejercicios de fitness mediante aprendizaje profundo y visión por computadora |
| Autores : | Villanueva, Ignacio, Tesista ; Talamé, María Lorena, Docente guía |
| Editorial : | Universidad Católica de Salta. Facultad de Ingeniería |
| Nota general : |
Trabajo final de grado Carrera: Ingeniería en Informática, Universidad Católica de Salta, 2025 |
| Idioma : | Español |
| Materias : | Trabajo final de grado | Informática | Aplicación informática | Entrenamiento deportivo | Inteligencia artificial |
| Resumen : |
La evaluación objetiva de técnica en ejercicios de entrenamiento físico representa un desafío fundamental debido a la subjetividad inherente del análisis manual y los costos prohibitivos de sistemas comerciales de captura de movimiento. Este trabajo presenta el desarrollo de un modelo de clasificación de técnica en el ejercicio de press de hombro, mediante técnicas de visión por computadora y aprendizaje profundo. Se toma el press militar como caso de estudio, combinando Vision Transformers para estimación de poses con redes convolucionales 3D para clasificación temporal. El pipeline desarrollado procesa videos del ejercicio en dos etapas: extracción de puntos articulares (keypoints) 2D utilizando ViTPose sobre 17 puntos anatómicos del estándar COCO, seguido de análisis temporal a través de PoseConv3D que clasifica secuencias de movimiento en tres categorías (técnica correcta, errores de codos, errores de rodillas). El desarrollo de un algoritmo de corrección de seguimiento (tracking) representa una contribución técnica del proyecto, resolviendo inconsistencias de identificación en videos multi-persona mediante proximidad espacial. La metodología experimental siguió un desarrollo iterativo basado en evidencia, progresando desde un experimento base con sobreajuste severo hasta la implementación final optimizada mediante transfer learning (aprendizaje por transferencia) con fine-tuning (ajuste fino) desde modelos preentrenados en NTU60. El modelo final alcanza F1-score macro de 0.91 y precisión de 91.6 % en el dataset Fitness-AQA, demostrando la efectividad del enfoque multi-clase unificado comparado con aproximaciones binarias especializadas. Los resultados validan la viabilidad de modelos de clasificación biomecánica basados en análisis visual, ofreciendo una alternativa accesible a tecnologías comerciales disponibles. La arquitectura desarrollada establece un marco de trabajo replicable para análisis automatizado de movimiento humano, con aplicaciones potenciales en entrenamiento físico, rehabilitación y deporte. The objective evaluation of technique in physical training exercises represents a fundamental challenge due to the inherent subjectivity of manual analysis and the prohibitive costs of commercial motion capture systems. This work presents the development of a technique classification model for the overhead press exercise, using computer vision and deep learning techniques. The overhead press is used as a case study, combining Vision Transformers for pose estimation with 3D convolutional networks for temporal classification. The developed pipeline processes exercise videos in two stages: extraction of 2D joint keypoints using ViTPose over 17 anatomical points of the COCO standard, followed by temporal analysis through PoseConv3D that classifies motion sequences into three categories (correct technique, elbow errors, knee errors). The development of a tracking correction algorithm represents a technical contribution of the project, resolving identification inconsistencies in multiperson videos through spatial proximity. The experimental methodology followed an evidence-based iterative development, progressing from a baseline experiment with severe overfitting to the final optimized implementation using transfer learning with fine-tuning from models pretrained on NTU60. The final model achieves a macro F1-score of 0.91 and 91.6 % accuracy on the Fitness-AQA dataset, demonstrating the effectiveness of the unified multi-class approach compared to specialized binary approaches. The results validate the viability of biomechanical classification models based on visual analysis, offering an accessible alternative to available commercial technologies. The developed architecture establishes a replicable framework for automated human motion analysis, with potential applications in physical training, rehabilitation, and sport. |
| URI : | https://bibliotecas.ucasal.edu.ar/ark:/49597/ntxdjrpfpd |
| ARK : | https://n2t.net/ark:/49597/ntxdjrpfpd |
| Derechos : | info:eu-repo/semantics/openAccess |
| Licencia de uso : |
|
| Cita recomendada : | Villanueva, Ignacio. (2026-06-05) Evaluación automatizada de técnica en ejercicios de fitness mediante aprendizaje profundo y visión por computadora. Universidad Católica de Salta. Facultad de Ingeniería. https://bibliotecas.ucasal.edu.ar/ark:/49597/ntxdjrpfpd |
| Metadatos: | Ver Vista de Metadatos |
| Archivo/s de este documento : |
|






