Exportação concluída — 

Comparação de modelos estatísticos para prever o risco de lesões de membros inferiores em jogadores de futebol

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Pennone, Juliana
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
GPS
Link de acesso: https://www.teses.usp.br/teses/disponiveis/5/5160/tde-21102025-152332/
Resumo: A incidência crescente de lesões musculares indiretas em membros inferiores representa um desafio para o futebol profissional, impactando o desempenho das equipes e gerando altos custos financeiros. Essa tese comparou a efetividade de algoritmos de aprendizado de máquina (ML) e teoria dos valores extremos (TVE), na predição do risco de lesão em jogadores de futebol profissional. O Estudo 1 analisou dados coletados nas pré-temporadas de 2022 e 2023 do Guarani Futebol Clube, incluindo idade, composição corporal e componentes da capacidade física (força, velocidade, agilidade e resistência aeróbia). A amostra incluiu 35 jogadores profissionais (média ± DP; 28,36 ± 4,02 anos; 178,92 ± 7,14 cm; 79,34 ± 6,98 kg). Embora não tenham sido encontradas diferenças estatisticamente significantes entre jogadores lesionados e não lesionados, os modelos de ML demonstraram potencial para identificar padrões de risco. O modelo de Suport Vector Machine (SVM) obteve a melhor performance (acurácia: 73,68%; precisão: 83,33%), destacando-se na identificação de jogadores sob maior risco, mas apresentou um recall de 66,7%, classificando incorretamente alguns jogadores lesionados como sem risco. O Estudo 2 utilizou dados de GPS coletados em treinos e jogos das mesmas temporadas para avaliar a carga de treinamento e o planejamento técnico. A amostra incluiu 86 jogadores (26,9 ± 4,3 anos; 177,5 ± 10,9 cm; 76,1 ± 10,9 kg). A razão aguda-crônica de carga foi comparada entre jogadores lesionados e não lesionados em dois períodos (quatro e uma semana antes da lesão), mas não apresentou diferença significativa (p > 0,05), reforçando o ceticismo sobre sua aplicabilidade. A inclusão de variáveis relacionadas ao planejamento técnico também não melhorou a performance dos modelos de ML, enquanto métricas tradicionais derivadas do GPS, como carga externa de treino, acelerações e sprints, permaneceram os preditores mais relevantes. Modelos como Regressão Logística, Naïve Bayes e SVM alcançaram acurácia em torno de 60% e precisão de 50%. Porém, o overfitting permaneceu um desafio: o modelo XGBoost obteve 80% de acurácia, mas análises detalhadas revelaram que capturava mais ruído do que padrões reais de risco de lesão, destacando a necessidade de validar os modelos além das métricas de desempenho. Além disso, a TVE foi aplicada para verificar se lesões poderiam ser associadas a valores extremos de composição corporal ou desempenho físico. No entanto, os resultados mostraram que essa abordagem não foi eficaz na predição de risco de lesão, pois os valores extremos não refletiam padrões compatíveis com a realidade de atletas profissionais. Os achados desta tese reforçam o potencial da inteligência artificial como ferramenta de suporte à tomada de decisão na prevenção de lesões no futebol. No entanto, a interpretação clínica e a aplicabilidade prática desses modelos ainda representam desafios. A elevada taxa de falsos negativos e a inconsistência de alguns parâmetros analisados destacam a necessidade de abordagens mais abrangentes, integrando múltiplas variáveis e ampliando o tamanho das amostras. O estudo contribui para a evolução das estratégias de monitoramento de risco de lesão no esporte de alto rendimento, enfatizando a importância de modelos mais robustos e aplicáveis à realidade do futebol profissional.
id USP_1611c438c6c823c32d426b743c87fa3f
oai_identifier_str oai:teses.usp.br:tde-21102025-152332
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Comparação de modelos estatísticos para prever o risco de lesões de membros inferiores em jogadores de futebolComparison of statistical models for predicting lower limb injury risk in football playersAprendizado de máquinaCarga de treinamentoFootballFutebolGPSGPSInjury PredictionMachine LearningPrevisão de lesõesTraining LoadA incidência crescente de lesões musculares indiretas em membros inferiores representa um desafio para o futebol profissional, impactando o desempenho das equipes e gerando altos custos financeiros. Essa tese comparou a efetividade de algoritmos de aprendizado de máquina (ML) e teoria dos valores extremos (TVE), na predição do risco de lesão em jogadores de futebol profissional. O Estudo 1 analisou dados coletados nas pré-temporadas de 2022 e 2023 do Guarani Futebol Clube, incluindo idade, composição corporal e componentes da capacidade física (força, velocidade, agilidade e resistência aeróbia). A amostra incluiu 35 jogadores profissionais (média ± DP; 28,36 ± 4,02 anos; 178,92 ± 7,14 cm; 79,34 ± 6,98 kg). Embora não tenham sido encontradas diferenças estatisticamente significantes entre jogadores lesionados e não lesionados, os modelos de ML demonstraram potencial para identificar padrões de risco. O modelo de Suport Vector Machine (SVM) obteve a melhor performance (acurácia: 73,68%; precisão: 83,33%), destacando-se na identificação de jogadores sob maior risco, mas apresentou um recall de 66,7%, classificando incorretamente alguns jogadores lesionados como sem risco. O Estudo 2 utilizou dados de GPS coletados em treinos e jogos das mesmas temporadas para avaliar a carga de treinamento e o planejamento técnico. A amostra incluiu 86 jogadores (26,9 ± 4,3 anos; 177,5 ± 10,9 cm; 76,1 ± 10,9 kg). A razão aguda-crônica de carga foi comparada entre jogadores lesionados e não lesionados em dois períodos (quatro e uma semana antes da lesão), mas não apresentou diferença significativa (p > 0,05), reforçando o ceticismo sobre sua aplicabilidade. A inclusão de variáveis relacionadas ao planejamento técnico também não melhorou a performance dos modelos de ML, enquanto métricas tradicionais derivadas do GPS, como carga externa de treino, acelerações e sprints, permaneceram os preditores mais relevantes. Modelos como Regressão Logística, Naïve Bayes e SVM alcançaram acurácia em torno de 60% e precisão de 50%. Porém, o overfitting permaneceu um desafio: o modelo XGBoost obteve 80% de acurácia, mas análises detalhadas revelaram que capturava mais ruído do que padrões reais de risco de lesão, destacando a necessidade de validar os modelos além das métricas de desempenho. Além disso, a TVE foi aplicada para verificar se lesões poderiam ser associadas a valores extremos de composição corporal ou desempenho físico. No entanto, os resultados mostraram que essa abordagem não foi eficaz na predição de risco de lesão, pois os valores extremos não refletiam padrões compatíveis com a realidade de atletas profissionais. Os achados desta tese reforçam o potencial da inteligência artificial como ferramenta de suporte à tomada de decisão na prevenção de lesões no futebol. No entanto, a interpretação clínica e a aplicabilidade prática desses modelos ainda representam desafios. A elevada taxa de falsos negativos e a inconsistência de alguns parâmetros analisados destacam a necessidade de abordagens mais abrangentes, integrando múltiplas variáveis e ampliando o tamanho das amostras. O estudo contribui para a evolução das estratégias de monitoramento de risco de lesão no esporte de alto rendimento, enfatizando a importância de modelos mais robustos e aplicáveis à realidade do futebol profissional.The increasing incidence of non-contact muscle injuries in the lower limbs presents a significant challenge for professional football, affecting team performance and generating high financial costs. This thesis compared the effectiveness of machine learning (ML) algorithms and extreme value theory (EVT) in predicting injury risk in professional football players. Study 1 analyzed data collected during the 2022 and 2023 pre-seasons of Guarani Futebol Clube, including age, body composition, and physical performance variables such as strength, speed, agility, and aerobic endurance. The sample consisted of 35 professional male football players (mean ± SD; 28.36 ± 4.02 years old; 178.92 ± 7.14 cm tall; 79.34 ± 6.98 kg mass). Although no statistically significant differences were found between injured and non-injured players, ML models demonstrated potential in identifying injury risk patterns. The support vector machine (SVM) model performed best, achieving 73.68% accuracy and 83.33% precision, effectively identifying high-risk players. However, its recall was 66.7%, meaning it misclassified a considerable number of injured players as low risk. Study 2 used GPS data collected from all training sessions and matches over the same seasons to assess training load and tactical planning. The sample included 86 professional players (mean ± SD; 26.9 ± 4.3 years old; 177.5 ± 10.9 cm tall; 76.1 ± 10.9 kg mass). The acute-chronic workload ratio (ACWR) was tested by comparing injured and non-injured players at two time points (four and one week before injury). The analysis showed no significant differences (p > 0.05), reinforcing skepticism regarding its applicability. The inclusion of tactical planning variables did not improve ML model performance, while traditional GPS-derived workload metrics, such as external training load, accelerations, and sprints, remained the most relevant predictors. Logistic regression, Naïve Bayes, and SVM models achieved accuracy of approximately 60% and precision of 50%. Overfitting remained a challenge, as the XGBoost model reached 80% accuracy but was found to capture more noise than meaningful injury risk patterns, emphasizing the need for validation beyond performance metrics. EVT was also applied to determine whether injuries could be associated with extreme values of body composition or physical performance. However, the results indicated that this approach was not effective in predicting injury risk, as extreme values did not align with realistic patterns observed in professional athletes. These findings highlight the potential of artificial intelligence as a decision-support tool for injury prevention in football. However, the clinical interpretation and practical implementation of these models remain challenging. The high rate of false negatives and inconsistencies in some parameters emphasize the need for more comprehensive approaches that integrate multiple variables and larger sample sizes. This study contributes to the development of more robust injury risk monitoring strategies in elite sports, reinforcing the importance of data-driven models that are applicable to professional football.Biblioteca Digitais de Teses e Dissertações da USPMochizuki, LuisPennone, Juliana2025-06-18info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/5/5160/tde-21102025-152332/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2025-10-21T18:39:02Zoai:teses.usp.br:tde-21102025-152332Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-10-21T18:39:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Comparação de modelos estatísticos para prever o risco de lesões de membros inferiores em jogadores de futebol
Comparison of statistical models for predicting lower limb injury risk in football players
title Comparação de modelos estatísticos para prever o risco de lesões de membros inferiores em jogadores de futebol
spellingShingle Comparação de modelos estatísticos para prever o risco de lesões de membros inferiores em jogadores de futebol
Pennone, Juliana
Aprendizado de máquina
Carga de treinamento
Football
Futebol
GPS
GPS
Injury Prediction
Machine Learning
Previsão de lesões
Training Load
title_short Comparação de modelos estatísticos para prever o risco de lesões de membros inferiores em jogadores de futebol
title_full Comparação de modelos estatísticos para prever o risco de lesões de membros inferiores em jogadores de futebol
title_fullStr Comparação de modelos estatísticos para prever o risco de lesões de membros inferiores em jogadores de futebol
title_full_unstemmed Comparação de modelos estatísticos para prever o risco de lesões de membros inferiores em jogadores de futebol
title_sort Comparação de modelos estatísticos para prever o risco de lesões de membros inferiores em jogadores de futebol
author Pennone, Juliana
author_facet Pennone, Juliana
author_role author
dc.contributor.none.fl_str_mv Mochizuki, Luis
dc.contributor.author.fl_str_mv Pennone, Juliana
dc.subject.por.fl_str_mv Aprendizado de máquina
Carga de treinamento
Football
Futebol
GPS
GPS
Injury Prediction
Machine Learning
Previsão de lesões
Training Load
topic Aprendizado de máquina
Carga de treinamento
Football
Futebol
GPS
GPS
Injury Prediction
Machine Learning
Previsão de lesões
Training Load
description A incidência crescente de lesões musculares indiretas em membros inferiores representa um desafio para o futebol profissional, impactando o desempenho das equipes e gerando altos custos financeiros. Essa tese comparou a efetividade de algoritmos de aprendizado de máquina (ML) e teoria dos valores extremos (TVE), na predição do risco de lesão em jogadores de futebol profissional. O Estudo 1 analisou dados coletados nas pré-temporadas de 2022 e 2023 do Guarani Futebol Clube, incluindo idade, composição corporal e componentes da capacidade física (força, velocidade, agilidade e resistência aeróbia). A amostra incluiu 35 jogadores profissionais (média ± DP; 28,36 ± 4,02 anos; 178,92 ± 7,14 cm; 79,34 ± 6,98 kg). Embora não tenham sido encontradas diferenças estatisticamente significantes entre jogadores lesionados e não lesionados, os modelos de ML demonstraram potencial para identificar padrões de risco. O modelo de Suport Vector Machine (SVM) obteve a melhor performance (acurácia: 73,68%; precisão: 83,33%), destacando-se na identificação de jogadores sob maior risco, mas apresentou um recall de 66,7%, classificando incorretamente alguns jogadores lesionados como sem risco. O Estudo 2 utilizou dados de GPS coletados em treinos e jogos das mesmas temporadas para avaliar a carga de treinamento e o planejamento técnico. A amostra incluiu 86 jogadores (26,9 ± 4,3 anos; 177,5 ± 10,9 cm; 76,1 ± 10,9 kg). A razão aguda-crônica de carga foi comparada entre jogadores lesionados e não lesionados em dois períodos (quatro e uma semana antes da lesão), mas não apresentou diferença significativa (p > 0,05), reforçando o ceticismo sobre sua aplicabilidade. A inclusão de variáveis relacionadas ao planejamento técnico também não melhorou a performance dos modelos de ML, enquanto métricas tradicionais derivadas do GPS, como carga externa de treino, acelerações e sprints, permaneceram os preditores mais relevantes. Modelos como Regressão Logística, Naïve Bayes e SVM alcançaram acurácia em torno de 60% e precisão de 50%. Porém, o overfitting permaneceu um desafio: o modelo XGBoost obteve 80% de acurácia, mas análises detalhadas revelaram que capturava mais ruído do que padrões reais de risco de lesão, destacando a necessidade de validar os modelos além das métricas de desempenho. Além disso, a TVE foi aplicada para verificar se lesões poderiam ser associadas a valores extremos de composição corporal ou desempenho físico. No entanto, os resultados mostraram que essa abordagem não foi eficaz na predição de risco de lesão, pois os valores extremos não refletiam padrões compatíveis com a realidade de atletas profissionais. Os achados desta tese reforçam o potencial da inteligência artificial como ferramenta de suporte à tomada de decisão na prevenção de lesões no futebol. No entanto, a interpretação clínica e a aplicabilidade prática desses modelos ainda representam desafios. A elevada taxa de falsos negativos e a inconsistência de alguns parâmetros analisados destacam a necessidade de abordagens mais abrangentes, integrando múltiplas variáveis e ampliando o tamanho das amostras. O estudo contribui para a evolução das estratégias de monitoramento de risco de lesão no esporte de alto rendimento, enfatizando a importância de modelos mais robustos e aplicáveis à realidade do futebol profissional.
publishDate 2025
dc.date.none.fl_str_mv 2025-06-18
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/5/5160/tde-21102025-152332/
url https://www.teses.usp.br/teses/disponiveis/5/5160/tde-21102025-152332/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1865492355647275008