Comparação de modelos estatísticos para prever o risco de lesões de membros inferiores em jogadores de futebol
| Ano de defesa: | 2025 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/5/5160/tde-21102025-152332/ |
Resumo: | A incidência crescente de lesões musculares indiretas em membros inferiores representa um desafio para o futebol profissional, impactando o desempenho das equipes e gerando altos custos financeiros. Essa tese comparou a efetividade de algoritmos de aprendizado de máquina (ML) e teoria dos valores extremos (TVE), na predição do risco de lesão em jogadores de futebol profissional. O Estudo 1 analisou dados coletados nas pré-temporadas de 2022 e 2023 do Guarani Futebol Clube, incluindo idade, composição corporal e componentes da capacidade física (força, velocidade, agilidade e resistência aeróbia). A amostra incluiu 35 jogadores profissionais (média ± DP; 28,36 ± 4,02 anos; 178,92 ± 7,14 cm; 79,34 ± 6,98 kg). Embora não tenham sido encontradas diferenças estatisticamente significantes entre jogadores lesionados e não lesionados, os modelos de ML demonstraram potencial para identificar padrões de risco. O modelo de Suport Vector Machine (SVM) obteve a melhor performance (acurácia: 73,68%; precisão: 83,33%), destacando-se na identificação de jogadores sob maior risco, mas apresentou um recall de 66,7%, classificando incorretamente alguns jogadores lesionados como sem risco. O Estudo 2 utilizou dados de GPS coletados em treinos e jogos das mesmas temporadas para avaliar a carga de treinamento e o planejamento técnico. A amostra incluiu 86 jogadores (26,9 ± 4,3 anos; 177,5 ± 10,9 cm; 76,1 ± 10,9 kg). A razão aguda-crônica de carga foi comparada entre jogadores lesionados e não lesionados em dois períodos (quatro e uma semana antes da lesão), mas não apresentou diferença significativa (p > 0,05), reforçando o ceticismo sobre sua aplicabilidade. A inclusão de variáveis relacionadas ao planejamento técnico também não melhorou a performance dos modelos de ML, enquanto métricas tradicionais derivadas do GPS, como carga externa de treino, acelerações e sprints, permaneceram os preditores mais relevantes. Modelos como Regressão Logística, Naïve Bayes e SVM alcançaram acurácia em torno de 60% e precisão de 50%. Porém, o overfitting permaneceu um desafio: o modelo XGBoost obteve 80% de acurácia, mas análises detalhadas revelaram que capturava mais ruído do que padrões reais de risco de lesão, destacando a necessidade de validar os modelos além das métricas de desempenho. Além disso, a TVE foi aplicada para verificar se lesões poderiam ser associadas a valores extremos de composição corporal ou desempenho físico. No entanto, os resultados mostraram que essa abordagem não foi eficaz na predição de risco de lesão, pois os valores extremos não refletiam padrões compatíveis com a realidade de atletas profissionais. Os achados desta tese reforçam o potencial da inteligência artificial como ferramenta de suporte à tomada de decisão na prevenção de lesões no futebol. No entanto, a interpretação clínica e a aplicabilidade prática desses modelos ainda representam desafios. A elevada taxa de falsos negativos e a inconsistência de alguns parâmetros analisados destacam a necessidade de abordagens mais abrangentes, integrando múltiplas variáveis e ampliando o tamanho das amostras. O estudo contribui para a evolução das estratégias de monitoramento de risco de lesão no esporte de alto rendimento, enfatizando a importância de modelos mais robustos e aplicáveis à realidade do futebol profissional. |
| id |
USP_1611c438c6c823c32d426b743c87fa3f |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-21102025-152332 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Comparação de modelos estatísticos para prever o risco de lesões de membros inferiores em jogadores de futebolComparison of statistical models for predicting lower limb injury risk in football playersAprendizado de máquinaCarga de treinamentoFootballFutebolGPSGPSInjury PredictionMachine LearningPrevisão de lesõesTraining LoadA incidência crescente de lesões musculares indiretas em membros inferiores representa um desafio para o futebol profissional, impactando o desempenho das equipes e gerando altos custos financeiros. Essa tese comparou a efetividade de algoritmos de aprendizado de máquina (ML) e teoria dos valores extremos (TVE), na predição do risco de lesão em jogadores de futebol profissional. O Estudo 1 analisou dados coletados nas pré-temporadas de 2022 e 2023 do Guarani Futebol Clube, incluindo idade, composição corporal e componentes da capacidade física (força, velocidade, agilidade e resistência aeróbia). A amostra incluiu 35 jogadores profissionais (média ± DP; 28,36 ± 4,02 anos; 178,92 ± 7,14 cm; 79,34 ± 6,98 kg). Embora não tenham sido encontradas diferenças estatisticamente significantes entre jogadores lesionados e não lesionados, os modelos de ML demonstraram potencial para identificar padrões de risco. O modelo de Suport Vector Machine (SVM) obteve a melhor performance (acurácia: 73,68%; precisão: 83,33%), destacando-se na identificação de jogadores sob maior risco, mas apresentou um recall de 66,7%, classificando incorretamente alguns jogadores lesionados como sem risco. O Estudo 2 utilizou dados de GPS coletados em treinos e jogos das mesmas temporadas para avaliar a carga de treinamento e o planejamento técnico. A amostra incluiu 86 jogadores (26,9 ± 4,3 anos; 177,5 ± 10,9 cm; 76,1 ± 10,9 kg). A razão aguda-crônica de carga foi comparada entre jogadores lesionados e não lesionados em dois períodos (quatro e uma semana antes da lesão), mas não apresentou diferença significativa (p > 0,05), reforçando o ceticismo sobre sua aplicabilidade. A inclusão de variáveis relacionadas ao planejamento técnico também não melhorou a performance dos modelos de ML, enquanto métricas tradicionais derivadas do GPS, como carga externa de treino, acelerações e sprints, permaneceram os preditores mais relevantes. Modelos como Regressão Logística, Naïve Bayes e SVM alcançaram acurácia em torno de 60% e precisão de 50%. Porém, o overfitting permaneceu um desafio: o modelo XGBoost obteve 80% de acurácia, mas análises detalhadas revelaram que capturava mais ruído do que padrões reais de risco de lesão, destacando a necessidade de validar os modelos além das métricas de desempenho. Além disso, a TVE foi aplicada para verificar se lesões poderiam ser associadas a valores extremos de composição corporal ou desempenho físico. No entanto, os resultados mostraram que essa abordagem não foi eficaz na predição de risco de lesão, pois os valores extremos não refletiam padrões compatíveis com a realidade de atletas profissionais. Os achados desta tese reforçam o potencial da inteligência artificial como ferramenta de suporte à tomada de decisão na prevenção de lesões no futebol. No entanto, a interpretação clínica e a aplicabilidade prática desses modelos ainda representam desafios. A elevada taxa de falsos negativos e a inconsistência de alguns parâmetros analisados destacam a necessidade de abordagens mais abrangentes, integrando múltiplas variáveis e ampliando o tamanho das amostras. O estudo contribui para a evolução das estratégias de monitoramento de risco de lesão no esporte de alto rendimento, enfatizando a importância de modelos mais robustos e aplicáveis à realidade do futebol profissional.The increasing incidence of non-contact muscle injuries in the lower limbs presents a significant challenge for professional football, affecting team performance and generating high financial costs. This thesis compared the effectiveness of machine learning (ML) algorithms and extreme value theory (EVT) in predicting injury risk in professional football players. Study 1 analyzed data collected during the 2022 and 2023 pre-seasons of Guarani Futebol Clube, including age, body composition, and physical performance variables such as strength, speed, agility, and aerobic endurance. The sample consisted of 35 professional male football players (mean ± SD; 28.36 ± 4.02 years old; 178.92 ± 7.14 cm tall; 79.34 ± 6.98 kg mass). Although no statistically significant differences were found between injured and non-injured players, ML models demonstrated potential in identifying injury risk patterns. The support vector machine (SVM) model performed best, achieving 73.68% accuracy and 83.33% precision, effectively identifying high-risk players. However, its recall was 66.7%, meaning it misclassified a considerable number of injured players as low risk. Study 2 used GPS data collected from all training sessions and matches over the same seasons to assess training load and tactical planning. The sample included 86 professional players (mean ± SD; 26.9 ± 4.3 years old; 177.5 ± 10.9 cm tall; 76.1 ± 10.9 kg mass). The acute-chronic workload ratio (ACWR) was tested by comparing injured and non-injured players at two time points (four and one week before injury). The analysis showed no significant differences (p > 0.05), reinforcing skepticism regarding its applicability. The inclusion of tactical planning variables did not improve ML model performance, while traditional GPS-derived workload metrics, such as external training load, accelerations, and sprints, remained the most relevant predictors. Logistic regression, Naïve Bayes, and SVM models achieved accuracy of approximately 60% and precision of 50%. Overfitting remained a challenge, as the XGBoost model reached 80% accuracy but was found to capture more noise than meaningful injury risk patterns, emphasizing the need for validation beyond performance metrics. EVT was also applied to determine whether injuries could be associated with extreme values of body composition or physical performance. However, the results indicated that this approach was not effective in predicting injury risk, as extreme values did not align with realistic patterns observed in professional athletes. These findings highlight the potential of artificial intelligence as a decision-support tool for injury prevention in football. However, the clinical interpretation and practical implementation of these models remain challenging. The high rate of false negatives and inconsistencies in some parameters emphasize the need for more comprehensive approaches that integrate multiple variables and larger sample sizes. This study contributes to the development of more robust injury risk monitoring strategies in elite sports, reinforcing the importance of data-driven models that are applicable to professional football.Biblioteca Digitais de Teses e Dissertações da USPMochizuki, LuisPennone, Juliana2025-06-18info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/5/5160/tde-21102025-152332/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2025-10-21T18:39:02Zoai:teses.usp.br:tde-21102025-152332Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-10-21T18:39:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Comparação de modelos estatísticos para prever o risco de lesões de membros inferiores em jogadores de futebol Comparison of statistical models for predicting lower limb injury risk in football players |
| title |
Comparação de modelos estatísticos para prever o risco de lesões de membros inferiores em jogadores de futebol |
| spellingShingle |
Comparação de modelos estatísticos para prever o risco de lesões de membros inferiores em jogadores de futebol Pennone, Juliana Aprendizado de máquina Carga de treinamento Football Futebol GPS GPS Injury Prediction Machine Learning Previsão de lesões Training Load |
| title_short |
Comparação de modelos estatísticos para prever o risco de lesões de membros inferiores em jogadores de futebol |
| title_full |
Comparação de modelos estatísticos para prever o risco de lesões de membros inferiores em jogadores de futebol |
| title_fullStr |
Comparação de modelos estatísticos para prever o risco de lesões de membros inferiores em jogadores de futebol |
| title_full_unstemmed |
Comparação de modelos estatísticos para prever o risco de lesões de membros inferiores em jogadores de futebol |
| title_sort |
Comparação de modelos estatísticos para prever o risco de lesões de membros inferiores em jogadores de futebol |
| author |
Pennone, Juliana |
| author_facet |
Pennone, Juliana |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Mochizuki, Luis |
| dc.contributor.author.fl_str_mv |
Pennone, Juliana |
| dc.subject.por.fl_str_mv |
Aprendizado de máquina Carga de treinamento Football Futebol GPS GPS Injury Prediction Machine Learning Previsão de lesões Training Load |
| topic |
Aprendizado de máquina Carga de treinamento Football Futebol GPS GPS Injury Prediction Machine Learning Previsão de lesões Training Load |
| description |
A incidência crescente de lesões musculares indiretas em membros inferiores representa um desafio para o futebol profissional, impactando o desempenho das equipes e gerando altos custos financeiros. Essa tese comparou a efetividade de algoritmos de aprendizado de máquina (ML) e teoria dos valores extremos (TVE), na predição do risco de lesão em jogadores de futebol profissional. O Estudo 1 analisou dados coletados nas pré-temporadas de 2022 e 2023 do Guarani Futebol Clube, incluindo idade, composição corporal e componentes da capacidade física (força, velocidade, agilidade e resistência aeróbia). A amostra incluiu 35 jogadores profissionais (média ± DP; 28,36 ± 4,02 anos; 178,92 ± 7,14 cm; 79,34 ± 6,98 kg). Embora não tenham sido encontradas diferenças estatisticamente significantes entre jogadores lesionados e não lesionados, os modelos de ML demonstraram potencial para identificar padrões de risco. O modelo de Suport Vector Machine (SVM) obteve a melhor performance (acurácia: 73,68%; precisão: 83,33%), destacando-se na identificação de jogadores sob maior risco, mas apresentou um recall de 66,7%, classificando incorretamente alguns jogadores lesionados como sem risco. O Estudo 2 utilizou dados de GPS coletados em treinos e jogos das mesmas temporadas para avaliar a carga de treinamento e o planejamento técnico. A amostra incluiu 86 jogadores (26,9 ± 4,3 anos; 177,5 ± 10,9 cm; 76,1 ± 10,9 kg). A razão aguda-crônica de carga foi comparada entre jogadores lesionados e não lesionados em dois períodos (quatro e uma semana antes da lesão), mas não apresentou diferença significativa (p > 0,05), reforçando o ceticismo sobre sua aplicabilidade. A inclusão de variáveis relacionadas ao planejamento técnico também não melhorou a performance dos modelos de ML, enquanto métricas tradicionais derivadas do GPS, como carga externa de treino, acelerações e sprints, permaneceram os preditores mais relevantes. Modelos como Regressão Logística, Naïve Bayes e SVM alcançaram acurácia em torno de 60% e precisão de 50%. Porém, o overfitting permaneceu um desafio: o modelo XGBoost obteve 80% de acurácia, mas análises detalhadas revelaram que capturava mais ruído do que padrões reais de risco de lesão, destacando a necessidade de validar os modelos além das métricas de desempenho. Além disso, a TVE foi aplicada para verificar se lesões poderiam ser associadas a valores extremos de composição corporal ou desempenho físico. No entanto, os resultados mostraram que essa abordagem não foi eficaz na predição de risco de lesão, pois os valores extremos não refletiam padrões compatíveis com a realidade de atletas profissionais. Os achados desta tese reforçam o potencial da inteligência artificial como ferramenta de suporte à tomada de decisão na prevenção de lesões no futebol. No entanto, a interpretação clínica e a aplicabilidade prática desses modelos ainda representam desafios. A elevada taxa de falsos negativos e a inconsistência de alguns parâmetros analisados destacam a necessidade de abordagens mais abrangentes, integrando múltiplas variáveis e ampliando o tamanho das amostras. O estudo contribui para a evolução das estratégias de monitoramento de risco de lesão no esporte de alto rendimento, enfatizando a importância de modelos mais robustos e aplicáveis à realidade do futebol profissional. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-06-18 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/5/5160/tde-21102025-152332/ |
| url |
https://www.teses.usp.br/teses/disponiveis/5/5160/tde-21102025-152332/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1865492355647275008 |