Modelagem estatística e o limite da predição no futebol brasileiro: um estudo comparativo de desempenho e parcimônia
| Ano de defesa: | 2026 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de Alfenas
Sede Mestrado em Estatística Aplicada e Biometria |
| Programa de Pós-Graduação: |
Programa de Pós-Graduação em Estatística Aplicada e Biometria
|
| Departamento: |
Instituto de Ciências Exatas
|
| País: |
Não Informado pela instituição
|
| Área do conhecimento CNPq: | |
| Link de acesso: | https://repositorio.unifal-mg.edu.br/handle/123456789/3322 http://lattes.cnpq.br/3128218938439663 http://lattes.cnpq.br/9965398009651936 https://orcid.org/0000-0003-4911-7245 https://orcid.org/0000-0003-3361-0908 |
Resumo: | O presente trabalho investiga a aplicação de modelos estatísticos para a previsão de resultados de partidas do Campeonato Brasileiro de Futebol Série A, com ênfase na comparação de desempenho entre diferentes abordagens metodológicas. A motivação do estudo decorre do histórico vínculo entre probabilidade e jogos, bem como do crescente interesse acadêmico e comercial impulsionado pela popularização das apostas esportivas, especialmente por meio de plataformas digitais. Embora a literatura apresente diversas propostas de modelagem para o futebol, observa-se que, na maioria dos casos, as taxas de acerto raramente ultrapassam 60% e, quando o fazem, tendem a perder consistência em aplicações de longo prazo. Foram analisados 35 modelos distintos, originados a partir de dois métodos amplamente reconhecidos na literatura e de variações metodológicas propostas neste trabalho. Os modelos foram avaliados com base em onze métricas, buscando captar as particularidades de cada abordagem. Essas métricas mensuram acurácia, erro, calibração probabilística, nível de complexidade, além de critérios adicionais destinados a aferir robustez e aplicabilidade prática. Uma atenção especial foi dada à parcimônia dos modelos e ao equilíbrio entre simplicidade e desempenho. O estudo também incorporou a análise do impacto de diferentes janelas temporais, definidas em função do número de rodadas anteriores consideradas na geração das previsões. Dessa forma, o desempenho dos modelos variou de acordo com as métricas empregadas, mas alguns se destacaram de forma clara. Entre eles, os modelos UfmgGer e Sd1Ger apresentaram os melhores resultados globais, enquanto o modelo ConTeiMan surpreendeu por sua metodologia extremamente simples aliada a uma elevada taxa de acerto. |
| id |
UNIFAL_5d82fc1133607e6c5d03e91c4237b35b |
|---|---|
| oai_identifier_str |
oai:repositorio.unifal-mg.edu.br:123456789/3322 |
| network_acronym_str |
UNIFAL |
| network_name_str |
Repositório Institucional da Universidade Federal de Alfenas - RiUnifal |
| repository_id_str |
|
| spelling |
Figueiredo, Nikolas Neves deTeixeira, Josiane MagalhãesBueno Filho, Julio Sílvio de SousaFerreira, Eric Batista2026-02-25T19:25:36Z2026-02-25T19:25:36Z2026-02-19https://repositorio.unifal-mg.edu.br/handle/123456789/3322http://lattes.cnpq.br/3128218938439663http://lattes.cnpq.br/9965398009651936https://orcid.org/0000-0003-4911-7245https://orcid.org/0000-0003-3361-09082023.2.214.002O presente trabalho investiga a aplicação de modelos estatísticos para a previsão de resultados de partidas do Campeonato Brasileiro de Futebol Série A, com ênfase na comparação de desempenho entre diferentes abordagens metodológicas. A motivação do estudo decorre do histórico vínculo entre probabilidade e jogos, bem como do crescente interesse acadêmico e comercial impulsionado pela popularização das apostas esportivas, especialmente por meio de plataformas digitais. Embora a literatura apresente diversas propostas de modelagem para o futebol, observa-se que, na maioria dos casos, as taxas de acerto raramente ultrapassam 60% e, quando o fazem, tendem a perder consistência em aplicações de longo prazo. Foram analisados 35 modelos distintos, originados a partir de dois métodos amplamente reconhecidos na literatura e de variações metodológicas propostas neste trabalho. Os modelos foram avaliados com base em onze métricas, buscando captar as particularidades de cada abordagem. Essas métricas mensuram acurácia, erro, calibração probabilística, nível de complexidade, além de critérios adicionais destinados a aferir robustez e aplicabilidade prática. Uma atenção especial foi dada à parcimônia dos modelos e ao equilíbrio entre simplicidade e desempenho. O estudo também incorporou a análise do impacto de diferentes janelas temporais, definidas em função do número de rodadas anteriores consideradas na geração das previsões. Dessa forma, o desempenho dos modelos variou de acordo com as métricas empregadas, mas alguns se destacaram de forma clara. Entre eles, os modelos UfmgGer e Sd1Ger apresentaram os melhores resultados globais, enquanto o modelo ConTeiMan surpreendeu por sua metodologia extremamente simples aliada a uma elevada taxa de acerto.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior – CAPESThe present study investigates the application of statistical models for predicting the outcomes of matches in the Brazilian Série A Football Championship, with an emphasis on comparing performance across different methodological approaches. The motivation for this research stems from the historical link between probability theory and games, as well as from the growing academic and commercial interest driven by the popularization of sports betting, particularly through digital platforms. Although the literature presents a wide range of modeling proposals for football, it is observed that, in most cases, prediction accuracy rates rarely exceed 60\%, and when they do, they tend to lose consistency in long-term applications. A total of 35 distinct models were analyzed, derived from two methods widely recognized in the literature and from methodological variations proposed in this study. The models were evaluated based on eleven metrics, aiming to capture the specific characteristics of each approach. These metrics assess accuracy, error, probabilistic calibration, and model complexity, in addition to further criteria designed to evaluate robustness and practical applicability. Special attention was given to model parsimony and to the balance between simplicity and performance. The study also incorporated an analysis of the impact of different temporal windows, defined according to the number of previous rounds considered in generating the predictions. As a result, model performance varied depending on the metrics employed, although some models clearly stood out. Among them, the UfmgGer and Sd1Ger models achieved the best overall results, while the ConTeiMan model was notable for its extremely simple methodology combined with a high prediction accuracy.110Termo SEI 1732759Universidade Federal de AlfenasSedeMestrado em Estatística Aplicada e BiometriaPrograma de Pós-Graduação em Estatística Aplicada e BiometriaUNIFAL-MGInstituto de Ciências Exatasinfo:eu-repo/semantics/openAccessCiências Exatas e da TerraPrevisão esportivaAposta esportivaModelagem estatísticaSports forecastingSports bettingStatistical modelingModelagem estatística e o limite da predição no futebol brasileiro: um estudo comparativo de desempenho e parcimôniaStatistical Modeling and the Limits of Prediction in Brazilian Football: A Comparative Study of Performance and Parsimonyinfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersionporreponame:Repositório Institucional da Universidade Federal de Alfenas - RiUnifalinstname:Universidade Federal de Alfenas (UNIFAL)instacron:UNIFALLICENSElicense.txtlicense.txttext/plain; charset=utf-81932https://repositorio.unifal-mg.edu.br/bitstreams/6dde519c-81fd-406f-b830-649344d3f953/download2d55f76c30219ed79a1f28867e1a074dMD52ORIGINALDissertação de Nikolas Neves de Figueiredo.pdfDissertação de Nikolas Neves de Figueiredo.pdfapplication/pdf7739074https://repositorio.unifal-mg.edu.br/bitstreams/95b616a3-061e-4841-8528-fe83e02916ee/download60a83c5595d6b1dfcfc83f185b770e94MD53TEXTDissertação de Nikolas Neves de Figueiredo.pdf.txtDissertação de Nikolas Neves de Figueiredo.pdf.txtExtracted texttext/plain103739https://repositorio.unifal-mg.edu.br/bitstreams/14a664ad-37b1-463d-a9d5-e60dd2d78207/downloadae971397cd671bdaba3309f56348f2b5MD54THUMBNAILDissertação de Nikolas Neves de Figueiredo.pdf.jpgDissertação de Nikolas Neves de Figueiredo.pdf.jpgGenerated Thumbnailimage/jpeg2878https://repositorio.unifal-mg.edu.br/bitstreams/586e5e4f-5047-4411-82ca-d7e9f398fddc/download97abfdbb097ab8484e0562104db7dd0cMD55123456789/33222026-02-26 03:01:11.802open.accessoai:repositorio.unifal-mg.edu.br:123456789/3322https://repositorio.unifal-mg.edu.brRepositório InstitucionalPUBhttps://bdtd.unifal-mg.edu.br:8443/oai/requestrepositorio@unifal-mg.edu.bropendoar:2026-02-26T06:01:11Repositório Institucional da Universidade Federal de Alfenas - RiUnifal - Universidade Federal de Alfenas (UNIFAL)falseTElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy0gRVhDTFVTSVZBCgpBbyBhc3NpbmFyIGUgZW52aWFyIGVzdGEgbGljZW7Dp2EsIHZvY8OqIChhdXRvcihlcykgb3UgcHJvcHJpZXTDoXJpbyBkb3MgZGlyZWl0b3MgYXV0b3JhaXMpIGNvbmNlZGUgw6AgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgQWxmZW5hcyAoVU5JRkFMLU1HKSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZGUgcmVwcm9kdXppciwgY29udmVydGVyIChjb25mb3JtZSBkZWZpbmlkbyBhYmFpeG8pLCBjb211bmljYXIgZS9vdSBkaXN0cmlidWlyIG8gZG9jdW1lbnRvIGVudHJlZ3VlL3N1Ym1ldGlkbyAoaW5jbHVpbmRvIG8gcmVzdW1vKSBlbSB0b2RvIG8gbXVuZG8gZW0gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvLCBtYXMgbsOjbyBzZSBsaW1pdGFuZG8gYSDDoXVkaW8gb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIGEgVU5JRkFMLU1HIHBvZGVyw6EsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCBjb252ZXJ0ZXIgbyBkb2N1bWVudG8gZW50cmVndWUvc3VibWV0aWRvIHBhcmEgcXVhbHF1ZXIgbWVpbyBvdSBmb3JtYXRvIHBhcmEgZmlucyBkZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogdGFtYsOpbSBjb25jb3JkYSBxdWUgYSBVTklGQUwtTUcgcG9kZXLDoSBtYW50ZXIgbWFpcyBkZSB1bWEgY8OzcGlhIGRlc3RlIGRvY3VtZW50byBlbnRyZWd1ZS9zdWJtZXRpZG8gcGFyYSBmaW5zIGRlIHNlZ3VyYW7Dp2EsIGJhY2t1cCBlIHByZXNlcnZhw6fDo28uCgpWb2PDqiBkZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBlbnRyZWd1ZS9zdWJtZXRpZG8gw6kgc2V1IHRyYWJhbGhvIG9yaWdpbmFsIGUgcXVlIHRlbSBvIGRpcmVpdG8gZGUgY29uY2VkZXIgb3MgZGlyZWl0b3MgY29udGlkb3MgbmVzdGEgbGljZW7Dp2EuIFZvY8OqIHRhbWLDqW0gZGVjbGFyYSBxdWUgbyBkb2N1bWVudG8gZW50cmVndWUvc3VibWV0aWRvIG7Do28gaW5mcmluZ2UsIHRhbnRvIHF1YW50byBsaGUgw6kgcG9zc8OtdmVsIHNhYmVyLCBvcyBkaXJlaXRvcyBkZSBxdWFscXVlciBvdXRyYSBwZXNzb2Egb3UgZW50aWRhZGUuCgpTZSBvIGRvY3VtZW50byBlbnRyZWd1ZS9zdWJtZXRpZG8gY29udGl2ZXIgbWF0ZXJpYWwgc29icmUgbyBxdWFsIHZvY8OqIG7Do28gZGV0w6ltIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gcHJvcHJpZXTDoXJpbyBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgcGFyYSBjb25jZWRlciDDoCBVTklGQUwtTUcgb3MgZGlyZWl0b3MgZXhpZ2lkb3MgcG9yIGVzdGEgbGljZW7Dp2EgZSBxdWUgZXNzZSBtYXRlcmlhbCBkZSBwcm9wcmllZGFkZSBkZSB0ZXJjZWlyb3MgZXN0w6EgY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdSBjb250ZcO6ZG8gZG8gZW52aW8uCgpTZSBvIGRvY3VtZW50byBlbnRyZWd1ZS9zdWJtZXRpZG8gw6kgYmFzZWFkbyBlbSB0cmFiYWxobyBmaW5hbmNpYWRvIG91IGFwb2lhZG8gcG9yIG91dHJhIGluc3RpdHVpw6fDo28gcXVlIG7Do28gYSBVTklGQUwtTUcsIHZvY8OqIGRlY2xhcmEgcXVlIGN1bXByaXUgcXVhaXNxdWVyIG9icmlnYcOnw7VlcyBleGlnaWRhcyBwZWxvIHJlc3BlY3Rpdm8gY29udHJhdG8gb3UgYWNvcmRvLgoKQSBVTklGQUwtTUcgc2UgY29tcHJvbWV0ZSBhIGlkZW50aWZpY2FyIGNsYXJhbWVudGUgc2V1IChzKSBub21lIChzKSBjb21vIG8gKHMpIGF1dG9yIChlcykgb3UgZGV0ZW50b3IgKGVzKSBkb3MgZGlyZWl0b3MgZG8gZG9jdW1lbnRvIGVudHJlZ3VlL3N1Ym1ldGlkbywgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBwYXJhIGFsw6ltIGRhcyBwZXJtaXRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgoK |
| dc.title.none.fl_str_mv |
Modelagem estatística e o limite da predição no futebol brasileiro: um estudo comparativo de desempenho e parcimônia |
| dc.title.alternative.none.fl_str_mv |
Statistical Modeling and the Limits of Prediction in Brazilian Football: A Comparative Study of Performance and Parsimony |
| title |
Modelagem estatística e o limite da predição no futebol brasileiro: um estudo comparativo de desempenho e parcimônia |
| spellingShingle |
Modelagem estatística e o limite da predição no futebol brasileiro: um estudo comparativo de desempenho e parcimônia Figueiredo, Nikolas Neves de Ciências Exatas e da Terra Previsão esportiva Aposta esportiva Modelagem estatística Sports forecasting Sports betting Statistical modeling |
| title_short |
Modelagem estatística e o limite da predição no futebol brasileiro: um estudo comparativo de desempenho e parcimônia |
| title_full |
Modelagem estatística e o limite da predição no futebol brasileiro: um estudo comparativo de desempenho e parcimônia |
| title_fullStr |
Modelagem estatística e o limite da predição no futebol brasileiro: um estudo comparativo de desempenho e parcimônia |
| title_full_unstemmed |
Modelagem estatística e o limite da predição no futebol brasileiro: um estudo comparativo de desempenho e parcimônia |
| title_sort |
Modelagem estatística e o limite da predição no futebol brasileiro: um estudo comparativo de desempenho e parcimônia |
| author |
Figueiredo, Nikolas Neves de |
| author_facet |
Figueiredo, Nikolas Neves de |
| author_role |
author |
| dc.contributor.referee.none.fl_str_mv |
Teixeira, Josiane Magalhães Bueno Filho, Julio Sílvio de Sousa |
| dc.contributor.author.fl_str_mv |
Figueiredo, Nikolas Neves de |
| dc.contributor.advisor1.fl_str_mv |
Ferreira, Eric Batista |
| contributor_str_mv |
Ferreira, Eric Batista |
| dc.subject.cnpq.fl_str_mv |
Ciências Exatas e da Terra |
| topic |
Ciências Exatas e da Terra Previsão esportiva Aposta esportiva Modelagem estatística Sports forecasting Sports betting Statistical modeling |
| dc.subject.pt-BR.none.fl_str_mv |
Previsão esportiva Aposta esportiva Modelagem estatística |
| dc.subject.en.none.fl_str_mv |
Sports forecasting Sports betting Statistical modeling |
| description |
O presente trabalho investiga a aplicação de modelos estatísticos para a previsão de resultados de partidas do Campeonato Brasileiro de Futebol Série A, com ênfase na comparação de desempenho entre diferentes abordagens metodológicas. A motivação do estudo decorre do histórico vínculo entre probabilidade e jogos, bem como do crescente interesse acadêmico e comercial impulsionado pela popularização das apostas esportivas, especialmente por meio de plataformas digitais. Embora a literatura apresente diversas propostas de modelagem para o futebol, observa-se que, na maioria dos casos, as taxas de acerto raramente ultrapassam 60% e, quando o fazem, tendem a perder consistência em aplicações de longo prazo. Foram analisados 35 modelos distintos, originados a partir de dois métodos amplamente reconhecidos na literatura e de variações metodológicas propostas neste trabalho. Os modelos foram avaliados com base em onze métricas, buscando captar as particularidades de cada abordagem. Essas métricas mensuram acurácia, erro, calibração probabilística, nível de complexidade, além de critérios adicionais destinados a aferir robustez e aplicabilidade prática. Uma atenção especial foi dada à parcimônia dos modelos e ao equilíbrio entre simplicidade e desempenho. O estudo também incorporou a análise do impacto de diferentes janelas temporais, definidas em função do número de rodadas anteriores consideradas na geração das previsões. Dessa forma, o desempenho dos modelos variou de acordo com as métricas empregadas, mas alguns se destacaram de forma clara. Entre eles, os modelos UfmgGer e Sd1Ger apresentaram os melhores resultados globais, enquanto o modelo ConTeiMan surpreendeu por sua metodologia extremamente simples aliada a uma elevada taxa de acerto. |
| publishDate |
2026 |
| dc.date.accessioned.fl_str_mv |
2026-02-25T19:25:36Z |
| dc.date.available.fl_str_mv |
2026-02-25T19:25:36Z |
| dc.date.issued.fl_str_mv |
2026-02-19 |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://repositorio.unifal-mg.edu.br/handle/123456789/3322 |
| dc.identifier.lattesAuthor.none.fl_str_mv |
http://lattes.cnpq.br/3128218938439663 |
| dc.identifier.lattesAdvisor.none.fl_str_mv |
http://lattes.cnpq.br/9965398009651936 |
| dc.identifier.orcidAuthor.none.fl_str_mv |
https://orcid.org/0000-0003-4911-7245 |
| dc.identifier.orcidAdvisor.none.fl_str_mv |
https://orcid.org/0000-0003-3361-0908 |
| dc.identifier.credential.none.fl_str_mv |
2023.2.214.002 |
| url |
https://repositorio.unifal-mg.edu.br/handle/123456789/3322 http://lattes.cnpq.br/3128218938439663 http://lattes.cnpq.br/9965398009651936 https://orcid.org/0000-0003-4911-7245 https://orcid.org/0000-0003-3361-0908 |
| identifier_str_mv |
2023.2.214.002 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal de Alfenas Sede Mestrado em Estatística Aplicada e Biometria |
| dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Estatística Aplicada e Biometria |
| dc.publisher.initials.fl_str_mv |
UNIFAL-MG |
| dc.publisher.department.fl_str_mv |
Instituto de Ciências Exatas |
| publisher.none.fl_str_mv |
Universidade Federal de Alfenas Sede Mestrado em Estatística Aplicada e Biometria |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Universidade Federal de Alfenas - RiUnifal instname:Universidade Federal de Alfenas (UNIFAL) instacron:UNIFAL |
| instname_str |
Universidade Federal de Alfenas (UNIFAL) |
| instacron_str |
UNIFAL |
| institution |
UNIFAL |
| reponame_str |
Repositório Institucional da Universidade Federal de Alfenas - RiUnifal |
| collection |
Repositório Institucional da Universidade Federal de Alfenas - RiUnifal |
| bitstream.url.fl_str_mv |
https://repositorio.unifal-mg.edu.br/bitstreams/6dde519c-81fd-406f-b830-649344d3f953/download https://repositorio.unifal-mg.edu.br/bitstreams/95b616a3-061e-4841-8528-fe83e02916ee/download https://repositorio.unifal-mg.edu.br/bitstreams/14a664ad-37b1-463d-a9d5-e60dd2d78207/download https://repositorio.unifal-mg.edu.br/bitstreams/586e5e4f-5047-4411-82ca-d7e9f398fddc/download |
| bitstream.checksum.fl_str_mv |
2d55f76c30219ed79a1f28867e1a074d 60a83c5595d6b1dfcfc83f185b770e94 ae971397cd671bdaba3309f56348f2b5 97abfdbb097ab8484e0562104db7dd0c |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da Universidade Federal de Alfenas - RiUnifal - Universidade Federal de Alfenas (UNIFAL) |
| repository.mail.fl_str_mv |
repositorio@unifal-mg.edu.br |
| _version_ |
1859830902652141568 |