Modelagem estatística e o limite da predição no futebol brasileiro: um estudo comparativo de desempenho e parcimônia

Detalhes bibliográficos
Ano de defesa: 2026
Autor(a) principal: Figueiredo, Nikolas Neves de
Orientador(a): Ferreira, Eric Batista
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Alfenas
Sede
Mestrado em Estatística Aplicada e Biometria
Programa de Pós-Graduação: Programa de Pós-Graduação em Estatística Aplicada e Biometria
Departamento: Instituto de Ciências Exatas
País: Não Informado pela instituição
Área do conhecimento CNPq:
Link de acesso: https://repositorio.unifal-mg.edu.br/handle/123456789/3322
http://lattes.cnpq.br/3128218938439663
http://lattes.cnpq.br/9965398009651936
https://orcid.org/0000-0003-4911-7245
https://orcid.org/0000-0003-3361-0908
Resumo: O presente trabalho investiga a aplicação de modelos estatísticos para a previsão de resultados de partidas do Campeonato Brasileiro de Futebol Série A, com ênfase na comparação de desempenho entre diferentes abordagens metodológicas. A motivação do estudo decorre do histórico vínculo entre probabilidade e jogos, bem como do crescente interesse acadêmico e comercial impulsionado pela popularização das apostas esportivas, especialmente por meio de plataformas digitais. Embora a literatura apresente diversas propostas de modelagem para o futebol, observa-se que, na maioria dos casos, as taxas de acerto raramente ultrapassam 60% e, quando o fazem, tendem a perder consistência em aplicações de longo prazo. Foram analisados 35 modelos distintos, originados a partir de dois métodos amplamente reconhecidos na literatura e de variações metodológicas propostas neste trabalho. Os modelos foram avaliados com base em onze métricas, buscando captar as particularidades de cada abordagem. Essas métricas mensuram acurácia, erro, calibração probabilística, nível de complexidade, além de critérios adicionais destinados a aferir robustez e aplicabilidade prática. Uma atenção especial foi dada à parcimônia dos modelos e ao equilíbrio entre simplicidade e desempenho. O estudo também incorporou a análise do impacto de diferentes janelas temporais, definidas em função do número de rodadas anteriores consideradas na geração das previsões. Dessa forma, o desempenho dos modelos variou de acordo com as métricas empregadas, mas alguns se destacaram de forma clara. Entre eles, os modelos UfmgGer e Sd1Ger apresentaram os melhores resultados globais, enquanto o modelo ConTeiMan surpreendeu por sua metodologia extremamente simples aliada a uma elevada taxa de acerto.
id UNIFAL_5d82fc1133607e6c5d03e91c4237b35b
oai_identifier_str oai:repositorio.unifal-mg.edu.br:123456789/3322
network_acronym_str UNIFAL
network_name_str Repositório Institucional da Universidade Federal de Alfenas - RiUnifal
repository_id_str
spelling Figueiredo, Nikolas Neves deTeixeira, Josiane MagalhãesBueno Filho, Julio Sílvio de SousaFerreira, Eric Batista2026-02-25T19:25:36Z2026-02-25T19:25:36Z2026-02-19https://repositorio.unifal-mg.edu.br/handle/123456789/3322http://lattes.cnpq.br/3128218938439663http://lattes.cnpq.br/9965398009651936https://orcid.org/0000-0003-4911-7245https://orcid.org/0000-0003-3361-09082023.2.214.002O presente trabalho investiga a aplicação de modelos estatísticos para a previsão de resultados de partidas do Campeonato Brasileiro de Futebol Série A, com ênfase na comparação de desempenho entre diferentes abordagens metodológicas. A motivação do estudo decorre do histórico vínculo entre probabilidade e jogos, bem como do crescente interesse acadêmico e comercial impulsionado pela popularização das apostas esportivas, especialmente por meio de plataformas digitais. Embora a literatura apresente diversas propostas de modelagem para o futebol, observa-se que, na maioria dos casos, as taxas de acerto raramente ultrapassam 60% e, quando o fazem, tendem a perder consistência em aplicações de longo prazo. Foram analisados 35 modelos distintos, originados a partir de dois métodos amplamente reconhecidos na literatura e de variações metodológicas propostas neste trabalho. Os modelos foram avaliados com base em onze métricas, buscando captar as particularidades de cada abordagem. Essas métricas mensuram acurácia, erro, calibração probabilística, nível de complexidade, além de critérios adicionais destinados a aferir robustez e aplicabilidade prática. Uma atenção especial foi dada à parcimônia dos modelos e ao equilíbrio entre simplicidade e desempenho. O estudo também incorporou a análise do impacto de diferentes janelas temporais, definidas em função do número de rodadas anteriores consideradas na geração das previsões. Dessa forma, o desempenho dos modelos variou de acordo com as métricas empregadas, mas alguns se destacaram de forma clara. Entre eles, os modelos UfmgGer e Sd1Ger apresentaram os melhores resultados globais, enquanto o modelo ConTeiMan surpreendeu por sua metodologia extremamente simples aliada a uma elevada taxa de acerto.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior – CAPESThe present study investigates the application of statistical models for predicting the outcomes of matches in the Brazilian Série A Football Championship, with an emphasis on comparing performance across different methodological approaches. The motivation for this research stems from the historical link between probability theory and games, as well as from the growing academic and commercial interest driven by the popularization of sports betting, particularly through digital platforms. Although the literature presents a wide range of modeling proposals for football, it is observed that, in most cases, prediction accuracy rates rarely exceed 60\%, and when they do, they tend to lose consistency in long-term applications. A total of 35 distinct models were analyzed, derived from two methods widely recognized in the literature and from methodological variations proposed in this study. The models were evaluated based on eleven metrics, aiming to capture the specific characteristics of each approach. These metrics assess accuracy, error, probabilistic calibration, and model complexity, in addition to further criteria designed to evaluate robustness and practical applicability. Special attention was given to model parsimony and to the balance between simplicity and performance. The study also incorporated an analysis of the impact of different temporal windows, defined according to the number of previous rounds considered in generating the predictions. As a result, model performance varied depending on the metrics employed, although some models clearly stood out. Among them, the UfmgGer and Sd1Ger models achieved the best overall results, while the ConTeiMan model was notable for its extremely simple methodology combined with a high prediction accuracy.110Termo SEI 1732759Universidade Federal de AlfenasSedeMestrado em Estatística Aplicada e BiometriaPrograma de Pós-Graduação em Estatística Aplicada e BiometriaUNIFAL-MGInstituto de Ciências Exatasinfo:eu-repo/semantics/openAccessCiências Exatas e da TerraPrevisão esportivaAposta esportivaModelagem estatísticaSports forecastingSports bettingStatistical modelingModelagem estatística e o limite da predição no futebol brasileiro: um estudo comparativo de desempenho e parcimôniaStatistical Modeling and the Limits of Prediction in Brazilian Football: A Comparative Study of Performance and Parsimonyinfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersionporreponame:Repositório Institucional da Universidade Federal de Alfenas - RiUnifalinstname:Universidade Federal de Alfenas (UNIFAL)instacron:UNIFALLICENSElicense.txtlicense.txttext/plain; charset=utf-81932https://repositorio.unifal-mg.edu.br/bitstreams/6dde519c-81fd-406f-b830-649344d3f953/download2d55f76c30219ed79a1f28867e1a074dMD52ORIGINALDissertação de Nikolas Neves de Figueiredo.pdfDissertação de Nikolas Neves de Figueiredo.pdfapplication/pdf7739074https://repositorio.unifal-mg.edu.br/bitstreams/95b616a3-061e-4841-8528-fe83e02916ee/download60a83c5595d6b1dfcfc83f185b770e94MD53TEXTDissertação de Nikolas Neves de Figueiredo.pdf.txtDissertação de Nikolas Neves de Figueiredo.pdf.txtExtracted texttext/plain103739https://repositorio.unifal-mg.edu.br/bitstreams/14a664ad-37b1-463d-a9d5-e60dd2d78207/downloadae971397cd671bdaba3309f56348f2b5MD54THUMBNAILDissertação de Nikolas Neves de Figueiredo.pdf.jpgDissertação de Nikolas Neves de Figueiredo.pdf.jpgGenerated Thumbnailimage/jpeg2878https://repositorio.unifal-mg.edu.br/bitstreams/586e5e4f-5047-4411-82ca-d7e9f398fddc/download97abfdbb097ab8484e0562104db7dd0cMD55123456789/33222026-02-26 03:01:11.802open.accessoai:repositorio.unifal-mg.edu.br:123456789/3322https://repositorio.unifal-mg.edu.brRepositório InstitucionalPUBhttps://bdtd.unifal-mg.edu.br:8443/oai/requestrepositorio@unifal-mg.edu.bropendoar:2026-02-26T06:01:11Repositório Institucional da Universidade Federal de Alfenas - RiUnifal - Universidade Federal de Alfenas (UNIFAL)falseTElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy0gRVhDTFVTSVZBCgpBbyBhc3NpbmFyIGUgZW52aWFyIGVzdGEgbGljZW7Dp2EsIHZvY8OqIChhdXRvcihlcykgb3UgcHJvcHJpZXTDoXJpbyBkb3MgZGlyZWl0b3MgYXV0b3JhaXMpIGNvbmNlZGUgw6AgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgQWxmZW5hcyAoVU5JRkFMLU1HKSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZGUgcmVwcm9kdXppciwgY29udmVydGVyIChjb25mb3JtZSBkZWZpbmlkbyBhYmFpeG8pLCBjb211bmljYXIgZS9vdSBkaXN0cmlidWlyIG8gZG9jdW1lbnRvIGVudHJlZ3VlL3N1Ym1ldGlkbyAoaW5jbHVpbmRvIG8gcmVzdW1vKSBlbSB0b2RvIG8gbXVuZG8gZW0gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvLCBtYXMgbsOjbyBzZSBsaW1pdGFuZG8gYSDDoXVkaW8gb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIGEgVU5JRkFMLU1HIHBvZGVyw6EsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCBjb252ZXJ0ZXIgbyBkb2N1bWVudG8gZW50cmVndWUvc3VibWV0aWRvIHBhcmEgcXVhbHF1ZXIgbWVpbyBvdSBmb3JtYXRvIHBhcmEgZmlucyBkZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogdGFtYsOpbSBjb25jb3JkYSBxdWUgYSBVTklGQUwtTUcgcG9kZXLDoSBtYW50ZXIgbWFpcyBkZSB1bWEgY8OzcGlhIGRlc3RlIGRvY3VtZW50byBlbnRyZWd1ZS9zdWJtZXRpZG8gcGFyYSBmaW5zIGRlIHNlZ3VyYW7Dp2EsIGJhY2t1cCBlIHByZXNlcnZhw6fDo28uCgpWb2PDqiBkZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBlbnRyZWd1ZS9zdWJtZXRpZG8gw6kgc2V1IHRyYWJhbGhvIG9yaWdpbmFsIGUgcXVlIHRlbSBvIGRpcmVpdG8gZGUgY29uY2VkZXIgb3MgZGlyZWl0b3MgY29udGlkb3MgbmVzdGEgbGljZW7Dp2EuIFZvY8OqIHRhbWLDqW0gZGVjbGFyYSBxdWUgbyBkb2N1bWVudG8gZW50cmVndWUvc3VibWV0aWRvIG7Do28gaW5mcmluZ2UsIHRhbnRvIHF1YW50byBsaGUgw6kgcG9zc8OtdmVsIHNhYmVyLCBvcyBkaXJlaXRvcyBkZSBxdWFscXVlciBvdXRyYSBwZXNzb2Egb3UgZW50aWRhZGUuCgpTZSBvIGRvY3VtZW50byBlbnRyZWd1ZS9zdWJtZXRpZG8gY29udGl2ZXIgbWF0ZXJpYWwgc29icmUgbyBxdWFsIHZvY8OqIG7Do28gZGV0w6ltIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gcHJvcHJpZXTDoXJpbyBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgcGFyYSBjb25jZWRlciDDoCBVTklGQUwtTUcgb3MgZGlyZWl0b3MgZXhpZ2lkb3MgcG9yIGVzdGEgbGljZW7Dp2EgZSBxdWUgZXNzZSBtYXRlcmlhbCBkZSBwcm9wcmllZGFkZSBkZSB0ZXJjZWlyb3MgZXN0w6EgY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdSBjb250ZcO6ZG8gZG8gZW52aW8uCgpTZSBvIGRvY3VtZW50byBlbnRyZWd1ZS9zdWJtZXRpZG8gw6kgYmFzZWFkbyBlbSB0cmFiYWxobyBmaW5hbmNpYWRvIG91IGFwb2lhZG8gcG9yIG91dHJhIGluc3RpdHVpw6fDo28gcXVlIG7Do28gYSBVTklGQUwtTUcsIHZvY8OqIGRlY2xhcmEgcXVlIGN1bXByaXUgcXVhaXNxdWVyIG9icmlnYcOnw7VlcyBleGlnaWRhcyBwZWxvIHJlc3BlY3Rpdm8gY29udHJhdG8gb3UgYWNvcmRvLgoKQSBVTklGQUwtTUcgc2UgY29tcHJvbWV0ZSBhIGlkZW50aWZpY2FyIGNsYXJhbWVudGUgc2V1IChzKSBub21lIChzKSBjb21vIG8gKHMpIGF1dG9yIChlcykgb3UgZGV0ZW50b3IgKGVzKSBkb3MgZGlyZWl0b3MgZG8gZG9jdW1lbnRvIGVudHJlZ3VlL3N1Ym1ldGlkbywgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBwYXJhIGFsw6ltIGRhcyBwZXJtaXRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgoK
dc.title.none.fl_str_mv Modelagem estatística e o limite da predição no futebol brasileiro: um estudo comparativo de desempenho e parcimônia
dc.title.alternative.none.fl_str_mv Statistical Modeling and the Limits of Prediction in Brazilian Football: A Comparative Study of Performance and Parsimony
title Modelagem estatística e o limite da predição no futebol brasileiro: um estudo comparativo de desempenho e parcimônia
spellingShingle Modelagem estatística e o limite da predição no futebol brasileiro: um estudo comparativo de desempenho e parcimônia
Figueiredo, Nikolas Neves de
Ciências Exatas e da Terra
Previsão esportiva
Aposta esportiva
Modelagem estatística
Sports forecasting
Sports betting
Statistical modeling
title_short Modelagem estatística e o limite da predição no futebol brasileiro: um estudo comparativo de desempenho e parcimônia
title_full Modelagem estatística e o limite da predição no futebol brasileiro: um estudo comparativo de desempenho e parcimônia
title_fullStr Modelagem estatística e o limite da predição no futebol brasileiro: um estudo comparativo de desempenho e parcimônia
title_full_unstemmed Modelagem estatística e o limite da predição no futebol brasileiro: um estudo comparativo de desempenho e parcimônia
title_sort Modelagem estatística e o limite da predição no futebol brasileiro: um estudo comparativo de desempenho e parcimônia
author Figueiredo, Nikolas Neves de
author_facet Figueiredo, Nikolas Neves de
author_role author
dc.contributor.referee.none.fl_str_mv Teixeira, Josiane Magalhães
Bueno Filho, Julio Sílvio de Sousa
dc.contributor.author.fl_str_mv Figueiredo, Nikolas Neves de
dc.contributor.advisor1.fl_str_mv Ferreira, Eric Batista
contributor_str_mv Ferreira, Eric Batista
dc.subject.cnpq.fl_str_mv Ciências Exatas e da Terra
topic Ciências Exatas e da Terra
Previsão esportiva
Aposta esportiva
Modelagem estatística
Sports forecasting
Sports betting
Statistical modeling
dc.subject.pt-BR.none.fl_str_mv Previsão esportiva
Aposta esportiva
Modelagem estatística
dc.subject.en.none.fl_str_mv Sports forecasting
Sports betting
Statistical modeling
description O presente trabalho investiga a aplicação de modelos estatísticos para a previsão de resultados de partidas do Campeonato Brasileiro de Futebol Série A, com ênfase na comparação de desempenho entre diferentes abordagens metodológicas. A motivação do estudo decorre do histórico vínculo entre probabilidade e jogos, bem como do crescente interesse acadêmico e comercial impulsionado pela popularização das apostas esportivas, especialmente por meio de plataformas digitais. Embora a literatura apresente diversas propostas de modelagem para o futebol, observa-se que, na maioria dos casos, as taxas de acerto raramente ultrapassam 60% e, quando o fazem, tendem a perder consistência em aplicações de longo prazo. Foram analisados 35 modelos distintos, originados a partir de dois métodos amplamente reconhecidos na literatura e de variações metodológicas propostas neste trabalho. Os modelos foram avaliados com base em onze métricas, buscando captar as particularidades de cada abordagem. Essas métricas mensuram acurácia, erro, calibração probabilística, nível de complexidade, além de critérios adicionais destinados a aferir robustez e aplicabilidade prática. Uma atenção especial foi dada à parcimônia dos modelos e ao equilíbrio entre simplicidade e desempenho. O estudo também incorporou a análise do impacto de diferentes janelas temporais, definidas em função do número de rodadas anteriores consideradas na geração das previsões. Dessa forma, o desempenho dos modelos variou de acordo com as métricas empregadas, mas alguns se destacaram de forma clara. Entre eles, os modelos UfmgGer e Sd1Ger apresentaram os melhores resultados globais, enquanto o modelo ConTeiMan surpreendeu por sua metodologia extremamente simples aliada a uma elevada taxa de acerto.
publishDate 2026
dc.date.accessioned.fl_str_mv 2026-02-25T19:25:36Z
dc.date.available.fl_str_mv 2026-02-25T19:25:36Z
dc.date.issued.fl_str_mv 2026-02-19
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.unifal-mg.edu.br/handle/123456789/3322
dc.identifier.lattesAuthor.none.fl_str_mv http://lattes.cnpq.br/3128218938439663
dc.identifier.lattesAdvisor.none.fl_str_mv http://lattes.cnpq.br/9965398009651936
dc.identifier.orcidAuthor.none.fl_str_mv https://orcid.org/0000-0003-4911-7245
dc.identifier.orcidAdvisor.none.fl_str_mv https://orcid.org/0000-0003-3361-0908
dc.identifier.credential.none.fl_str_mv 2023.2.214.002
url https://repositorio.unifal-mg.edu.br/handle/123456789/3322
http://lattes.cnpq.br/3128218938439663
http://lattes.cnpq.br/9965398009651936
https://orcid.org/0000-0003-4911-7245
https://orcid.org/0000-0003-3361-0908
identifier_str_mv 2023.2.214.002
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Alfenas
Sede
Mestrado em Estatística Aplicada e Biometria
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Estatística Aplicada e Biometria
dc.publisher.initials.fl_str_mv UNIFAL-MG
dc.publisher.department.fl_str_mv Instituto de Ciências Exatas
publisher.none.fl_str_mv Universidade Federal de Alfenas
Sede
Mestrado em Estatística Aplicada e Biometria
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal de Alfenas - RiUnifal
instname:Universidade Federal de Alfenas (UNIFAL)
instacron:UNIFAL
instname_str Universidade Federal de Alfenas (UNIFAL)
instacron_str UNIFAL
institution UNIFAL
reponame_str Repositório Institucional da Universidade Federal de Alfenas - RiUnifal
collection Repositório Institucional da Universidade Federal de Alfenas - RiUnifal
bitstream.url.fl_str_mv https://repositorio.unifal-mg.edu.br/bitstreams/6dde519c-81fd-406f-b830-649344d3f953/download
https://repositorio.unifal-mg.edu.br/bitstreams/95b616a3-061e-4841-8528-fe83e02916ee/download
https://repositorio.unifal-mg.edu.br/bitstreams/14a664ad-37b1-463d-a9d5-e60dd2d78207/download
https://repositorio.unifal-mg.edu.br/bitstreams/586e5e4f-5047-4411-82ca-d7e9f398fddc/download
bitstream.checksum.fl_str_mv 2d55f76c30219ed79a1f28867e1a074d
60a83c5595d6b1dfcfc83f185b770e94
ae971397cd671bdaba3309f56348f2b5
97abfdbb097ab8484e0562104db7dd0c
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da Universidade Federal de Alfenas - RiUnifal - Universidade Federal de Alfenas (UNIFAL)
repository.mail.fl_str_mv repositorio@unifal-mg.edu.br
_version_ 1859830902652141568