Revisitando a estimação de coeficiente de determinação

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Pala, Luiz Otávio De Oliveira
Orientador(a): Ferreira, Eric Batista
Banca de defesa: Pereira, Gislene Araújo, Silva, Washington Santos Da, Pascoa, Marcelino Alves Rosa De
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Alfenas
Programa de Pós-Graduação: Programa de Pós-Graduação em Estatística Aplicada e Biometria
Departamento: Instituto de Ciências Exatas
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.unifal-mg.edu.br/handle/123456789/1419
Resumo: The coefficient of determination (R2) is a widely used metric to analyze the quality of adjustment of linear models. This coefficient assumes values in the range between 0 and 1, so that the closer to 1, most of the capacity variation is being explained by the model. R2 is treated with caution in the literature, as it can be biased in models with few observations or inflated when covariates are added to the model. In this sense, authors suggest treating it as a statistic that estimates a population parameter ( 2), which is understood as the quality of fit that a model would have if the infinite observations of the phenomenon were to be collected. Thus, we study the estimation of the parametric coefficient of determination ( 2) from five parametric interval estimators. For comparison, a Monte Carlo simulation study was performed, computing precision and accuracy in the different combinations to model the number of model variables (k), sample size (n) and the value of the parameter ( 2). The results allowed the recommendation of the best estimator for each region of the parametric space. Thus, it was found that the proposed estimators presented similar quality to those indicated in the literature in the parametric space. Finally, an R package was built, allowing the user to estimate the quality of the model using the best performing estimator.
id UNIFAL_f3e21e02ca6a2623c1029837dc4668f9
oai_identifier_str oai:repositorio.unifal-mg.edu.br:123456789/1419
network_acronym_str UNIFAL
network_name_str Biblioteca Digital de Teses e Dissertações da UNIFAL
repository_id_str
spelling Pala, Luiz Otávio De OliveiraGomes, Davi ButturiPereira, Gislene AraújoSilva, Washington Santos DaPascoa, Marcelino Alves Rosa DeFerreira, Eric Batista2019-09-20T19:28:42Z2019-09-06PALA, Luiz Otávio de Oliveira. Revisitando a estimação de coeficiente de determinação. 2019. 112 f. Dissertação (Mestrado em Estatística Aplicada e Biometria) - Universidade Federal de Alfenas, Alfenas, MG, 2019.https://repositorio.unifal-mg.edu.br/handle/123456789/1419The coefficient of determination (R2) is a widely used metric to analyze the quality of adjustment of linear models. This coefficient assumes values in the range between 0 and 1, so that the closer to 1, most of the capacity variation is being explained by the model. R2 is treated with caution in the literature, as it can be biased in models with few observations or inflated when covariates are added to the model. In this sense, authors suggest treating it as a statistic that estimates a population parameter ( 2), which is understood as the quality of fit that a model would have if the infinite observations of the phenomenon were to be collected. Thus, we study the estimation of the parametric coefficient of determination ( 2) from five parametric interval estimators. For comparison, a Monte Carlo simulation study was performed, computing precision and accuracy in the different combinations to model the number of model variables (k), sample size (n) and the value of the parameter ( 2). The results allowed the recommendation of the best estimator for each region of the parametric space. Thus, it was found that the proposed estimators presented similar quality to those indicated in the literature in the parametric space. Finally, an R package was built, allowing the user to estimate the quality of the model using the best performing estimator.O coeficiente de determinação (R2) é uma métrica muito utilizada para a análise de qualidade de ajuste de modelos lineares. Este coeficiente assume valores no intervalo entre 0 e 1, de modo que quanto mais próximo de 1, maior parte da variação da variável resposta está sendo explicada pelo modelo. Há outras métricas com o mesmo objetivo, como o coeficiente de determinação ajustado, o erro absoluto e erro quadrático médio, por exemplo. Mesmo sendo muito utilizado, o R2 é tratado com cautela na literatura, pois este pode ser viesado em modelos com poucas observações ou inflacionado quando se acrescentam covariáveis ao modelo. Neste sentido, autores sugerem tratá-lo como uma estatística que estima um parâmetro populacional ( 2), sendo este entendido como a qualidade de ajuste que um modelo possuiria se as infinitas observações do fenômeno viessem a ser coletadas. Desta forma, sendo 2 um parâmetro e R2 um estimador pontual, é natural pensar em estimação intervalar e testes de hipóteses para possibilitar a tomada de decisão sobre a adequação do modelo candidato ao fenômeno no qual deseja-se descrever. Entretanto, essa questão inferencial ainda não é considerada fechada na literatura, pois autores discutem distribuições de probabilidade para a modelagem deste em diferentes cenários e regiões do espaço paramétrico. Desta forma, este trabalho estudou a estimação do coeficiente de determinação paramétrico ( 2) a partir de cinco estimadores intervalares paramétricos. Para compará-los, foi realizado um estudo de simulação Monte Carlo, computando precisão e acurácia em diferentes cenários compostos pela combinação do número de covariáveis do modelo (k), tamanho amostral (n) e o verdadeiro valor paramétrico ( 2). Em conjunto a isso, elaborouse um índice de desempenho de estimação intervalar que valoriza simultaneamente precisão e acurácia com importâncias relativas previamente fixadas. Os resultados permitiram a recomendação do melhor estimador para cada região do espaço paramétrico. Com isso, verificou-se que os estimadores propostos apresentaram qualidade similar aos indicados na literatura ao longo do espaço paramétrico. Por fim, foi construído um pacote R, possibilitando que o usuário estime de forma intervalar a qualidade do ajuste utilizando o estimador com melhor desempenho.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESapplication/pdfporUniversidade Federal de AlfenasPrograma de Pós-Graduação em Estatística Aplicada e BiometriaUNIFAL-MGBrasilInstituto de Ciências Exatasinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/4.0/Intervalos de ConfiançaEstatística como AssuntoMétodo de Monte CarloPROBABILIDADE E ESTATISTICA::PROBABILIDADE E ESTATISTICA APLICADASRevisitando a estimação de coeficiente de determinaçãoinfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersion-8156311678363143599600600600-21048508539903632002075167498588264571reponame:Biblioteca Digital de Teses e Dissertações da UNIFALinstname:Universidade Federal de Alfenas (UNIFAL)instacron:UNIFALPala, Luiz Otávio De OliveiraLICENSElicense.txtlicense.txttext/plain; charset=utf-81987https://repositorio.unifal-mg.edu.br/bitstreams/9f64e4d5-12f4-47b9-a521-86549994cd39/download31555718c4fc75849dd08f27935d4f6bMD51CC-LICENSElicense_urllicense_urltext/plain; charset=utf-849https://repositorio.unifal-mg.edu.br/bitstreams/7ba8f920-ed43-4ebc-b618-c7306b6c7f2d/download4afdbb8c545fd630ea7db775da747b2fMD52license_textlicense_texttext/html; charset=utf-80https://repositorio.unifal-mg.edu.br/bitstreams/a1a9f6bd-97f4-47a8-a140-2071d2956300/downloadd41d8cd98f00b204e9800998ecf8427eMD53license_rdflicense_rdfapplication/rdf+xml; charset=utf-80https://repositorio.unifal-mg.edu.br/bitstreams/50fed7d0-2a19-4e7c-910d-a0a72bd197c8/downloadd41d8cd98f00b204e9800998ecf8427eMD54ORIGINALDissertação de Luiz Otávio de Oliveira Pala.pdfDissertação de Luiz Otávio de Oliveira Pala.pdfapplication/pdf3367699https://repositorio.unifal-mg.edu.br/bitstreams/0bb4651e-3b8e-43af-88bd-20ec938268ab/download1329671f744993dd24088e6f2d279057MD55TEXTDissertação de Luiz Otávio de Oliveira Pala.pdf.txtDissertação de Luiz Otávio de Oliveira Pala.pdf.txtExtracted texttext/plain103576https://repositorio.unifal-mg.edu.br/bitstreams/9961cf7d-55b4-4851-b9b7-a586ff577671/download47102641f8ed28b1a8f8b36a9dd6f569MD56THUMBNAILDissertação de Luiz Otávio de Oliveira Pala.pdf.jpgDissertação de Luiz Otávio de Oliveira Pala.pdf.jpgGenerated Thumbnailimage/jpeg2563https://repositorio.unifal-mg.edu.br/bitstreams/3a65d7e9-4c17-4df4-aac4-0676e215bca0/downloadc2b627114695eac04f003fd0512d93c6MD57123456789/14192025-04-14 17:32:43.722http://creativecommons.org/licenses/by-nc-nd/4.0/open.accessoai:repositorio.unifal-mg.edu.br:123456789/1419https://repositorio.unifal-mg.edu.brBiblioteca Digital de Teses e DissertaçõesPUBhttps://bdtd.unifal-mg.edu.br:8443/oai/requestbdtd@unifal-mg.edu.br || bdtd@unifal-mg.edu.bropendoar:2025-04-14T20:32:43Biblioteca Digital de Teses e Dissertações da UNIFAL - Universidade Federal de Alfenas (UNIFAL)falseTElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCBvIGF1dG9yIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IgY29uY2VkZSDDoCBVbml2ZXJzaWRhZGUgCkZlZGVyYWwgZGUgQWxmZW5hcyAgKFVOSUZBTC1NRykgbyBkaXJlaXRvIG7Do28tZXhjbHVzaXZvIGRlIHJlcHJvZHV6aXIsICB0cmFkdXppciAoY29uZm9ybWUgZGVmaW5pZG8gYWJhaXhvKSwgZS9vdSAKZGlzdHJpYnVpciBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gKGluY2x1aW5kbyBvIHJlc3VtbykgcG9yIHRvZG8gbyBtdW5kbyBubyBmb3JtYXRvIGltcHJlc3NvIGUgZWxldHLDtG5pY28gZSAKZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIGZvcm1hdG9zIMOhdWRpbyBvdSB2w61kZW8uCgpWb2PDqiBjb25jb3JkYSBxdWUgYSBVTklGQUwtTUcgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIHRyYW5zcG9yIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyAKcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBhICBVTklGQUwtTUcgcG9kZSBtYW50ZXIgbWFpcyBkZSB1bWEgY8OzcGlhIGRlIHN1YSB0ZXNlIG91IApkaXNzZXJ0YcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyAKbmVzdGEgbGljZW7Dp2EuIFZvY8OqIHRhbWLDqW0gZGVjbGFyYSBxdWUgbyBkZXDDs3NpdG8gZGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBuw6NvLCBxdWUgc2VqYSBkZSBzZXUgCmNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiAKZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBwYXJhIGNvbmNlZGVyIMOgICBVTklGQUwtTUcgCm9zIGRpcmVpdG9zIGFwcmVzZW50YWRvcyBuZXN0YSBsaWNlbsOnYSwgZSBxdWUgZXNzZSBtYXRlcmlhbCBkZSBwcm9wcmllZGFkZSBkZSB0ZXJjZWlyb3MgZXN0w6EgY2xhcmFtZW50ZSAKaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvIGRhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBURVNFIE9VIERJU1NFUlRBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UgCkFQT0lPIERFIFVNQSBBR8OKTkNJQSBERSBGT01FTlRPIE9VIE9VVFJPIE9SR0FOSVNNTyBRVUUgTsODTyBTRUpBIEEgIFVOSUZBTC1NRywgClZPQ8OKIERFQ0xBUkEgUVVFIFJFU1BFSVRPVSBUT0RPUyBFIFFVQUlTUVVFUiBESVJFSVRPUyBERSBSRVZJU8ODTyBDT01PIApUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgRVhJR0lEQVMgUE9SIENPTlRSQVRPIE9VIEFDT1JETy4KCkEgVU5JRkFMLU1HIHNlIGNvbXByb21ldGUgYSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8gc2V1IG5vbWUgKHMpIG91IG8ocykgbm9tZShzKSBkbyhzKSAKZGV0ZW50b3IoZXMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkYSB0ZXNlIG91IGRpc3NlcnRhw6fDo28sIGUgbsOjbyBmYXLDoSBxdWFscXVlciBhbHRlcmHDp8OjbywgYWzDqW0gZGFxdWVsYXMgCmNvbmNlZGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EuCg==
dc.title.pt-BR.fl_str_mv Revisitando a estimação de coeficiente de determinação
title Revisitando a estimação de coeficiente de determinação
spellingShingle Revisitando a estimação de coeficiente de determinação
Pala, Luiz Otávio De Oliveira
Intervalos de Confiança
Estatística como Assunto
Método de Monte Carlo
PROBABILIDADE E ESTATISTICA::PROBABILIDADE E ESTATISTICA APLICADAS
title_short Revisitando a estimação de coeficiente de determinação
title_full Revisitando a estimação de coeficiente de determinação
title_fullStr Revisitando a estimação de coeficiente de determinação
title_full_unstemmed Revisitando a estimação de coeficiente de determinação
title_sort Revisitando a estimação de coeficiente de determinação
author Pala, Luiz Otávio De Oliveira
author_facet Pala, Luiz Otávio De Oliveira
author_role author
dc.contributor.author.fl_str_mv Pala, Luiz Otávio De Oliveira
dc.contributor.advisor-co1.fl_str_mv Gomes, Davi Butturi
dc.contributor.referee1.fl_str_mv Pereira, Gislene Araújo
dc.contributor.referee2.fl_str_mv Silva, Washington Santos Da
dc.contributor.referee3.fl_str_mv Pascoa, Marcelino Alves Rosa De
dc.contributor.advisor1.fl_str_mv Ferreira, Eric Batista
contributor_str_mv Gomes, Davi Butturi
Pereira, Gislene Araújo
Silva, Washington Santos Da
Pascoa, Marcelino Alves Rosa De
Ferreira, Eric Batista
dc.subject.por.fl_str_mv Intervalos de Confiança
Estatística como Assunto
Método de Monte Carlo
topic Intervalos de Confiança
Estatística como Assunto
Método de Monte Carlo
PROBABILIDADE E ESTATISTICA::PROBABILIDADE E ESTATISTICA APLICADAS
dc.subject.cnpq.fl_str_mv PROBABILIDADE E ESTATISTICA::PROBABILIDADE E ESTATISTICA APLICADAS
description The coefficient of determination (R2) is a widely used metric to analyze the quality of adjustment of linear models. This coefficient assumes values in the range between 0 and 1, so that the closer to 1, most of the capacity variation is being explained by the model. R2 is treated with caution in the literature, as it can be biased in models with few observations or inflated when covariates are added to the model. In this sense, authors suggest treating it as a statistic that estimates a population parameter ( 2), which is understood as the quality of fit that a model would have if the infinite observations of the phenomenon were to be collected. Thus, we study the estimation of the parametric coefficient of determination ( 2) from five parametric interval estimators. For comparison, a Monte Carlo simulation study was performed, computing precision and accuracy in the different combinations to model the number of model variables (k), sample size (n) and the value of the parameter ( 2). The results allowed the recommendation of the best estimator for each region of the parametric space. Thus, it was found that the proposed estimators presented similar quality to those indicated in the literature in the parametric space. Finally, an R package was built, allowing the user to estimate the quality of the model using the best performing estimator.
publishDate 2019
dc.date.accessioned.fl_str_mv 2019-09-20T19:28:42Z
dc.date.issued.fl_str_mv 2019-09-06
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv PALA, Luiz Otávio de Oliveira. Revisitando a estimação de coeficiente de determinação. 2019. 112 f. Dissertação (Mestrado em Estatística Aplicada e Biometria) - Universidade Federal de Alfenas, Alfenas, MG, 2019.
dc.identifier.uri.fl_str_mv https://repositorio.unifal-mg.edu.br/handle/123456789/1419
identifier_str_mv PALA, Luiz Otávio de Oliveira. Revisitando a estimação de coeficiente de determinação. 2019. 112 f. Dissertação (Mestrado em Estatística Aplicada e Biometria) - Universidade Federal de Alfenas, Alfenas, MG, 2019.
url https://repositorio.unifal-mg.edu.br/handle/123456789/1419
dc.language.iso.fl_str_mv por
language por
dc.relation.department.fl_str_mv -8156311678363143599
dc.relation.confidence.fl_str_mv 600
600
600
dc.relation.cnpq.fl_str_mv -2104850853990363200
dc.relation.sponsorship.fl_str_mv 2075167498588264571
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Alfenas
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Estatística Aplicada e Biometria
dc.publisher.initials.fl_str_mv UNIFAL-MG
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Instituto de Ciências Exatas
publisher.none.fl_str_mv Universidade Federal de Alfenas
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UNIFAL
instname:Universidade Federal de Alfenas (UNIFAL)
instacron:UNIFAL
instname_str Universidade Federal de Alfenas (UNIFAL)
instacron_str UNIFAL
institution UNIFAL
reponame_str Biblioteca Digital de Teses e Dissertações da UNIFAL
collection Biblioteca Digital de Teses e Dissertações da UNIFAL
bitstream.url.fl_str_mv https://repositorio.unifal-mg.edu.br/bitstreams/9f64e4d5-12f4-47b9-a521-86549994cd39/download
https://repositorio.unifal-mg.edu.br/bitstreams/7ba8f920-ed43-4ebc-b618-c7306b6c7f2d/download
https://repositorio.unifal-mg.edu.br/bitstreams/a1a9f6bd-97f4-47a8-a140-2071d2956300/download
https://repositorio.unifal-mg.edu.br/bitstreams/50fed7d0-2a19-4e7c-910d-a0a72bd197c8/download
https://repositorio.unifal-mg.edu.br/bitstreams/0bb4651e-3b8e-43af-88bd-20ec938268ab/download
https://repositorio.unifal-mg.edu.br/bitstreams/9961cf7d-55b4-4851-b9b7-a586ff577671/download
https://repositorio.unifal-mg.edu.br/bitstreams/3a65d7e9-4c17-4df4-aac4-0676e215bca0/download
bitstream.checksum.fl_str_mv 31555718c4fc75849dd08f27935d4f6b
4afdbb8c545fd630ea7db775da747b2f
d41d8cd98f00b204e9800998ecf8427e
d41d8cd98f00b204e9800998ecf8427e
1329671f744993dd24088e6f2d279057
47102641f8ed28b1a8f8b36a9dd6f569
c2b627114695eac04f003fd0512d93c6
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UNIFAL - Universidade Federal de Alfenas (UNIFAL)
repository.mail.fl_str_mv bdtd@unifal-mg.edu.br || bdtd@unifal-mg.edu.br
_version_ 1850508399958032384