Revisitando a estimação de coeficiente de determinação
| Ano de defesa: | 2019 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | , , |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de Alfenas
|
| Programa de Pós-Graduação: |
Programa de Pós-Graduação em Estatística Aplicada e Biometria
|
| Departamento: |
Instituto de Ciências Exatas
|
| País: |
Brasil
|
| Palavras-chave em Português: | |
| Área do conhecimento CNPq: | |
| Link de acesso: | https://repositorio.unifal-mg.edu.br/handle/123456789/1419 |
Resumo: | The coefficient of determination (R2) is a widely used metric to analyze the quality of adjustment of linear models. This coefficient assumes values in the range between 0 and 1, so that the closer to 1, most of the capacity variation is being explained by the model. R2 is treated with caution in the literature, as it can be biased in models with few observations or inflated when covariates are added to the model. In this sense, authors suggest treating it as a statistic that estimates a population parameter ( 2), which is understood as the quality of fit that a model would have if the infinite observations of the phenomenon were to be collected. Thus, we study the estimation of the parametric coefficient of determination ( 2) from five parametric interval estimators. For comparison, a Monte Carlo simulation study was performed, computing precision and accuracy in the different combinations to model the number of model variables (k), sample size (n) and the value of the parameter ( 2). The results allowed the recommendation of the best estimator for each region of the parametric space. Thus, it was found that the proposed estimators presented similar quality to those indicated in the literature in the parametric space. Finally, an R package was built, allowing the user to estimate the quality of the model using the best performing estimator. |
| id |
UNIFAL_f3e21e02ca6a2623c1029837dc4668f9 |
|---|---|
| oai_identifier_str |
oai:repositorio.unifal-mg.edu.br:123456789/1419 |
| network_acronym_str |
UNIFAL |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da UNIFAL |
| repository_id_str |
|
| spelling |
Pala, Luiz Otávio De OliveiraGomes, Davi ButturiPereira, Gislene AraújoSilva, Washington Santos DaPascoa, Marcelino Alves Rosa DeFerreira, Eric Batista2019-09-20T19:28:42Z2019-09-06PALA, Luiz Otávio de Oliveira. Revisitando a estimação de coeficiente de determinação. 2019. 112 f. Dissertação (Mestrado em Estatística Aplicada e Biometria) - Universidade Federal de Alfenas, Alfenas, MG, 2019.https://repositorio.unifal-mg.edu.br/handle/123456789/1419The coefficient of determination (R2) is a widely used metric to analyze the quality of adjustment of linear models. This coefficient assumes values in the range between 0 and 1, so that the closer to 1, most of the capacity variation is being explained by the model. R2 is treated with caution in the literature, as it can be biased in models with few observations or inflated when covariates are added to the model. In this sense, authors suggest treating it as a statistic that estimates a population parameter ( 2), which is understood as the quality of fit that a model would have if the infinite observations of the phenomenon were to be collected. Thus, we study the estimation of the parametric coefficient of determination ( 2) from five parametric interval estimators. For comparison, a Monte Carlo simulation study was performed, computing precision and accuracy in the different combinations to model the number of model variables (k), sample size (n) and the value of the parameter ( 2). The results allowed the recommendation of the best estimator for each region of the parametric space. Thus, it was found that the proposed estimators presented similar quality to those indicated in the literature in the parametric space. Finally, an R package was built, allowing the user to estimate the quality of the model using the best performing estimator.O coeficiente de determinação (R2) é uma métrica muito utilizada para a análise de qualidade de ajuste de modelos lineares. Este coeficiente assume valores no intervalo entre 0 e 1, de modo que quanto mais próximo de 1, maior parte da variação da variável resposta está sendo explicada pelo modelo. Há outras métricas com o mesmo objetivo, como o coeficiente de determinação ajustado, o erro absoluto e erro quadrático médio, por exemplo. Mesmo sendo muito utilizado, o R2 é tratado com cautela na literatura, pois este pode ser viesado em modelos com poucas observações ou inflacionado quando se acrescentam covariáveis ao modelo. Neste sentido, autores sugerem tratá-lo como uma estatística que estima um parâmetro populacional ( 2), sendo este entendido como a qualidade de ajuste que um modelo possuiria se as infinitas observações do fenômeno viessem a ser coletadas. Desta forma, sendo 2 um parâmetro e R2 um estimador pontual, é natural pensar em estimação intervalar e testes de hipóteses para possibilitar a tomada de decisão sobre a adequação do modelo candidato ao fenômeno no qual deseja-se descrever. Entretanto, essa questão inferencial ainda não é considerada fechada na literatura, pois autores discutem distribuições de probabilidade para a modelagem deste em diferentes cenários e regiões do espaço paramétrico. Desta forma, este trabalho estudou a estimação do coeficiente de determinação paramétrico ( 2) a partir de cinco estimadores intervalares paramétricos. Para compará-los, foi realizado um estudo de simulação Monte Carlo, computando precisão e acurácia em diferentes cenários compostos pela combinação do número de covariáveis do modelo (k), tamanho amostral (n) e o verdadeiro valor paramétrico ( 2). Em conjunto a isso, elaborouse um índice de desempenho de estimação intervalar que valoriza simultaneamente precisão e acurácia com importâncias relativas previamente fixadas. Os resultados permitiram a recomendação do melhor estimador para cada região do espaço paramétrico. Com isso, verificou-se que os estimadores propostos apresentaram qualidade similar aos indicados na literatura ao longo do espaço paramétrico. Por fim, foi construído um pacote R, possibilitando que o usuário estime de forma intervalar a qualidade do ajuste utilizando o estimador com melhor desempenho.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESapplication/pdfporUniversidade Federal de AlfenasPrograma de Pós-Graduação em Estatística Aplicada e BiometriaUNIFAL-MGBrasilInstituto de Ciências Exatasinfo:eu-repo/semantics/openAccesshttp://creativecommons.org/licenses/by-nc-nd/4.0/Intervalos de ConfiançaEstatística como AssuntoMétodo de Monte CarloPROBABILIDADE E ESTATISTICA::PROBABILIDADE E ESTATISTICA APLICADASRevisitando a estimação de coeficiente de determinaçãoinfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersion-8156311678363143599600600600-21048508539903632002075167498588264571reponame:Biblioteca Digital de Teses e Dissertações da UNIFALinstname:Universidade Federal de Alfenas (UNIFAL)instacron:UNIFALPala, Luiz Otávio De OliveiraLICENSElicense.txtlicense.txttext/plain; charset=utf-81987https://repositorio.unifal-mg.edu.br/bitstreams/9f64e4d5-12f4-47b9-a521-86549994cd39/download31555718c4fc75849dd08f27935d4f6bMD51CC-LICENSElicense_urllicense_urltext/plain; charset=utf-849https://repositorio.unifal-mg.edu.br/bitstreams/7ba8f920-ed43-4ebc-b618-c7306b6c7f2d/download4afdbb8c545fd630ea7db775da747b2fMD52license_textlicense_texttext/html; charset=utf-80https://repositorio.unifal-mg.edu.br/bitstreams/a1a9f6bd-97f4-47a8-a140-2071d2956300/downloadd41d8cd98f00b204e9800998ecf8427eMD53license_rdflicense_rdfapplication/rdf+xml; charset=utf-80https://repositorio.unifal-mg.edu.br/bitstreams/50fed7d0-2a19-4e7c-910d-a0a72bd197c8/downloadd41d8cd98f00b204e9800998ecf8427eMD54ORIGINALDissertação de Luiz Otávio de Oliveira Pala.pdfDissertação de Luiz Otávio de Oliveira Pala.pdfapplication/pdf3367699https://repositorio.unifal-mg.edu.br/bitstreams/0bb4651e-3b8e-43af-88bd-20ec938268ab/download1329671f744993dd24088e6f2d279057MD55TEXTDissertação de Luiz Otávio de Oliveira Pala.pdf.txtDissertação de Luiz Otávio de Oliveira Pala.pdf.txtExtracted texttext/plain103576https://repositorio.unifal-mg.edu.br/bitstreams/9961cf7d-55b4-4851-b9b7-a586ff577671/download47102641f8ed28b1a8f8b36a9dd6f569MD56THUMBNAILDissertação de Luiz Otávio de Oliveira Pala.pdf.jpgDissertação de Luiz Otávio de Oliveira Pala.pdf.jpgGenerated Thumbnailimage/jpeg2563https://repositorio.unifal-mg.edu.br/bitstreams/3a65d7e9-4c17-4df4-aac4-0676e215bca0/downloadc2b627114695eac04f003fd0512d93c6MD57123456789/14192025-04-14 17:32:43.722http://creativecommons.org/licenses/by-nc-nd/4.0/open.accessoai:repositorio.unifal-mg.edu.br:123456789/1419https://repositorio.unifal-mg.edu.brBiblioteca Digital de Teses e DissertaçõesPUBhttps://bdtd.unifal-mg.edu.br:8443/oai/requestbdtd@unifal-mg.edu.br || bdtd@unifal-mg.edu.bropendoar:2025-04-14T20:32:43Biblioteca Digital de Teses e Dissertações da UNIFAL - Universidade Federal de Alfenas (UNIFAL)falseTElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCBvIGF1dG9yIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IgY29uY2VkZSDDoCBVbml2ZXJzaWRhZGUgCkZlZGVyYWwgZGUgQWxmZW5hcyAgKFVOSUZBTC1NRykgbyBkaXJlaXRvIG7Do28tZXhjbHVzaXZvIGRlIHJlcHJvZHV6aXIsICB0cmFkdXppciAoY29uZm9ybWUgZGVmaW5pZG8gYWJhaXhvKSwgZS9vdSAKZGlzdHJpYnVpciBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gKGluY2x1aW5kbyBvIHJlc3VtbykgcG9yIHRvZG8gbyBtdW5kbyBubyBmb3JtYXRvIGltcHJlc3NvIGUgZWxldHLDtG5pY28gZSAKZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIGZvcm1hdG9zIMOhdWRpbyBvdSB2w61kZW8uCgpWb2PDqiBjb25jb3JkYSBxdWUgYSBVTklGQUwtTUcgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIHRyYW5zcG9yIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyAKcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBhICBVTklGQUwtTUcgcG9kZSBtYW50ZXIgbWFpcyBkZSB1bWEgY8OzcGlhIGRlIHN1YSB0ZXNlIG91IApkaXNzZXJ0YcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyAKbmVzdGEgbGljZW7Dp2EuIFZvY8OqIHRhbWLDqW0gZGVjbGFyYSBxdWUgbyBkZXDDs3NpdG8gZGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBuw6NvLCBxdWUgc2VqYSBkZSBzZXUgCmNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiAKZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBwYXJhIGNvbmNlZGVyIMOgICBVTklGQUwtTUcgCm9zIGRpcmVpdG9zIGFwcmVzZW50YWRvcyBuZXN0YSBsaWNlbsOnYSwgZSBxdWUgZXNzZSBtYXRlcmlhbCBkZSBwcm9wcmllZGFkZSBkZSB0ZXJjZWlyb3MgZXN0w6EgY2xhcmFtZW50ZSAKaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvIGRhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBURVNFIE9VIERJU1NFUlRBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UgCkFQT0lPIERFIFVNQSBBR8OKTkNJQSBERSBGT01FTlRPIE9VIE9VVFJPIE9SR0FOSVNNTyBRVUUgTsODTyBTRUpBIEEgIFVOSUZBTC1NRywgClZPQ8OKIERFQ0xBUkEgUVVFIFJFU1BFSVRPVSBUT0RPUyBFIFFVQUlTUVVFUiBESVJFSVRPUyBERSBSRVZJU8ODTyBDT01PIApUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgRVhJR0lEQVMgUE9SIENPTlRSQVRPIE9VIEFDT1JETy4KCkEgVU5JRkFMLU1HIHNlIGNvbXByb21ldGUgYSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8gc2V1IG5vbWUgKHMpIG91IG8ocykgbm9tZShzKSBkbyhzKSAKZGV0ZW50b3IoZXMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkYSB0ZXNlIG91IGRpc3NlcnRhw6fDo28sIGUgbsOjbyBmYXLDoSBxdWFscXVlciBhbHRlcmHDp8OjbywgYWzDqW0gZGFxdWVsYXMgCmNvbmNlZGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EuCg== |
| dc.title.pt-BR.fl_str_mv |
Revisitando a estimação de coeficiente de determinação |
| title |
Revisitando a estimação de coeficiente de determinação |
| spellingShingle |
Revisitando a estimação de coeficiente de determinação Pala, Luiz Otávio De Oliveira Intervalos de Confiança Estatística como Assunto Método de Monte Carlo PROBABILIDADE E ESTATISTICA::PROBABILIDADE E ESTATISTICA APLICADAS |
| title_short |
Revisitando a estimação de coeficiente de determinação |
| title_full |
Revisitando a estimação de coeficiente de determinação |
| title_fullStr |
Revisitando a estimação de coeficiente de determinação |
| title_full_unstemmed |
Revisitando a estimação de coeficiente de determinação |
| title_sort |
Revisitando a estimação de coeficiente de determinação |
| author |
Pala, Luiz Otávio De Oliveira |
| author_facet |
Pala, Luiz Otávio De Oliveira |
| author_role |
author |
| dc.contributor.author.fl_str_mv |
Pala, Luiz Otávio De Oliveira |
| dc.contributor.advisor-co1.fl_str_mv |
Gomes, Davi Butturi |
| dc.contributor.referee1.fl_str_mv |
Pereira, Gislene Araújo |
| dc.contributor.referee2.fl_str_mv |
Silva, Washington Santos Da |
| dc.contributor.referee3.fl_str_mv |
Pascoa, Marcelino Alves Rosa De |
| dc.contributor.advisor1.fl_str_mv |
Ferreira, Eric Batista |
| contributor_str_mv |
Gomes, Davi Butturi Pereira, Gislene Araújo Silva, Washington Santos Da Pascoa, Marcelino Alves Rosa De Ferreira, Eric Batista |
| dc.subject.por.fl_str_mv |
Intervalos de Confiança Estatística como Assunto Método de Monte Carlo |
| topic |
Intervalos de Confiança Estatística como Assunto Método de Monte Carlo PROBABILIDADE E ESTATISTICA::PROBABILIDADE E ESTATISTICA APLICADAS |
| dc.subject.cnpq.fl_str_mv |
PROBABILIDADE E ESTATISTICA::PROBABILIDADE E ESTATISTICA APLICADAS |
| description |
The coefficient of determination (R2) is a widely used metric to analyze the quality of adjustment of linear models. This coefficient assumes values in the range between 0 and 1, so that the closer to 1, most of the capacity variation is being explained by the model. R2 is treated with caution in the literature, as it can be biased in models with few observations or inflated when covariates are added to the model. In this sense, authors suggest treating it as a statistic that estimates a population parameter ( 2), which is understood as the quality of fit that a model would have if the infinite observations of the phenomenon were to be collected. Thus, we study the estimation of the parametric coefficient of determination ( 2) from five parametric interval estimators. For comparison, a Monte Carlo simulation study was performed, computing precision and accuracy in the different combinations to model the number of model variables (k), sample size (n) and the value of the parameter ( 2). The results allowed the recommendation of the best estimator for each region of the parametric space. Thus, it was found that the proposed estimators presented similar quality to those indicated in the literature in the parametric space. Finally, an R package was built, allowing the user to estimate the quality of the model using the best performing estimator. |
| publishDate |
2019 |
| dc.date.accessioned.fl_str_mv |
2019-09-20T19:28:42Z |
| dc.date.issued.fl_str_mv |
2019-09-06 |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
PALA, Luiz Otávio de Oliveira. Revisitando a estimação de coeficiente de determinação. 2019. 112 f. Dissertação (Mestrado em Estatística Aplicada e Biometria) - Universidade Federal de Alfenas, Alfenas, MG, 2019. |
| dc.identifier.uri.fl_str_mv |
https://repositorio.unifal-mg.edu.br/handle/123456789/1419 |
| identifier_str_mv |
PALA, Luiz Otávio de Oliveira. Revisitando a estimação de coeficiente de determinação. 2019. 112 f. Dissertação (Mestrado em Estatística Aplicada e Biometria) - Universidade Federal de Alfenas, Alfenas, MG, 2019. |
| url |
https://repositorio.unifal-mg.edu.br/handle/123456789/1419 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.department.fl_str_mv |
-8156311678363143599 |
| dc.relation.confidence.fl_str_mv |
600 600 600 |
| dc.relation.cnpq.fl_str_mv |
-2104850853990363200 |
| dc.relation.sponsorship.fl_str_mv |
2075167498588264571 |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc-nd/4.0/ |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Federal de Alfenas |
| dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Estatística Aplicada e Biometria |
| dc.publisher.initials.fl_str_mv |
UNIFAL-MG |
| dc.publisher.country.fl_str_mv |
Brasil |
| dc.publisher.department.fl_str_mv |
Instituto de Ciências Exatas |
| publisher.none.fl_str_mv |
Universidade Federal de Alfenas |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UNIFAL instname:Universidade Federal de Alfenas (UNIFAL) instacron:UNIFAL |
| instname_str |
Universidade Federal de Alfenas (UNIFAL) |
| instacron_str |
UNIFAL |
| institution |
UNIFAL |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da UNIFAL |
| collection |
Biblioteca Digital de Teses e Dissertações da UNIFAL |
| bitstream.url.fl_str_mv |
https://repositorio.unifal-mg.edu.br/bitstreams/9f64e4d5-12f4-47b9-a521-86549994cd39/download https://repositorio.unifal-mg.edu.br/bitstreams/7ba8f920-ed43-4ebc-b618-c7306b6c7f2d/download https://repositorio.unifal-mg.edu.br/bitstreams/a1a9f6bd-97f4-47a8-a140-2071d2956300/download https://repositorio.unifal-mg.edu.br/bitstreams/50fed7d0-2a19-4e7c-910d-a0a72bd197c8/download https://repositorio.unifal-mg.edu.br/bitstreams/0bb4651e-3b8e-43af-88bd-20ec938268ab/download https://repositorio.unifal-mg.edu.br/bitstreams/9961cf7d-55b4-4851-b9b7-a586ff577671/download https://repositorio.unifal-mg.edu.br/bitstreams/3a65d7e9-4c17-4df4-aac4-0676e215bca0/download |
| bitstream.checksum.fl_str_mv |
31555718c4fc75849dd08f27935d4f6b 4afdbb8c545fd630ea7db775da747b2f d41d8cd98f00b204e9800998ecf8427e d41d8cd98f00b204e9800998ecf8427e 1329671f744993dd24088e6f2d279057 47102641f8ed28b1a8f8b36a9dd6f569 c2b627114695eac04f003fd0512d93c6 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UNIFAL - Universidade Federal de Alfenas (UNIFAL) |
| repository.mail.fl_str_mv |
bdtd@unifal-mg.edu.br || bdtd@unifal-mg.edu.br |
| _version_ |
1850508399958032384 |