Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n)
| Ano de defesa: | 2016 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de São Carlos
Câmpus São Carlos |
| Programa de Pós-Graduação: |
Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Palavras-chave em Inglês: | |
| Área do conhecimento CNPq: | |
| Link de acesso: | https://repositorio.ufscar.br/handle/20.500.14289/7954 |
Resumo: | This paper presents a comparative study of the predictive power of four suitable regression methods for situations in which data, arranged in the planning matrix, are very poorly multicolinearity and / or high dimensionality, wherein the number of covariates is greater the number of observations. In this study, the methods discussed are: principal component regression, partial least squares regression, ridge regression and LASSO. The work includes simulations, wherein the predictive power of each of the techniques is evaluated for di erent scenarios de ned by the number of covariates, sample size and quantity and intensity ratios (e ects) signi cant, highlighting the main di erences between the methods and allowing for the creating a guide for the user to choose which method to use based on some prior knowledge that it may have. An application on real data (not simulated) is also addressed. |
| id |
SCAR_aa33a775f0d5057696d7a3b7100ebb24 |
|---|---|
| oai_identifier_str |
oai:repositorio.ufscar.br:20.500.14289/7954 |
| network_acronym_str |
SCAR |
| network_name_str |
Repositório Institucional da UFSCAR |
| repository_id_str |
|
| spelling |
Casagrande, Marcelo HenriqueDiniz, Carlos Alberto Ribeirohttp://lattes.cnpq.br/3277371897783194http://lattes.cnpq.br/95694316402751683e2b1b70-4092-4785-b33f-b4508c50d6792016-10-20T13:58:52Z2016-10-20T13:58:52Z2016-04-29CASAGRANDE, Marcelo Henrique. Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n). 2016. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2016. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/7954.https://repositorio.ufscar.br/handle/20.500.14289/7954This paper presents a comparative study of the predictive power of four suitable regression methods for situations in which data, arranged in the planning matrix, are very poorly multicolinearity and / or high dimensionality, wherein the number of covariates is greater the number of observations. In this study, the methods discussed are: principal component regression, partial least squares regression, ridge regression and LASSO. The work includes simulations, wherein the predictive power of each of the techniques is evaluated for di erent scenarios de ned by the number of covariates, sample size and quantity and intensity ratios (e ects) signi cant, highlighting the main di erences between the methods and allowing for the creating a guide for the user to choose which method to use based on some prior knowledge that it may have. An application on real data (not simulated) is also addressed.Este trabalho apresenta um estudo comparativo do poder de predi c~ao de quatro m etodos de regress~ao adequados para situa c~oes nas quais os dados, dispostos na matriz de planejamento, apresentam s erios problemas de multicolinearidade e/ou de alta dimensionalidade, em que o n umero de covari aveis e maior do que o n umero de observa c~oes. No presente trabalho, os m etodos abordados s~ao: regress~ao por componentes principais, regress~ao por m nimos quadrados parciais, regress~ao ridge e LASSO. O trabalho engloba simula c~oes, em que o poder preditivo de cada uma das t ecnicas e avaliado para diferentes cen arios de nidos por n umero de covari aveis, tamanho de amostra e quantidade e intensidade de coe cientes (efeitos) signi cativos, destacando as principais diferen cas entre os m etodos e possibilitando a cria c~ao de um guia para que o usu ario possa escolher qual metodologia usar com base em algum conhecimento pr evio que o mesmo possa ter. Uma aplica c~ao em dados reais (n~ao simulados) tamb em e abordadaCoordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)porUniversidade Federal de São CarlosCâmpus São CarlosPrograma Interinstitucional de Pós-Graduação em Estatística - PIPGEsUFSCarRegressão ridgeLASSOMínimos quadrados parciaisRegressão por componentes principaisAlta dimensionalidadeRidge regressionPartial least squaresPrincipal component regressionHigh dimensionalityCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICAComparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n)info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisOnline60060084611362-11c0-4efd-b118-a7df9999df87info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALDissMHC.pdfDissMHC.pdfapplication/pdf1077783https://repositorio.ufscar.br/bitstreams/7947ba7d-1ece-4eab-a857-eb55b1114c80/downloadc81f777131e6de8fb219b8c34c4337dfMD51trueAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81957https://repositorio.ufscar.br/bitstreams/71b0e8a3-78a4-4e10-9429-df4d4dc6f4f0/downloadae0398b6f8b235e40ad82cba6c50031dMD52falseAnonymousREADTEXTDissMHC.pdf.txtDissMHC.pdf.txtExtracted texttext/plain111643https://repositorio.ufscar.br/bitstreams/ed679647-8305-4e98-b048-0360b40f8789/downloadcbc5ee73007a7205e3df2d2a5fe877e8MD55falseAnonymousREADTHUMBNAILDissMHC.pdf.jpgDissMHC.pdf.jpgIM Thumbnailimage/jpeg2539https://repositorio.ufscar.br/bitstreams/79791242-1534-4179-83cc-4b773592f178/download4f731784692ce401a304898c80f34cd0MD56falseAnonymousREAD20.500.14289/79542025-02-05 17:21:37.378Acesso abertoopen.accessoai:repositorio.ufscar.br:20.500.14289/7954https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-02-05T20:21:37Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)falseTElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgw6AgVW5pdmVyc2lkYWRlCkZlZGVyYWwgZGUgU8OjbyBDYXJsb3MgbyBkaXJlaXRvIG7Do28tZXhjbHVzaXZvIGRlIHJlcHJvZHV6aXIsICB0cmFkdXppciAoY29uZm9ybWUgZGVmaW5pZG8gYWJhaXhvKSwgZS9vdQpkaXN0cmlidWlyIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyAoaW5jbHVpbmRvIG8gcmVzdW1vKSBwb3IgdG9kbyBvIG11bmRvIG5vIGZvcm1hdG8gaW1wcmVzc28gZSBlbGV0csO0bmljbyBlCmVtIHF1YWxxdWVyIG1laW8sIGluY2x1aW5kbyBvcyBmb3JtYXRvcyDDoXVkaW8gb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIGEgVUZTQ2FyIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28KcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBhIFVGU0NhciBwb2RlIG1hbnRlciBtYWlzIGRlIHVtYSBjw7NwaWEgYSBzdWEgdGVzZSBvdQpkaXNzZXJ0YcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcwpuZXN0YSBsaWNlbsOnYS4gVm9jw6ogdGFtYsOpbSBkZWNsYXJhIHF1ZSBvIGRlcMOzc2l0byBkYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIG7Do28sIHF1ZSBzZWphIGRlIHNldQpjb25oZWNpbWVudG8sIGluZnJpbmdlIGRpcmVpdG9zIGF1dG9yYWlzIGRlIG5pbmd1w6ltLgoKQ2FzbyBhIHN1YSB0ZXNlIG91IGRpc3NlcnRhw6fDo28gY29udGVuaGEgbWF0ZXJpYWwgcXVlIHZvY8OqIG7Do28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jw6oKZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBwYXJhIGNvbmNlZGVyIMOgIFVGU0NhcgpvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUKaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvIGRhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBURVNFIE9VIERJU1NFUlRBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UKQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PIFFVRSBOw4NPIFNFSkEgQSBVRlNDYXIsClZPQ8OKIERFQ0xBUkEgUVVFIFJFU1BFSVRPVSBUT0RPUyBFIFFVQUlTUVVFUiBESVJFSVRPUyBERSBSRVZJU8ODTyBDT01PClRBTULDiU0gQVMgREVNQUlTIE9CUklHQcOHw5VFUyBFWElHSURBUyBQT1IgQ09OVFJBVE8gT1UgQUNPUkRPLgoKQSBVRlNDYXIgc2UgY29tcHJvbWV0ZSBhIGlkZW50aWZpY2FyIGNsYXJhbWVudGUgbyBzZXUgbm9tZSAocykgb3UgbyhzKSBub21lKHMpIGRvKHMpCmRldGVudG9yKGVzKSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzCmNvbmNlZGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EuCg== |
| dc.title.por.fl_str_mv |
Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n) |
| title |
Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n) |
| spellingShingle |
Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n) Casagrande, Marcelo Henrique Regressão ridge LASSO Mínimos quadrados parciais Regressão por componentes principais Alta dimensionalidade Ridge regression Partial least squares Principal component regression High dimensionality CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA |
| title_short |
Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n) |
| title_full |
Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n) |
| title_fullStr |
Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n) |
| title_full_unstemmed |
Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n) |
| title_sort |
Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n) |
| author |
Casagrande, Marcelo Henrique |
| author_facet |
Casagrande, Marcelo Henrique |
| author_role |
author |
| dc.contributor.authorlattes.por.fl_str_mv |
http://lattes.cnpq.br/9569431640275168 |
| dc.contributor.author.fl_str_mv |
Casagrande, Marcelo Henrique |
| dc.contributor.advisor1.fl_str_mv |
Diniz, Carlos Alberto Ribeiro |
| dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/3277371897783194 |
| dc.contributor.authorID.fl_str_mv |
3e2b1b70-4092-4785-b33f-b4508c50d679 |
| contributor_str_mv |
Diniz, Carlos Alberto Ribeiro |
| dc.subject.por.fl_str_mv |
Regressão ridge LASSO Mínimos quadrados parciais Regressão por componentes principais Alta dimensionalidade |
| topic |
Regressão ridge LASSO Mínimos quadrados parciais Regressão por componentes principais Alta dimensionalidade Ridge regression Partial least squares Principal component regression High dimensionality CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA |
| dc.subject.eng.fl_str_mv |
Ridge regression Partial least squares Principal component regression High dimensionality |
| dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA |
| description |
This paper presents a comparative study of the predictive power of four suitable regression methods for situations in which data, arranged in the planning matrix, are very poorly multicolinearity and / or high dimensionality, wherein the number of covariates is greater the number of observations. In this study, the methods discussed are: principal component regression, partial least squares regression, ridge regression and LASSO. The work includes simulations, wherein the predictive power of each of the techniques is evaluated for di erent scenarios de ned by the number of covariates, sample size and quantity and intensity ratios (e ects) signi cant, highlighting the main di erences between the methods and allowing for the creating a guide for the user to choose which method to use based on some prior knowledge that it may have. An application on real data (not simulated) is also addressed. |
| publishDate |
2016 |
| dc.date.accessioned.fl_str_mv |
2016-10-20T13:58:52Z |
| dc.date.available.fl_str_mv |
2016-10-20T13:58:52Z |
| dc.date.issued.fl_str_mv |
2016-04-29 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
CASAGRANDE, Marcelo Henrique. Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n). 2016. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2016. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/7954. |
| dc.identifier.uri.fl_str_mv |
https://repositorio.ufscar.br/handle/20.500.14289/7954 |
| identifier_str_mv |
CASAGRANDE, Marcelo Henrique. Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n). 2016. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2016. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/7954. |
| url |
https://repositorio.ufscar.br/handle/20.500.14289/7954 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.confidence.fl_str_mv |
600 600 |
| dc.relation.authority.fl_str_mv |
84611362-11c0-4efd-b118-a7df9999df87 |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
| dc.publisher.program.fl_str_mv |
Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs |
| dc.publisher.initials.fl_str_mv |
UFSCar |
| publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
| instname_str |
Universidade Federal de São Carlos (UFSCAR) |
| instacron_str |
UFSCAR |
| institution |
UFSCAR |
| reponame_str |
Repositório Institucional da UFSCAR |
| collection |
Repositório Institucional da UFSCAR |
| bitstream.url.fl_str_mv |
https://repositorio.ufscar.br/bitstreams/7947ba7d-1ece-4eab-a857-eb55b1114c80/download https://repositorio.ufscar.br/bitstreams/71b0e8a3-78a4-4e10-9429-df4d4dc6f4f0/download https://repositorio.ufscar.br/bitstreams/ed679647-8305-4e98-b048-0360b40f8789/download https://repositorio.ufscar.br/bitstreams/79791242-1534-4179-83cc-4b773592f178/download |
| bitstream.checksum.fl_str_mv |
c81f777131e6de8fb219b8c34c4337df ae0398b6f8b235e40ad82cba6c50031d cbc5ee73007a7205e3df2d2a5fe877e8 4f731784692ce401a304898c80f34cd0 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
| repository.mail.fl_str_mv |
repositorio.sibi@ufscar.br |
| _version_ |
1851688811511152640 |