Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n )
| Ano de defesa: | 2016 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | http://www.teses.usp.br/teses/disponiveis/104/104131/tde-13082019-083254/ |
Resumo: | Este trabalho apresenta um estudo comparativo do poder de predição de quatro métodos de regressão adequados para situações nas quais os dados, dispostos na matriz de planejamento, apresentam sérios problemas de multicolinearidade e/ou de alta dimensionalidade, em que o número de covariáveis é maior do que o número de observações. No presente trabalho, os métodos abordados são: regressão por componentes principais, regressão por mínimos quadrados parciais, regressão ridge e LASSO. O trabalho engloba simulações, em que o poder preditivo de cada uma das técnicas é avaliado para diferentes cenários definidos por número de covariáveis, tamanho de amostra e quantidade e intensidade de coeficientes (efeitos) significativos, destacando as principais diferenças entre os métodos e possibilitando a criação de um guia para que o usuário possa escolher qual metodologia usar com base em algum conhecimento prévio que o mesmo possa ter. Uma aplicação em dados reais (não simulados) também é abordada. |
| id |
USP_60f687a5b47cd946f00e6a818713c7a9 |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-13082019-083254 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n )Comparison of estimation methods for problems with collinear and/or high dimensionality (p > n)Alta dimensionalidadeHighdimensionalityLASSOLASSOMínimos quadrados parciaisPartial least squaresPrincipal component regressionRegressão por componentes principaisRegressão ridgeRidge regressionEste trabalho apresenta um estudo comparativo do poder de predição de quatro métodos de regressão adequados para situações nas quais os dados, dispostos na matriz de planejamento, apresentam sérios problemas de multicolinearidade e/ou de alta dimensionalidade, em que o número de covariáveis é maior do que o número de observações. No presente trabalho, os métodos abordados são: regressão por componentes principais, regressão por mínimos quadrados parciais, regressão ridge e LASSO. O trabalho engloba simulações, em que o poder preditivo de cada uma das técnicas é avaliado para diferentes cenários definidos por número de covariáveis, tamanho de amostra e quantidade e intensidade de coeficientes (efeitos) significativos, destacando as principais diferenças entre os métodos e possibilitando a criação de um guia para que o usuário possa escolher qual metodologia usar com base em algum conhecimento prévio que o mesmo possa ter. Uma aplicação em dados reais (não simulados) também é abordada.This paper presents a comparative study of the predictive power of four suitable regression methods for situations in which data, arranged in the planning matrix, are very poorly multicolinearity and / or highdimensionality, wherein the number of covariatesis greater the number of observations. In this study, the methods discussed are: principal component regression,partial least squares regression,ridge regression and LASSO. The work includes simulations, where in the predictive power of each of the techniques is evaluated for different scenarios defined by the number of covariates, sample size and quantity and intensity ratios (effects) significant, high lighting the main dffierences between the methods and allowing for the creating a guide for the user to choose which method to use based on some prior knowledge that it may have. An applicationon real data (not simulated) is also addressed.Biblioteca Digitais de Teses e Dissertações da USPDiniz, Carlos Alberto RibeiroCasagrande, Marcelo Henrique2016-04-29info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://www.teses.usp.br/teses/disponiveis/104/104131/tde-13082019-083254/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2019-08-20T23:16:04Zoai:teses.usp.br:tde-13082019-083254Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212019-08-20T23:16:04Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n ) Comparison of estimation methods for problems with collinear and/or high dimensionality (p > n) |
| title |
Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n ) |
| spellingShingle |
Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n ) Casagrande, Marcelo Henrique Alta dimensionalidade Highdimensionality LASSO LASSO Mínimos quadrados parciais Partial least squares Principal component regression Regressão por componentes principais Regressão ridge Ridge regression |
| title_short |
Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n ) |
| title_full |
Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n ) |
| title_fullStr |
Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n ) |
| title_full_unstemmed |
Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n ) |
| title_sort |
Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n ) |
| author |
Casagrande, Marcelo Henrique |
| author_facet |
Casagrande, Marcelo Henrique |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Diniz, Carlos Alberto Ribeiro |
| dc.contributor.author.fl_str_mv |
Casagrande, Marcelo Henrique |
| dc.subject.por.fl_str_mv |
Alta dimensionalidade Highdimensionality LASSO LASSO Mínimos quadrados parciais Partial least squares Principal component regression Regressão por componentes principais Regressão ridge Ridge regression |
| topic |
Alta dimensionalidade Highdimensionality LASSO LASSO Mínimos quadrados parciais Partial least squares Principal component regression Regressão por componentes principais Regressão ridge Ridge regression |
| description |
Este trabalho apresenta um estudo comparativo do poder de predição de quatro métodos de regressão adequados para situações nas quais os dados, dispostos na matriz de planejamento, apresentam sérios problemas de multicolinearidade e/ou de alta dimensionalidade, em que o número de covariáveis é maior do que o número de observações. No presente trabalho, os métodos abordados são: regressão por componentes principais, regressão por mínimos quadrados parciais, regressão ridge e LASSO. O trabalho engloba simulações, em que o poder preditivo de cada uma das técnicas é avaliado para diferentes cenários definidos por número de covariáveis, tamanho de amostra e quantidade e intensidade de coeficientes (efeitos) significativos, destacando as principais diferenças entre os métodos e possibilitando a criação de um guia para que o usuário possa escolher qual metodologia usar com base em algum conhecimento prévio que o mesmo possa ter. Uma aplicação em dados reais (não simulados) também é abordada. |
| publishDate |
2016 |
| dc.date.none.fl_str_mv |
2016-04-29 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
http://www.teses.usp.br/teses/disponiveis/104/104131/tde-13082019-083254/ |
| url |
http://www.teses.usp.br/teses/disponiveis/104/104131/tde-13082019-083254/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1815258101166637056 |