Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n )

Detalhes bibliográficos
Ano de defesa: 2016
Autor(a) principal: Casagrande, Marcelo Henrique
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://www.teses.usp.br/teses/disponiveis/104/104131/tde-13082019-083254/
Resumo: Este trabalho apresenta um estudo comparativo do poder de predição de quatro métodos de regressão adequados para situações nas quais os dados, dispostos na matriz de planejamento, apresentam sérios problemas de multicolinearidade e/ou de alta dimensionalidade, em que o número de covariáveis é maior do que o número de observações. No presente trabalho, os métodos abordados são: regressão por componentes principais, regressão por mínimos quadrados parciais, regressão ridge e LASSO. O trabalho engloba simulações, em que o poder preditivo de cada uma das técnicas é avaliado para diferentes cenários definidos por número de covariáveis, tamanho de amostra e quantidade e intensidade de coeficientes (efeitos) significativos, destacando as principais diferenças entre os métodos e possibilitando a criação de um guia para que o usuário possa escolher qual metodologia usar com base em algum conhecimento prévio que o mesmo possa ter. Uma aplicação em dados reais (não simulados) também é abordada.
id USP_60f687a5b47cd946f00e6a818713c7a9
oai_identifier_str oai:teses.usp.br:tde-13082019-083254
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n )Comparison of estimation methods for problems with collinear and/or high dimensionality (p > n)Alta dimensionalidadeHighdimensionalityLASSOLASSOMínimos quadrados parciaisPartial least squaresPrincipal component regressionRegressão por componentes principaisRegressão ridgeRidge regressionEste trabalho apresenta um estudo comparativo do poder de predição de quatro métodos de regressão adequados para situações nas quais os dados, dispostos na matriz de planejamento, apresentam sérios problemas de multicolinearidade e/ou de alta dimensionalidade, em que o número de covariáveis é maior do que o número de observações. No presente trabalho, os métodos abordados são: regressão por componentes principais, regressão por mínimos quadrados parciais, regressão ridge e LASSO. O trabalho engloba simulações, em que o poder preditivo de cada uma das técnicas é avaliado para diferentes cenários definidos por número de covariáveis, tamanho de amostra e quantidade e intensidade de coeficientes (efeitos) significativos, destacando as principais diferenças entre os métodos e possibilitando a criação de um guia para que o usuário possa escolher qual metodologia usar com base em algum conhecimento prévio que o mesmo possa ter. Uma aplicação em dados reais (não simulados) também é abordada.This paper presents a comparative study of the predictive power of four suitable regression methods for situations in which data, arranged in the planning matrix, are very poorly multicolinearity and / or highdimensionality, wherein the number of covariatesis greater the number of observations. In this study, the methods discussed are: principal component regression,partial least squares regression,ridge regression and LASSO. The work includes simulations, where in the predictive power of each of the techniques is evaluated for different scenarios defined by the number of covariates, sample size and quantity and intensity ratios (effects) significant, high lighting the main dffierences between the methods and allowing for the creating a guide for the user to choose which method to use based on some prior knowledge that it may have. An applicationon real data (not simulated) is also addressed.Biblioteca Digitais de Teses e Dissertações da USPDiniz, Carlos Alberto RibeiroCasagrande, Marcelo Henrique2016-04-29info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://www.teses.usp.br/teses/disponiveis/104/104131/tde-13082019-083254/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2019-08-20T23:16:04Zoai:teses.usp.br:tde-13082019-083254Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212019-08-20T23:16:04Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n )
Comparison of estimation methods for problems with collinear and/or high dimensionality (p > n)
title Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n )
spellingShingle Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n )
Casagrande, Marcelo Henrique
Alta dimensionalidade
Highdimensionality
LASSO
LASSO
Mínimos quadrados parciais
Partial least squares
Principal component regression
Regressão por componentes principais
Regressão ridge
Ridge regression
title_short Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n )
title_full Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n )
title_fullStr Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n )
title_full_unstemmed Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n )
title_sort Comparação de métodos de estimação para problemas com colinearidade e/ou alta dimensionalidade (p > n )
author Casagrande, Marcelo Henrique
author_facet Casagrande, Marcelo Henrique
author_role author
dc.contributor.none.fl_str_mv Diniz, Carlos Alberto Ribeiro
dc.contributor.author.fl_str_mv Casagrande, Marcelo Henrique
dc.subject.por.fl_str_mv Alta dimensionalidade
Highdimensionality
LASSO
LASSO
Mínimos quadrados parciais
Partial least squares
Principal component regression
Regressão por componentes principais
Regressão ridge
Ridge regression
topic Alta dimensionalidade
Highdimensionality
LASSO
LASSO
Mínimos quadrados parciais
Partial least squares
Principal component regression
Regressão por componentes principais
Regressão ridge
Ridge regression
description Este trabalho apresenta um estudo comparativo do poder de predição de quatro métodos de regressão adequados para situações nas quais os dados, dispostos na matriz de planejamento, apresentam sérios problemas de multicolinearidade e/ou de alta dimensionalidade, em que o número de covariáveis é maior do que o número de observações. No presente trabalho, os métodos abordados são: regressão por componentes principais, regressão por mínimos quadrados parciais, regressão ridge e LASSO. O trabalho engloba simulações, em que o poder preditivo de cada uma das técnicas é avaliado para diferentes cenários definidos por número de covariáveis, tamanho de amostra e quantidade e intensidade de coeficientes (efeitos) significativos, destacando as principais diferenças entre os métodos e possibilitando a criação de um guia para que o usuário possa escolher qual metodologia usar com base em algum conhecimento prévio que o mesmo possa ter. Uma aplicação em dados reais (não simulados) também é abordada.
publishDate 2016
dc.date.none.fl_str_mv 2016-04-29
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://www.teses.usp.br/teses/disponiveis/104/104131/tde-13082019-083254/
url http://www.teses.usp.br/teses/disponiveis/104/104131/tde-13082019-083254/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1815258101166637056