Uma abordagem de ponto fixo para regressão Ridge, Lasso e Elastic Net em dados de alta dimensionalidade

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Igarashi, Daniela Miray
Orientador(a): Matioli, Luiz Carlos, 1961-
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://hdl.handle.net/1884/94416
Resumo: Orientador: Prof. Dr. Luiz Carlos Matioli
id UFPR_bbc787104b9601d74dba69ceb59d2485
oai_identifier_str oai:acervodigital.ufpr.br:1884/94416
network_acronym_str UFPR
network_name_str Repositório Institucional da UFPR
repository_id_str
spelling Universidade Federal do Paraná. Setor de Tecnologia. Programa de Pós-Graduação em Métodos Numéricos em EngenhariaMatioli, Luiz Carlos, 1961-Igarashi, Daniela Miray2025-01-16T19:27:43Z2025-01-16T19:27:43Z2024https://hdl.handle.net/1884/94416Orientador: Prof. Dr. Luiz Carlos MatioliTese (doutorado) - Universidade Federal do Paraná, Setor de Tecnologia, Programa de Pós-Graduação em Métodos Numéricos em Engenharia. Defesa : Curitiba, 20/03/2024Inclui referênciasResumo: Em problemas de regressão linear múltipla, quando o número de características é muito maior que o número de observações, tem-se dados de alta dimensão, sendo um tipo de problema relevante dado que é comum em dados genômicos, análise de imagens, finanças e biologia molecular. Dados de alta dimensão podem ser afetados pela multicolinearidade, que ocorre quando duas ou mais variáveis independentes estão correlacionadas, e esse fenômeno pode levar a inferências não confiáveis. Uma abordagem de regularização, como regressão ridge, lasso ou elastic net, pode ser usada neste caso. Este trabalho apresenta um novo algoritmo baseado em ponto fixo para resolver o problema de regressão ridge. O algoritmo é baseado em reescrever a condição de otimização necessária de primeira ordem como uma iteração de ponto fixo e é um algoritmo de fácil implementação. Experimentos numéricos foram executados em problemas mal condicionados e de alta dimensão a fim de avaliar sua viabilidade. O algoritmo proposto foi também aplicado na solução das técnicas de lasso ou elastic net, nesse caso sendo utilizado para solução do subproblema do método de direções alternadas dos multiplicadores. Além disso, o algoritmo proposto foi utilizado na solução do problema de dados genômicos reais de alta dimensão sobre a produção de riboflavina (vitamina B2) com Bacillus subtilis para fins ilustrativos. Os resultados mostram que o algoritmo proposto é competitivo em tempo de execução quando comparado ao método do gradiente conjugado, à rotina mldivide do MATLAB® e ao método do resíduo mínimoAbstract: In multiple linear regression, the challenge of high-dimensional data arises when the number of features far exceeds the number of observations. This issue is encountered across various fields, including genomics, image analysis, finance, and molecular biology. High-dimensional datasets often suffer from multicollinearity, where correlated independent variables lead to unreliable inferences. A regularization approach, such as ridge regression, lasso, or elastic net, can be used in this case. This work presents a new fixed-point-based algorithm to solve the ridge regression problem. The algorithm rewrites the necessary first-order optimization condition as a fixed-point iteration and is straightforward to implement. Numerical experiments were conducted on ill-conditioned and high-dimensional problems to evaluate its feasibility. The proposed algorithm was also applied to solve lasso or elastic net problems, in which case it was used to solve the subproblem of the alternating directions method of multipliers. Additionally, the proposed algorithm was applied to solve a high- dimensional real genomic data problem regarding riboflavin (vitamin B2) production with Bacillus subtilis for illustrative purposes. The results show that the proposed algorithm is competitive in terms of execution time when compared to the conjugate gradient method, MATLAB®mldivide routine, and the minimum residual method1 recurso online : PDF.application/pdfTeoria do ponto fixoRegressão de cumeeira (Estatistica)Minimos quadradosAnálise NuméricaUma abordagem de ponto fixo para regressão Ridge, Lasso e Elastic Net em dados de alta dimensionalidadeinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisporreponame:Repositório Institucional da UFPRinstname:Universidade Federal do Paraná (UFPR)instacron:UFPRinfo:eu-repo/semantics/openAccessORIGINALR - T - DANIELA MIRAY IGARASHI.pdfapplication/pdf1695835https://acervodigital.ufpr.br/bitstream/1884/94416/1/R%20-%20T%20-%20DANIELA%20MIRAY%20IGARASHI.pdf5d0fea5bd3ec3f730cc4c95c7657b4f7MD51open access1884/944162025-01-16 16:27:43.913open accessoai:acervodigital.ufpr.br:1884/94416Repositório InstitucionalPUBhttp://acervodigital.ufpr.br/oai/requestinformacaodigital@ufpr.bropendoar:3082025-01-16T19:27:43Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)false
dc.title.pt_BR.fl_str_mv Uma abordagem de ponto fixo para regressão Ridge, Lasso e Elastic Net em dados de alta dimensionalidade
title Uma abordagem de ponto fixo para regressão Ridge, Lasso e Elastic Net em dados de alta dimensionalidade
spellingShingle Uma abordagem de ponto fixo para regressão Ridge, Lasso e Elastic Net em dados de alta dimensionalidade
Igarashi, Daniela Miray
Teoria do ponto fixo
Regressão de cumeeira (Estatistica)
Minimos quadrados
Análise Numérica
title_short Uma abordagem de ponto fixo para regressão Ridge, Lasso e Elastic Net em dados de alta dimensionalidade
title_full Uma abordagem de ponto fixo para regressão Ridge, Lasso e Elastic Net em dados de alta dimensionalidade
title_fullStr Uma abordagem de ponto fixo para regressão Ridge, Lasso e Elastic Net em dados de alta dimensionalidade
title_full_unstemmed Uma abordagem de ponto fixo para regressão Ridge, Lasso e Elastic Net em dados de alta dimensionalidade
title_sort Uma abordagem de ponto fixo para regressão Ridge, Lasso e Elastic Net em dados de alta dimensionalidade
author Igarashi, Daniela Miray
author_facet Igarashi, Daniela Miray
author_role author
dc.contributor.other.pt_BR.fl_str_mv Universidade Federal do Paraná. Setor de Tecnologia. Programa de Pós-Graduação em Métodos Numéricos em Engenharia
dc.contributor.advisor1.fl_str_mv Matioli, Luiz Carlos, 1961-
dc.contributor.author.fl_str_mv Igarashi, Daniela Miray
contributor_str_mv Matioli, Luiz Carlos, 1961-
dc.subject.por.fl_str_mv Teoria do ponto fixo
Regressão de cumeeira (Estatistica)
Minimos quadrados
Análise Numérica
topic Teoria do ponto fixo
Regressão de cumeeira (Estatistica)
Minimos quadrados
Análise Numérica
description Orientador: Prof. Dr. Luiz Carlos Matioli
publishDate 2024
dc.date.issued.fl_str_mv 2024
dc.date.accessioned.fl_str_mv 2025-01-16T19:27:43Z
dc.date.available.fl_str_mv 2025-01-16T19:27:43Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1884/94416
url https://hdl.handle.net/1884/94416
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 1 recurso online : PDF.
application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPR
instname:Universidade Federal do Paraná (UFPR)
instacron:UFPR
instname_str Universidade Federal do Paraná (UFPR)
instacron_str UFPR
institution UFPR
reponame_str Repositório Institucional da UFPR
collection Repositório Institucional da UFPR
bitstream.url.fl_str_mv https://acervodigital.ufpr.br/bitstream/1884/94416/1/R%20-%20T%20-%20DANIELA%20MIRAY%20IGARASHI.pdf
bitstream.checksum.fl_str_mv 5d0fea5bd3ec3f730cc4c95c7657b4f7
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)
repository.mail.fl_str_mv informacaodigital@ufpr.br
_version_ 1847526158823849984