Uma abordagem de ponto fixo para regressão Ridge, Lasso e Elastic Net em dados de alta dimensionalidade
| Ano de defesa: | 2024 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Não Informado pela instituição
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://hdl.handle.net/1884/94416 |
Resumo: | Orientador: Prof. Dr. Luiz Carlos Matioli |
| id |
UFPR_bbc787104b9601d74dba69ceb59d2485 |
|---|---|
| oai_identifier_str |
oai:acervodigital.ufpr.br:1884/94416 |
| network_acronym_str |
UFPR |
| network_name_str |
Repositório Institucional da UFPR |
| repository_id_str |
|
| spelling |
Universidade Federal do Paraná. Setor de Tecnologia. Programa de Pós-Graduação em Métodos Numéricos em EngenhariaMatioli, Luiz Carlos, 1961-Igarashi, Daniela Miray2025-01-16T19:27:43Z2025-01-16T19:27:43Z2024https://hdl.handle.net/1884/94416Orientador: Prof. Dr. Luiz Carlos MatioliTese (doutorado) - Universidade Federal do Paraná, Setor de Tecnologia, Programa de Pós-Graduação em Métodos Numéricos em Engenharia. Defesa : Curitiba, 20/03/2024Inclui referênciasResumo: Em problemas de regressão linear múltipla, quando o número de características é muito maior que o número de observações, tem-se dados de alta dimensão, sendo um tipo de problema relevante dado que é comum em dados genômicos, análise de imagens, finanças e biologia molecular. Dados de alta dimensão podem ser afetados pela multicolinearidade, que ocorre quando duas ou mais variáveis independentes estão correlacionadas, e esse fenômeno pode levar a inferências não confiáveis. Uma abordagem de regularização, como regressão ridge, lasso ou elastic net, pode ser usada neste caso. Este trabalho apresenta um novo algoritmo baseado em ponto fixo para resolver o problema de regressão ridge. O algoritmo é baseado em reescrever a condição de otimização necessária de primeira ordem como uma iteração de ponto fixo e é um algoritmo de fácil implementação. Experimentos numéricos foram executados em problemas mal condicionados e de alta dimensão a fim de avaliar sua viabilidade. O algoritmo proposto foi também aplicado na solução das técnicas de lasso ou elastic net, nesse caso sendo utilizado para solução do subproblema do método de direções alternadas dos multiplicadores. Além disso, o algoritmo proposto foi utilizado na solução do problema de dados genômicos reais de alta dimensão sobre a produção de riboflavina (vitamina B2) com Bacillus subtilis para fins ilustrativos. Os resultados mostram que o algoritmo proposto é competitivo em tempo de execução quando comparado ao método do gradiente conjugado, à rotina mldivide do MATLAB® e ao método do resíduo mínimoAbstract: In multiple linear regression, the challenge of high-dimensional data arises when the number of features far exceeds the number of observations. This issue is encountered across various fields, including genomics, image analysis, finance, and molecular biology. High-dimensional datasets often suffer from multicollinearity, where correlated independent variables lead to unreliable inferences. A regularization approach, such as ridge regression, lasso, or elastic net, can be used in this case. This work presents a new fixed-point-based algorithm to solve the ridge regression problem. The algorithm rewrites the necessary first-order optimization condition as a fixed-point iteration and is straightforward to implement. Numerical experiments were conducted on ill-conditioned and high-dimensional problems to evaluate its feasibility. The proposed algorithm was also applied to solve lasso or elastic net problems, in which case it was used to solve the subproblem of the alternating directions method of multipliers. Additionally, the proposed algorithm was applied to solve a high- dimensional real genomic data problem regarding riboflavin (vitamin B2) production with Bacillus subtilis for illustrative purposes. The results show that the proposed algorithm is competitive in terms of execution time when compared to the conjugate gradient method, MATLAB®mldivide routine, and the minimum residual method1 recurso online : PDF.application/pdfTeoria do ponto fixoRegressão de cumeeira (Estatistica)Minimos quadradosAnálise NuméricaUma abordagem de ponto fixo para regressão Ridge, Lasso e Elastic Net em dados de alta dimensionalidadeinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisporreponame:Repositório Institucional da UFPRinstname:Universidade Federal do Paraná (UFPR)instacron:UFPRinfo:eu-repo/semantics/openAccessORIGINALR - T - DANIELA MIRAY IGARASHI.pdfapplication/pdf1695835https://acervodigital.ufpr.br/bitstream/1884/94416/1/R%20-%20T%20-%20DANIELA%20MIRAY%20IGARASHI.pdf5d0fea5bd3ec3f730cc4c95c7657b4f7MD51open access1884/944162025-01-16 16:27:43.913open accessoai:acervodigital.ufpr.br:1884/94416Repositório InstitucionalPUBhttp://acervodigital.ufpr.br/oai/requestinformacaodigital@ufpr.bropendoar:3082025-01-16T19:27:43Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR)false |
| dc.title.pt_BR.fl_str_mv |
Uma abordagem de ponto fixo para regressão Ridge, Lasso e Elastic Net em dados de alta dimensionalidade |
| title |
Uma abordagem de ponto fixo para regressão Ridge, Lasso e Elastic Net em dados de alta dimensionalidade |
| spellingShingle |
Uma abordagem de ponto fixo para regressão Ridge, Lasso e Elastic Net em dados de alta dimensionalidade Igarashi, Daniela Miray Teoria do ponto fixo Regressão de cumeeira (Estatistica) Minimos quadrados Análise Numérica |
| title_short |
Uma abordagem de ponto fixo para regressão Ridge, Lasso e Elastic Net em dados de alta dimensionalidade |
| title_full |
Uma abordagem de ponto fixo para regressão Ridge, Lasso e Elastic Net em dados de alta dimensionalidade |
| title_fullStr |
Uma abordagem de ponto fixo para regressão Ridge, Lasso e Elastic Net em dados de alta dimensionalidade |
| title_full_unstemmed |
Uma abordagem de ponto fixo para regressão Ridge, Lasso e Elastic Net em dados de alta dimensionalidade |
| title_sort |
Uma abordagem de ponto fixo para regressão Ridge, Lasso e Elastic Net em dados de alta dimensionalidade |
| author |
Igarashi, Daniela Miray |
| author_facet |
Igarashi, Daniela Miray |
| author_role |
author |
| dc.contributor.other.pt_BR.fl_str_mv |
Universidade Federal do Paraná. Setor de Tecnologia. Programa de Pós-Graduação em Métodos Numéricos em Engenharia |
| dc.contributor.advisor1.fl_str_mv |
Matioli, Luiz Carlos, 1961- |
| dc.contributor.author.fl_str_mv |
Igarashi, Daniela Miray |
| contributor_str_mv |
Matioli, Luiz Carlos, 1961- |
| dc.subject.por.fl_str_mv |
Teoria do ponto fixo Regressão de cumeeira (Estatistica) Minimos quadrados Análise Numérica |
| topic |
Teoria do ponto fixo Regressão de cumeeira (Estatistica) Minimos quadrados Análise Numérica |
| description |
Orientador: Prof. Dr. Luiz Carlos Matioli |
| publishDate |
2024 |
| dc.date.issued.fl_str_mv |
2024 |
| dc.date.accessioned.fl_str_mv |
2025-01-16T19:27:43Z |
| dc.date.available.fl_str_mv |
2025-01-16T19:27:43Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/1884/94416 |
| url |
https://hdl.handle.net/1884/94416 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
1 recurso online : PDF. application/pdf |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPR instname:Universidade Federal do Paraná (UFPR) instacron:UFPR |
| instname_str |
Universidade Federal do Paraná (UFPR) |
| instacron_str |
UFPR |
| institution |
UFPR |
| reponame_str |
Repositório Institucional da UFPR |
| collection |
Repositório Institucional da UFPR |
| bitstream.url.fl_str_mv |
https://acervodigital.ufpr.br/bitstream/1884/94416/1/R%20-%20T%20-%20DANIELA%20MIRAY%20IGARASHI.pdf |
| bitstream.checksum.fl_str_mv |
5d0fea5bd3ec3f730cc4c95c7657b4f7 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFPR - Universidade Federal do Paraná (UFPR) |
| repository.mail.fl_str_mv |
informacaodigital@ufpr.br |
| _version_ |
1847526158823849984 |