Funções de covariância e robustez a outliers em processos Gaussianos

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Martinho, Wasley Correia
Orientador(a): Andrade, José Ailton Alencar
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Área do conhecimento CNPq:
Link de acesso: http://repositorio.ufc.br/handle/riufc/80973
Resumo: In Regression Theory, Gaussian Processes emerge as an efficient alternative to simplify the estimation process in Bayesian Models. A Gaussian Process is a generalization of the Gaussian distribution, fully defined by its mean and covariance function (or kernel). This non-parametric model has gained prominence due to its computational ease and effectiveness in predictions. In Gaussian Process predictions, the choice of the covariance function plays a crucial role, as it directly depends on the input values of the observations. However, the presence of outliers in the data can compromise model inferences, leading to inadequate predictions. This study analyzes, through simulations with data containing outliers, how different covariance functions affect the performance of Predictive Gaussian Process Models. The objective is to identify which kernels are more sensitive to extreme data points and which are more robust, as well as to categorize these functions within their respective families of variation. Additionally, a new kernel, called DC-LogExp, is proposed as an alternative to improve the robustness of Gaussian Processes. The results show that model performance is significantly impacted by the choice of kernel and the proportion of outliers in the samples. Covariance functions classified as belonging to the regular variation family, specifically Rational Quadratic and DC-LogExp, stood out for their low sensitivity to the presence of outliers. In particular, the DC-LogExp function proved to be a promising alternative, providing good fits in scenarios with and without outliers, as well as satisfactory results in terms of parameter convergence and predictive errors.
id UFC-7_9cbfdd7523a53424f6f9026d6d9de14b
oai_identifier_str oai:repositorio.ufc.br:riufc/80973
network_acronym_str UFC-7
network_name_str Repositório Institucional da Universidade Federal do Ceará (UFC)
repository_id_str
spelling Martinho, Wasley CorreiaAndrade, José Ailton Alencar2025-05-22T18:25:37Z2025-05-22T18:25:37Z2025-02MARTINHO, Wasley Correia. Funções de covariância e robustez a outliers em processos Gaussianos. 2025. 103 f. Dissertação (Mestrado em Modelagem e Métodos Quantitativos) - Centro de Ciências, Universidade Federal do Ceará, 2025.http://repositorio.ufc.br/handle/riufc/80973In Regression Theory, Gaussian Processes emerge as an efficient alternative to simplify the estimation process in Bayesian Models. A Gaussian Process is a generalization of the Gaussian distribution, fully defined by its mean and covariance function (or kernel). This non-parametric model has gained prominence due to its computational ease and effectiveness in predictions. In Gaussian Process predictions, the choice of the covariance function plays a crucial role, as it directly depends on the input values of the observations. However, the presence of outliers in the data can compromise model inferences, leading to inadequate predictions. This study analyzes, through simulations with data containing outliers, how different covariance functions affect the performance of Predictive Gaussian Process Models. The objective is to identify which kernels are more sensitive to extreme data points and which are more robust, as well as to categorize these functions within their respective families of variation. Additionally, a new kernel, called DC-LogExp, is proposed as an alternative to improve the robustness of Gaussian Processes. The results show that model performance is significantly impacted by the choice of kernel and the proportion of outliers in the samples. Covariance functions classified as belonging to the regular variation family, specifically Rational Quadratic and DC-LogExp, stood out for their low sensitivity to the presence of outliers. In particular, the DC-LogExp function proved to be a promising alternative, providing good fits in scenarios with and without outliers, as well as satisfactory results in terms of parameter convergence and predictive errors.Na Teoria de Regressão, os Processos Gaussianos surgem como uma alternativa eficiente para simplificar a obtenção de estimativas em Modelos Bayesianos. Um Processo Gaussiano é uma generalização da distribuição gaussiana, totalmente definido por sua média e função de covariância (ou kernel). Este modelo não-paramétrico tem ganhado destaque devido à facilidade de cálculos e sua eficácia em predições. Nas predições com Processo Gaussiano, a escolha da função de covariância desempenha um papel crucial, pois ela depende diretamente dos valores de entrada das observações. Entretanto, a presença de outliers nos dados pode comprometer as inferências do modelo, resultando em predições inadequadas. Este trabalho analisa, por meio de simulações com dados contendo outliers, como diferentes funções de covariância afetam o desempenho de Modelos Preditivos de Processos Gaussianos. O objetivo é identificar quais kernels são mais sensíveis à presença de dados extremos e quais são mais robustos, além de categorizar essas funções em suas respectivas famílias de variação. Adicionalmente, propõe-se um novo kernel, denominado DC-LogExp, como uma alternativa para melhorar a robustez dos Processos Gaussianos. Os resultados mostram que o desempenho do modelo é significativamente impactado pela escolha do kernel e pela proporção de outliers nas amostras. As funções de covariância classificadas como função de variação regular, especificamente Rational Quadratic e DC-LogExp, destacaram-se por sua baixa sensibilidade à presença de outliers. Em particular, a função DC-LogExp mostrou-se ser uma alternativa promissora, apresentando bons ajustes em cenários com ou sem outliers, além de resultados satisfatórios em termos de convergência dos parâmetros e erros preditivos.Funções de covariância e robustez a outliers em processos GaussianosCovariance functions and robustness to outliers in Gaussian processesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisProcessos gaussianosKernelOutliersGaussian processesKernelOutliersCNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::PROBABILIDADE::TEORIA GERAL E PROCESSOS ESTOCASTICOSinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal do Ceará (UFC)instname:Universidade Federal do Ceará (UFC)instacron:UFChttp://lattes.cnpq.br/3021669807444789http://lattes.cnpq.br/04933751031852412025-02LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://repositorio.ufc.br/bitstream/riufc/80973/4/license.txt8a4605be74aa9ea9d79846c1fba20a33MD54ORIGINAL2025_dis_wcmartinho.pdf2025_dis_wcmartinho.pdfDissertação Wasleyapplication/pdf29808569http://repositorio.ufc.br/bitstream/riufc/80973/5/2025_dis_wcmartinho.pdf2848a3b65b2a30ae099233ad23e80760MD55riufc/809732025-06-03 17:13:26.793oai:repositorio.ufc.br:riufc/80973Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttp://www.repositorio.ufc.br/ri-oai/requestbu@ufc.br || repositorio@ufc.bropendoar:2025-06-03T20:13:26Repositório Institucional da Universidade Federal do Ceará (UFC) - Universidade Federal do Ceará (UFC)false
dc.title.pt_BR.fl_str_mv Funções de covariância e robustez a outliers em processos Gaussianos
dc.title.en.pt_BR.fl_str_mv Covariance functions and robustness to outliers in Gaussian processes
title Funções de covariância e robustez a outliers em processos Gaussianos
spellingShingle Funções de covariância e robustez a outliers em processos Gaussianos
Martinho, Wasley Correia
CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::PROBABILIDADE::TEORIA GERAL E PROCESSOS ESTOCASTICOS
Processos gaussianos
Kernel
Outliers
Gaussian processes
Kernel
Outliers
title_short Funções de covariância e robustez a outliers em processos Gaussianos
title_full Funções de covariância e robustez a outliers em processos Gaussianos
title_fullStr Funções de covariância e robustez a outliers em processos Gaussianos
title_full_unstemmed Funções de covariância e robustez a outliers em processos Gaussianos
title_sort Funções de covariância e robustez a outliers em processos Gaussianos
author Martinho, Wasley Correia
author_facet Martinho, Wasley Correia
author_role author
dc.contributor.author.fl_str_mv Martinho, Wasley Correia
dc.contributor.advisor1.fl_str_mv Andrade, José Ailton Alencar
contributor_str_mv Andrade, José Ailton Alencar
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::PROBABILIDADE::TEORIA GERAL E PROCESSOS ESTOCASTICOS
topic CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::PROBABILIDADE::TEORIA GERAL E PROCESSOS ESTOCASTICOS
Processos gaussianos
Kernel
Outliers
Gaussian processes
Kernel
Outliers
dc.subject.ptbr.pt_BR.fl_str_mv Processos gaussianos
Kernel
Outliers
dc.subject.en.pt_BR.fl_str_mv Gaussian processes
Kernel
Outliers
description In Regression Theory, Gaussian Processes emerge as an efficient alternative to simplify the estimation process in Bayesian Models. A Gaussian Process is a generalization of the Gaussian distribution, fully defined by its mean and covariance function (or kernel). This non-parametric model has gained prominence due to its computational ease and effectiveness in predictions. In Gaussian Process predictions, the choice of the covariance function plays a crucial role, as it directly depends on the input values of the observations. However, the presence of outliers in the data can compromise model inferences, leading to inadequate predictions. This study analyzes, through simulations with data containing outliers, how different covariance functions affect the performance of Predictive Gaussian Process Models. The objective is to identify which kernels are more sensitive to extreme data points and which are more robust, as well as to categorize these functions within their respective families of variation. Additionally, a new kernel, called DC-LogExp, is proposed as an alternative to improve the robustness of Gaussian Processes. The results show that model performance is significantly impacted by the choice of kernel and the proportion of outliers in the samples. Covariance functions classified as belonging to the regular variation family, specifically Rational Quadratic and DC-LogExp, stood out for their low sensitivity to the presence of outliers. In particular, the DC-LogExp function proved to be a promising alternative, providing good fits in scenarios with and without outliers, as well as satisfactory results in terms of parameter convergence and predictive errors.
publishDate 2025
dc.date.accessioned.fl_str_mv 2025-05-22T18:25:37Z
dc.date.available.fl_str_mv 2025-05-22T18:25:37Z
dc.date.issued.fl_str_mv 2025-02
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv MARTINHO, Wasley Correia. Funções de covariância e robustez a outliers em processos Gaussianos. 2025. 103 f. Dissertação (Mestrado em Modelagem e Métodos Quantitativos) - Centro de Ciências, Universidade Federal do Ceará, 2025.
dc.identifier.uri.fl_str_mv http://repositorio.ufc.br/handle/riufc/80973
identifier_str_mv MARTINHO, Wasley Correia. Funções de covariância e robustez a outliers em processos Gaussianos. 2025. 103 f. Dissertação (Mestrado em Modelagem e Métodos Quantitativos) - Centro de Ciências, Universidade Federal do Ceará, 2025.
url http://repositorio.ufc.br/handle/riufc/80973
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal do Ceará (UFC)
instname:Universidade Federal do Ceará (UFC)
instacron:UFC
instname_str Universidade Federal do Ceará (UFC)
instacron_str UFC
institution UFC
reponame_str Repositório Institucional da Universidade Federal do Ceará (UFC)
collection Repositório Institucional da Universidade Federal do Ceará (UFC)
bitstream.url.fl_str_mv http://repositorio.ufc.br/bitstream/riufc/80973/4/license.txt
http://repositorio.ufc.br/bitstream/riufc/80973/5/2025_dis_wcmartinho.pdf
bitstream.checksum.fl_str_mv 8a4605be74aa9ea9d79846c1fba20a33
2848a3b65b2a30ae099233ad23e80760
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da Universidade Federal do Ceará (UFC) - Universidade Federal do Ceará (UFC)
repository.mail.fl_str_mv bu@ufc.br || repositorio@ufc.br
_version_ 1847793355658887168