Métodos para detecção de Outliers multivariados: Via uso dos estimadores robustos

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: Martins, Humberto Marcílio lattes
Orientador(a): Ferreira, Daniel Furtado
Banca de defesa: Ferreira, Daniel Furtado, Nogueira, Denismar Alves, Beijo, Luiz Alberto, Batista, Ben Deivide de Oliveira
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Lavras
Programa de Pós-Graduação: Programa de Pós-Graduação em Estatística e Experimentação Agropecuária
Departamento: Departamento de Estatística
País: brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.ufla.br/handle/1/50190
Resumo: Na aplicação da análise multivariada é necessário seguir alguns procedimentos para não obter uma relação equivocada do fenômeno de interesse com as demais variáveis, ou seja, o modelo precisa ser bem ajustado às características do fenômeno sob estudo. A detecção de outliers é um importante método a ser aplicado nas análises estatísticas, pois um único outlier pode cau- sar mudanças nas estimativas dos parâmetros, interferir também nos testes de normalidade e de correlação entre as variáveis, além de alterar os resultados de qualquer outro procedimento de inferência. Portanto, o objetivo desse trabalho é apresentar e comparar alguns métodos de de- tecção de outliers em dados multivariados. Foram comparados os métodos elipsóide de volume mínimo (MVE), Covariância de volume mínimo (MCD), Ortogonalizado de Gnanadesikan e Kettenring (OGK), componentes principais para detecção de outliers (PCOut) e o Comedian. Para realizar as comparações foi utilizado uma série de simulações prevendo diversas situações utilizando a distribuição normal contaminada. As comparações foram avaliadas atráves da taxa de sucesso (TS), que aponta a porcentagem de outliers que os métodos identificaram correta- mente e da taxa de falsa detecção (TFD), que aponta a porcentagem de observações que não são outliers, mas foram identificadas como outliers. Conclui-se que o ideal é utlizar ao menos dois métodos de detecção de outliers, visto que apontar o único método como melhor é uma tarefa díficil. No entanto, os métodos PCOut e Comedian obtiveram as TS melhores na maioria dos cenários simulados. O método comedian obteve as melhores TFD.
id UFLA_4e5d975caf83f3a2bd2243ab92343528
oai_identifier_str oai:repositorio.ufla.br:1/50190
network_acronym_str UFLA
network_name_str Repositório Institucional da UFLA
repository_id_str
spelling 2022-06-10T20:18:45Z2022-06-10T20:18:45Z2022-06-102022-03-14MARTINS, H. M. Métodos para detecção de Outliers multivariados: Via uso dos estimadores robustos. 2022. 90 p. Dissertação (Mestrado em Estatística e Experimentação Agropecuária) - Universidade Federal de Lavras, Lavras, 2022.https://repositorio.ufla.br/handle/1/50190Na aplicação da análise multivariada é necessário seguir alguns procedimentos para não obter uma relação equivocada do fenômeno de interesse com as demais variáveis, ou seja, o modelo precisa ser bem ajustado às características do fenômeno sob estudo. A detecção de outliers é um importante método a ser aplicado nas análises estatísticas, pois um único outlier pode cau- sar mudanças nas estimativas dos parâmetros, interferir também nos testes de normalidade e de correlação entre as variáveis, além de alterar os resultados de qualquer outro procedimento de inferência. Portanto, o objetivo desse trabalho é apresentar e comparar alguns métodos de de- tecção de outliers em dados multivariados. Foram comparados os métodos elipsóide de volume mínimo (MVE), Covariância de volume mínimo (MCD), Ortogonalizado de Gnanadesikan e Kettenring (OGK), componentes principais para detecção de outliers (PCOut) e o Comedian. Para realizar as comparações foi utilizado uma série de simulações prevendo diversas situações utilizando a distribuição normal contaminada. As comparações foram avaliadas atráves da taxa de sucesso (TS), que aponta a porcentagem de outliers que os métodos identificaram correta- mente e da taxa de falsa detecção (TFD), que aponta a porcentagem de observações que não são outliers, mas foram identificadas como outliers. Conclui-se que o ideal é utlizar ao menos dois métodos de detecção de outliers, visto que apontar o único método como melhor é uma tarefa díficil. No entanto, os métodos PCOut e Comedian obtiveram as TS melhores na maioria dos cenários simulados. O método comedian obteve as melhores TFD.In the application of the multivariate analysis, it is necessary to follow some procedures in order not to obtain an erroneous relationship between the phenomenon of interest and the other varia- bles, that is, the model needs to be well adjusted to the characteristics of the phenomenon under study. The detection of outliers is an important method to be applied in statistical analyses, because a single outlier can cause changes in parameter estimates, also interfere with norma- lity and correlation tests between variables, in addition to alter the results of any other inference procedure. Therefore, the objective of this work is to present and compare some methods for de- tecting outliers in multivariate data. The minimum volume ellipsoid (MVE), minimum volume covariance (MCD), orthogonalized Gnanadesikan and Kettenring (OGK) methods, principal components for detection of outliers (PCOut) and Comedian were compared. To perform the comparisons, a series of simulations was used, predicting different situations using the conta- minated normal distribution. Comparisons were evaluated through the success rate (TS), which indicates the percentage of outliers that the methods correctly identified, and the false detec- tion rate (TFD), which indicates the percentage of observations that are not outliers, but were identified as outliers. It is concluded that the ideal is to use at least two methods to detect ou- tliers, since pointing out the only method as the best is a difficult task. However, the PCOut and Comedian methods obtained the best TS in most of the simulated scenarios. The comedian method obtained the best TFD.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)Universidade Federal de LavrasPrograma de Pós-Graduação em Estatística e Experimentação AgropecuáriaUFLAbrasilDepartamento de EstatísticaEstatísticaEstimador robusto comedianComedian robust estimatorPrincipal components for detection of outliers (PCOut)Estimador Ortogonalizado de Gnanadesikan-Kettenring (OGK)Métodos para detecção de Outliers multivariados: Via uso dos estimadores robustosMethods for detection of multivariate outliers: via the use of robust estimatorsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisFerreira, Daniel FurtadoFerreira, Daniel FurtadoNogueira, Denismar AlvesBeijo, Luiz AlbertoBatista, Ben Deivide de Oliveirahttp://lattes.cnpq.br/4396332068832173Martins, Humberto Marcílioinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFLAinstname:Universidade Federal de Lavras (UFLA)instacron:UFLALICENSElicense.txtlicense.txttext/plain; charset=utf-8953https://repositorio.ufla.br/bitstreams/df62414e-624e-4d25-907f-fe965950d9d4/download760884c1e72224de569e74f79eb87ce3MD51falseAnonymousREADORIGINALDISSERTAÇÃO_Métodos para detecção de Outliers multivariados: Via uso dos estimadores robustos.pdfDISSERTAÇÃO_Métodos para detecção de Outliers multivariados: Via uso dos estimadores robustos.pdfapplication/pdf785144https://repositorio.ufla.br/bitstreams/0a664dc9-87d1-4b55-9d00-92a31cd894ab/downloadd200391e3aa40672326e13746511f986MD52trueAnonymousREADTEXTDISSERTAÇÃO_Métodos para detecção de Outliers multivariados: Via uso dos estimadores robustos.pdf.txtDISSERTAÇÃO_Métodos para detecção de Outliers multivariados: Via uso dos estimadores robustos.pdf.txtExtracted texttext/plain104150https://repositorio.ufla.br/bitstreams/af0a55c7-2f82-495b-88be-75928550a63c/download0c3584877cd998cf723e81cf1f39405bMD53falseAnonymousREADTHUMBNAILDISSERTAÇÃO_Métodos para detecção de Outliers multivariados: Via uso dos estimadores robustos.pdf.jpgDISSERTAÇÃO_Métodos para detecção de Outliers multivariados: Via uso dos estimadores robustos.pdf.jpgGenerated Thumbnailimage/jpeg3120https://repositorio.ufla.br/bitstreams/1887d16b-0f35-4226-81d9-0b0c9beb2693/download87b4118f78d0137531ce4ea541c6afd7MD54falseAnonymousREAD1/501902025-08-06 11:15:47.142open.accessoai:repositorio.ufla.br:1/50190https://repositorio.ufla.brRepositório InstitucionalPUBhttps://repositorio.ufla.br/server/oai/requestnivaldo@ufla.br || repositorio.biblioteca@ufla.bropendoar:2025-08-06T14:15:47Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA)falseREVDTEFSQcOHw4NPIERFIERJU1RSSUJVScOHw4NPIE7Dg08tRVhDTFVTSVZBCk8gcmVmZXJpZG8gYXV0b3I6CmEpIERlY2xhcmEgcXVlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIHNldSB0cmFiYWxobyBvcmlnaW5hbCwgZSBxdWUKZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4KRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2UsIHRhbnRvIHF1YW50bwpsaGUgw6kgcG9zc8OtdmVsIHNhYmVyLCBvcyBkaXJlaXRvcyBkZSBxdWFscXVlciBvdXRyYSBwZXNzb2Egb3UKZW50aWRhZGUuCmIpIFNlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIGNvbnTDqW0gbWF0ZXJpYWwgZG8gcXVhbCBuw6NvIGRldMOpbSBvcwpkaXJlaXRvcyBkZSBhdXRvciwgZGVjbGFyYSBxdWUgb2J0ZXZlIGF1dG9yaXphw6fDo28gZG8gZGV0ZW50b3IgZG9zCmRpcmVpdG9zIGRlIGF1dG9yIHBhcmEgY29uY2VkZXIgw6AgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgTGF2cmFzIG9zCmRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgY3Vqb3MKZGlyZWl0b3Mgc8OjbyBkZSB0ZXJjZWlyb3MgZXN0w6EgY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbwpubyB0ZXh0byBvdSBjb250ZcO6ZG8gZG8gZG9jdW1lbnRvIGVudHJlZ3VlLiBTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqQpiYXNlYWRvIGVtIHRyYWJhbGhvIGZpbmFuY2lhZG8gb3UgYXBvaWFkbyBwb3Igb3V0cmEgaW5zdGl0dWnDp8OjbyBxdWUKbsOjbyBhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIExhdnJhcywgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIKb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gcmVzcGVjdGl2byBjb250cmF0byBvdSBhY29yZG8uCgo=
dc.title.pt_BR.fl_str_mv Métodos para detecção de Outliers multivariados: Via uso dos estimadores robustos
dc.title.alternative.pt_BR.fl_str_mv Methods for detection of multivariate outliers: via the use of robust estimators
title Métodos para detecção de Outliers multivariados: Via uso dos estimadores robustos
spellingShingle Métodos para detecção de Outliers multivariados: Via uso dos estimadores robustos
Martins, Humberto Marcílio
Estatística
Estimador robusto comedian
Comedian robust estimator
Principal components for detection of outliers (PCOut)
Estimador Ortogonalizado de Gnanadesikan-Kettenring (OGK)
title_short Métodos para detecção de Outliers multivariados: Via uso dos estimadores robustos
title_full Métodos para detecção de Outliers multivariados: Via uso dos estimadores robustos
title_fullStr Métodos para detecção de Outliers multivariados: Via uso dos estimadores robustos
title_full_unstemmed Métodos para detecção de Outliers multivariados: Via uso dos estimadores robustos
title_sort Métodos para detecção de Outliers multivariados: Via uso dos estimadores robustos
author Martins, Humberto Marcílio
author_facet Martins, Humberto Marcílio
author_role author
dc.contributor.advisor1.fl_str_mv Ferreira, Daniel Furtado
dc.contributor.referee1.fl_str_mv Ferreira, Daniel Furtado
dc.contributor.referee2.fl_str_mv Nogueira, Denismar Alves
dc.contributor.referee3.fl_str_mv Beijo, Luiz Alberto
dc.contributor.referee4.fl_str_mv Batista, Ben Deivide de Oliveira
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/4396332068832173
dc.contributor.author.fl_str_mv Martins, Humberto Marcílio
contributor_str_mv Ferreira, Daniel Furtado
Ferreira, Daniel Furtado
Nogueira, Denismar Alves
Beijo, Luiz Alberto
Batista, Ben Deivide de Oliveira
dc.subject.cnpq.fl_str_mv Estatística
topic Estatística
Estimador robusto comedian
Comedian robust estimator
Principal components for detection of outliers (PCOut)
Estimador Ortogonalizado de Gnanadesikan-Kettenring (OGK)
dc.subject.por.fl_str_mv Estimador robusto comedian
Comedian robust estimator
Principal components for detection of outliers (PCOut)
Estimador Ortogonalizado de Gnanadesikan-Kettenring (OGK)
description Na aplicação da análise multivariada é necessário seguir alguns procedimentos para não obter uma relação equivocada do fenômeno de interesse com as demais variáveis, ou seja, o modelo precisa ser bem ajustado às características do fenômeno sob estudo. A detecção de outliers é um importante método a ser aplicado nas análises estatísticas, pois um único outlier pode cau- sar mudanças nas estimativas dos parâmetros, interferir também nos testes de normalidade e de correlação entre as variáveis, além de alterar os resultados de qualquer outro procedimento de inferência. Portanto, o objetivo desse trabalho é apresentar e comparar alguns métodos de de- tecção de outliers em dados multivariados. Foram comparados os métodos elipsóide de volume mínimo (MVE), Covariância de volume mínimo (MCD), Ortogonalizado de Gnanadesikan e Kettenring (OGK), componentes principais para detecção de outliers (PCOut) e o Comedian. Para realizar as comparações foi utilizado uma série de simulações prevendo diversas situações utilizando a distribuição normal contaminada. As comparações foram avaliadas atráves da taxa de sucesso (TS), que aponta a porcentagem de outliers que os métodos identificaram correta- mente e da taxa de falsa detecção (TFD), que aponta a porcentagem de observações que não são outliers, mas foram identificadas como outliers. Conclui-se que o ideal é utlizar ao menos dois métodos de detecção de outliers, visto que apontar o único método como melhor é uma tarefa díficil. No entanto, os métodos PCOut e Comedian obtiveram as TS melhores na maioria dos cenários simulados. O método comedian obteve as melhores TFD.
publishDate 2022
dc.date.submitted.none.fl_str_mv 2022-03-14
dc.date.accessioned.fl_str_mv 2022-06-10T20:18:45Z
dc.date.available.fl_str_mv 2022-06-10T20:18:45Z
dc.date.issued.fl_str_mv 2022-06-10
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv MARTINS, H. M. Métodos para detecção de Outliers multivariados: Via uso dos estimadores robustos. 2022. 90 p. Dissertação (Mestrado em Estatística e Experimentação Agropecuária) - Universidade Federal de Lavras, Lavras, 2022.
dc.identifier.uri.fl_str_mv https://repositorio.ufla.br/handle/1/50190
identifier_str_mv MARTINS, H. M. Métodos para detecção de Outliers multivariados: Via uso dos estimadores robustos. 2022. 90 p. Dissertação (Mestrado em Estatística e Experimentação Agropecuária) - Universidade Federal de Lavras, Lavras, 2022.
url https://repositorio.ufla.br/handle/1/50190
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Lavras
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Estatística e Experimentação Agropecuária
dc.publisher.initials.fl_str_mv UFLA
dc.publisher.country.fl_str_mv brasil
dc.publisher.department.fl_str_mv Departamento de Estatística
publisher.none.fl_str_mv Universidade Federal de Lavras
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFLA
instname:Universidade Federal de Lavras (UFLA)
instacron:UFLA
instname_str Universidade Federal de Lavras (UFLA)
instacron_str UFLA
institution UFLA
reponame_str Repositório Institucional da UFLA
collection Repositório Institucional da UFLA
bitstream.url.fl_str_mv https://repositorio.ufla.br/bitstreams/df62414e-624e-4d25-907f-fe965950d9d4/download
https://repositorio.ufla.br/bitstreams/0a664dc9-87d1-4b55-9d00-92a31cd894ab/download
https://repositorio.ufla.br/bitstreams/af0a55c7-2f82-495b-88be-75928550a63c/download
https://repositorio.ufla.br/bitstreams/1887d16b-0f35-4226-81d9-0b0c9beb2693/download
bitstream.checksum.fl_str_mv 760884c1e72224de569e74f79eb87ce3
d200391e3aa40672326e13746511f986
0c3584877cd998cf723e81cf1f39405b
87b4118f78d0137531ce4ea541c6afd7
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA)
repository.mail.fl_str_mv nivaldo@ufla.br || repositorio.biblioteca@ufla.br
_version_ 1854947676045443072