Métodos para detecção de Outliers multivariados: Via uso dos estimadores robustos
| Ano de defesa: | 2022 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | , , , |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de Lavras
|
| Programa de Pós-Graduação: |
Programa de Pós-Graduação em Estatística e Experimentação Agropecuária
|
| Departamento: |
Departamento de Estatística
|
| País: |
brasil
|
| Palavras-chave em Português: | |
| Área do conhecimento CNPq: | |
| Link de acesso: | https://repositorio.ufla.br/handle/1/50190 |
Resumo: | Na aplicação da análise multivariada é necessário seguir alguns procedimentos para não obter uma relação equivocada do fenômeno de interesse com as demais variáveis, ou seja, o modelo precisa ser bem ajustado às características do fenômeno sob estudo. A detecção de outliers é um importante método a ser aplicado nas análises estatísticas, pois um único outlier pode cau- sar mudanças nas estimativas dos parâmetros, interferir também nos testes de normalidade e de correlação entre as variáveis, além de alterar os resultados de qualquer outro procedimento de inferência. Portanto, o objetivo desse trabalho é apresentar e comparar alguns métodos de de- tecção de outliers em dados multivariados. Foram comparados os métodos elipsóide de volume mínimo (MVE), Covariância de volume mínimo (MCD), Ortogonalizado de Gnanadesikan e Kettenring (OGK), componentes principais para detecção de outliers (PCOut) e o Comedian. Para realizar as comparações foi utilizado uma série de simulações prevendo diversas situações utilizando a distribuição normal contaminada. As comparações foram avaliadas atráves da taxa de sucesso (TS), que aponta a porcentagem de outliers que os métodos identificaram correta- mente e da taxa de falsa detecção (TFD), que aponta a porcentagem de observações que não são outliers, mas foram identificadas como outliers. Conclui-se que o ideal é utlizar ao menos dois métodos de detecção de outliers, visto que apontar o único método como melhor é uma tarefa díficil. No entanto, os métodos PCOut e Comedian obtiveram as TS melhores na maioria dos cenários simulados. O método comedian obteve as melhores TFD. |
| id |
UFLA_4e5d975caf83f3a2bd2243ab92343528 |
|---|---|
| oai_identifier_str |
oai:repositorio.ufla.br:1/50190 |
| network_acronym_str |
UFLA |
| network_name_str |
Repositório Institucional da UFLA |
| repository_id_str |
|
| spelling |
2022-06-10T20:18:45Z2022-06-10T20:18:45Z2022-06-102022-03-14MARTINS, H. M. Métodos para detecção de Outliers multivariados: Via uso dos estimadores robustos. 2022. 90 p. Dissertação (Mestrado em Estatística e Experimentação Agropecuária) - Universidade Federal de Lavras, Lavras, 2022.https://repositorio.ufla.br/handle/1/50190Na aplicação da análise multivariada é necessário seguir alguns procedimentos para não obter uma relação equivocada do fenômeno de interesse com as demais variáveis, ou seja, o modelo precisa ser bem ajustado às características do fenômeno sob estudo. A detecção de outliers é um importante método a ser aplicado nas análises estatísticas, pois um único outlier pode cau- sar mudanças nas estimativas dos parâmetros, interferir também nos testes de normalidade e de correlação entre as variáveis, além de alterar os resultados de qualquer outro procedimento de inferência. Portanto, o objetivo desse trabalho é apresentar e comparar alguns métodos de de- tecção de outliers em dados multivariados. Foram comparados os métodos elipsóide de volume mínimo (MVE), Covariância de volume mínimo (MCD), Ortogonalizado de Gnanadesikan e Kettenring (OGK), componentes principais para detecção de outliers (PCOut) e o Comedian. Para realizar as comparações foi utilizado uma série de simulações prevendo diversas situações utilizando a distribuição normal contaminada. As comparações foram avaliadas atráves da taxa de sucesso (TS), que aponta a porcentagem de outliers que os métodos identificaram correta- mente e da taxa de falsa detecção (TFD), que aponta a porcentagem de observações que não são outliers, mas foram identificadas como outliers. Conclui-se que o ideal é utlizar ao menos dois métodos de detecção de outliers, visto que apontar o único método como melhor é uma tarefa díficil. No entanto, os métodos PCOut e Comedian obtiveram as TS melhores na maioria dos cenários simulados. O método comedian obteve as melhores TFD.In the application of the multivariate analysis, it is necessary to follow some procedures in order not to obtain an erroneous relationship between the phenomenon of interest and the other varia- bles, that is, the model needs to be well adjusted to the characteristics of the phenomenon under study. The detection of outliers is an important method to be applied in statistical analyses, because a single outlier can cause changes in parameter estimates, also interfere with norma- lity and correlation tests between variables, in addition to alter the results of any other inference procedure. Therefore, the objective of this work is to present and compare some methods for de- tecting outliers in multivariate data. The minimum volume ellipsoid (MVE), minimum volume covariance (MCD), orthogonalized Gnanadesikan and Kettenring (OGK) methods, principal components for detection of outliers (PCOut) and Comedian were compared. To perform the comparisons, a series of simulations was used, predicting different situations using the conta- minated normal distribution. Comparisons were evaluated through the success rate (TS), which indicates the percentage of outliers that the methods correctly identified, and the false detec- tion rate (TFD), which indicates the percentage of observations that are not outliers, but were identified as outliers. It is concluded that the ideal is to use at least two methods to detect ou- tliers, since pointing out the only method as the best is a difficult task. However, the PCOut and Comedian methods obtained the best TS in most of the simulated scenarios. The comedian method obtained the best TFD.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)Universidade Federal de LavrasPrograma de Pós-Graduação em Estatística e Experimentação AgropecuáriaUFLAbrasilDepartamento de EstatísticaEstatísticaEstimador robusto comedianComedian robust estimatorPrincipal components for detection of outliers (PCOut)Estimador Ortogonalizado de Gnanadesikan-Kettenring (OGK)Métodos para detecção de Outliers multivariados: Via uso dos estimadores robustosMethods for detection of multivariate outliers: via the use of robust estimatorsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisFerreira, Daniel FurtadoFerreira, Daniel FurtadoNogueira, Denismar AlvesBeijo, Luiz AlbertoBatista, Ben Deivide de Oliveirahttp://lattes.cnpq.br/4396332068832173Martins, Humberto Marcílioinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFLAinstname:Universidade Federal de Lavras (UFLA)instacron:UFLALICENSElicense.txtlicense.txttext/plain; charset=utf-8953https://repositorio.ufla.br/bitstreams/df62414e-624e-4d25-907f-fe965950d9d4/download760884c1e72224de569e74f79eb87ce3MD51falseAnonymousREADORIGINALDISSERTAÇÃO_Métodos para detecção de Outliers multivariados: Via uso dos estimadores robustos.pdfDISSERTAÇÃO_Métodos para detecção de Outliers multivariados: Via uso dos estimadores robustos.pdfapplication/pdf785144https://repositorio.ufla.br/bitstreams/0a664dc9-87d1-4b55-9d00-92a31cd894ab/downloadd200391e3aa40672326e13746511f986MD52trueAnonymousREADTEXTDISSERTAÇÃO_Métodos para detecção de Outliers multivariados: Via uso dos estimadores robustos.pdf.txtDISSERTAÇÃO_Métodos para detecção de Outliers multivariados: Via uso dos estimadores robustos.pdf.txtExtracted texttext/plain104150https://repositorio.ufla.br/bitstreams/af0a55c7-2f82-495b-88be-75928550a63c/download0c3584877cd998cf723e81cf1f39405bMD53falseAnonymousREADTHUMBNAILDISSERTAÇÃO_Métodos para detecção de Outliers multivariados: Via uso dos estimadores robustos.pdf.jpgDISSERTAÇÃO_Métodos para detecção de Outliers multivariados: Via uso dos estimadores robustos.pdf.jpgGenerated Thumbnailimage/jpeg3120https://repositorio.ufla.br/bitstreams/1887d16b-0f35-4226-81d9-0b0c9beb2693/download87b4118f78d0137531ce4ea541c6afd7MD54falseAnonymousREAD1/501902025-08-06 11:15:47.142open.accessoai:repositorio.ufla.br:1/50190https://repositorio.ufla.brRepositório InstitucionalPUBhttps://repositorio.ufla.br/server/oai/requestnivaldo@ufla.br || repositorio.biblioteca@ufla.bropendoar:2025-08-06T14:15:47Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA)falseREVDTEFSQcOHw4NPIERFIERJU1RSSUJVScOHw4NPIE7Dg08tRVhDTFVTSVZBCk8gcmVmZXJpZG8gYXV0b3I6CmEpIERlY2xhcmEgcXVlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIHNldSB0cmFiYWxobyBvcmlnaW5hbCwgZSBxdWUKZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4KRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2UsIHRhbnRvIHF1YW50bwpsaGUgw6kgcG9zc8OtdmVsIHNhYmVyLCBvcyBkaXJlaXRvcyBkZSBxdWFscXVlciBvdXRyYSBwZXNzb2Egb3UKZW50aWRhZGUuCmIpIFNlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIGNvbnTDqW0gbWF0ZXJpYWwgZG8gcXVhbCBuw6NvIGRldMOpbSBvcwpkaXJlaXRvcyBkZSBhdXRvciwgZGVjbGFyYSBxdWUgb2J0ZXZlIGF1dG9yaXphw6fDo28gZG8gZGV0ZW50b3IgZG9zCmRpcmVpdG9zIGRlIGF1dG9yIHBhcmEgY29uY2VkZXIgw6AgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgTGF2cmFzIG9zCmRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgY3Vqb3MKZGlyZWl0b3Mgc8OjbyBkZSB0ZXJjZWlyb3MgZXN0w6EgY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbwpubyB0ZXh0byBvdSBjb250ZcO6ZG8gZG8gZG9jdW1lbnRvIGVudHJlZ3VlLiBTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqQpiYXNlYWRvIGVtIHRyYWJhbGhvIGZpbmFuY2lhZG8gb3UgYXBvaWFkbyBwb3Igb3V0cmEgaW5zdGl0dWnDp8OjbyBxdWUKbsOjbyBhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIExhdnJhcywgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIKb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gcmVzcGVjdGl2byBjb250cmF0byBvdSBhY29yZG8uCgo= |
| dc.title.pt_BR.fl_str_mv |
Métodos para detecção de Outliers multivariados: Via uso dos estimadores robustos |
| dc.title.alternative.pt_BR.fl_str_mv |
Methods for detection of multivariate outliers: via the use of robust estimators |
| title |
Métodos para detecção de Outliers multivariados: Via uso dos estimadores robustos |
| spellingShingle |
Métodos para detecção de Outliers multivariados: Via uso dos estimadores robustos Martins, Humberto Marcílio Estatística Estimador robusto comedian Comedian robust estimator Principal components for detection of outliers (PCOut) Estimador Ortogonalizado de Gnanadesikan-Kettenring (OGK) |
| title_short |
Métodos para detecção de Outliers multivariados: Via uso dos estimadores robustos |
| title_full |
Métodos para detecção de Outliers multivariados: Via uso dos estimadores robustos |
| title_fullStr |
Métodos para detecção de Outliers multivariados: Via uso dos estimadores robustos |
| title_full_unstemmed |
Métodos para detecção de Outliers multivariados: Via uso dos estimadores robustos |
| title_sort |
Métodos para detecção de Outliers multivariados: Via uso dos estimadores robustos |
| author |
Martins, Humberto Marcílio |
| author_facet |
Martins, Humberto Marcílio |
| author_role |
author |
| dc.contributor.advisor1.fl_str_mv |
Ferreira, Daniel Furtado |
| dc.contributor.referee1.fl_str_mv |
Ferreira, Daniel Furtado |
| dc.contributor.referee2.fl_str_mv |
Nogueira, Denismar Alves |
| dc.contributor.referee3.fl_str_mv |
Beijo, Luiz Alberto |
| dc.contributor.referee4.fl_str_mv |
Batista, Ben Deivide de Oliveira |
| dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/4396332068832173 |
| dc.contributor.author.fl_str_mv |
Martins, Humberto Marcílio |
| contributor_str_mv |
Ferreira, Daniel Furtado Ferreira, Daniel Furtado Nogueira, Denismar Alves Beijo, Luiz Alberto Batista, Ben Deivide de Oliveira |
| dc.subject.cnpq.fl_str_mv |
Estatística |
| topic |
Estatística Estimador robusto comedian Comedian robust estimator Principal components for detection of outliers (PCOut) Estimador Ortogonalizado de Gnanadesikan-Kettenring (OGK) |
| dc.subject.por.fl_str_mv |
Estimador robusto comedian Comedian robust estimator Principal components for detection of outliers (PCOut) Estimador Ortogonalizado de Gnanadesikan-Kettenring (OGK) |
| description |
Na aplicação da análise multivariada é necessário seguir alguns procedimentos para não obter uma relação equivocada do fenômeno de interesse com as demais variáveis, ou seja, o modelo precisa ser bem ajustado às características do fenômeno sob estudo. A detecção de outliers é um importante método a ser aplicado nas análises estatísticas, pois um único outlier pode cau- sar mudanças nas estimativas dos parâmetros, interferir também nos testes de normalidade e de correlação entre as variáveis, além de alterar os resultados de qualquer outro procedimento de inferência. Portanto, o objetivo desse trabalho é apresentar e comparar alguns métodos de de- tecção de outliers em dados multivariados. Foram comparados os métodos elipsóide de volume mínimo (MVE), Covariância de volume mínimo (MCD), Ortogonalizado de Gnanadesikan e Kettenring (OGK), componentes principais para detecção de outliers (PCOut) e o Comedian. Para realizar as comparações foi utilizado uma série de simulações prevendo diversas situações utilizando a distribuição normal contaminada. As comparações foram avaliadas atráves da taxa de sucesso (TS), que aponta a porcentagem de outliers que os métodos identificaram correta- mente e da taxa de falsa detecção (TFD), que aponta a porcentagem de observações que não são outliers, mas foram identificadas como outliers. Conclui-se que o ideal é utlizar ao menos dois métodos de detecção de outliers, visto que apontar o único método como melhor é uma tarefa díficil. No entanto, os métodos PCOut e Comedian obtiveram as TS melhores na maioria dos cenários simulados. O método comedian obteve as melhores TFD. |
| publishDate |
2022 |
| dc.date.submitted.none.fl_str_mv |
2022-03-14 |
| dc.date.accessioned.fl_str_mv |
2022-06-10T20:18:45Z |
| dc.date.available.fl_str_mv |
2022-06-10T20:18:45Z |
| dc.date.issued.fl_str_mv |
2022-06-10 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
MARTINS, H. M. Métodos para detecção de Outliers multivariados: Via uso dos estimadores robustos. 2022. 90 p. Dissertação (Mestrado em Estatística e Experimentação Agropecuária) - Universidade Federal de Lavras, Lavras, 2022. |
| dc.identifier.uri.fl_str_mv |
https://repositorio.ufla.br/handle/1/50190 |
| identifier_str_mv |
MARTINS, H. M. Métodos para detecção de Outliers multivariados: Via uso dos estimadores robustos. 2022. 90 p. Dissertação (Mestrado em Estatística e Experimentação Agropecuária) - Universidade Federal de Lavras, Lavras, 2022. |
| url |
https://repositorio.ufla.br/handle/1/50190 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal de Lavras |
| dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Estatística e Experimentação Agropecuária |
| dc.publisher.initials.fl_str_mv |
UFLA |
| dc.publisher.country.fl_str_mv |
brasil |
| dc.publisher.department.fl_str_mv |
Departamento de Estatística |
| publisher.none.fl_str_mv |
Universidade Federal de Lavras |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFLA instname:Universidade Federal de Lavras (UFLA) instacron:UFLA |
| instname_str |
Universidade Federal de Lavras (UFLA) |
| instacron_str |
UFLA |
| institution |
UFLA |
| reponame_str |
Repositório Institucional da UFLA |
| collection |
Repositório Institucional da UFLA |
| bitstream.url.fl_str_mv |
https://repositorio.ufla.br/bitstreams/df62414e-624e-4d25-907f-fe965950d9d4/download https://repositorio.ufla.br/bitstreams/0a664dc9-87d1-4b55-9d00-92a31cd894ab/download https://repositorio.ufla.br/bitstreams/af0a55c7-2f82-495b-88be-75928550a63c/download https://repositorio.ufla.br/bitstreams/1887d16b-0f35-4226-81d9-0b0c9beb2693/download |
| bitstream.checksum.fl_str_mv |
760884c1e72224de569e74f79eb87ce3 d200391e3aa40672326e13746511f986 0c3584877cd998cf723e81cf1f39405b 87b4118f78d0137531ce4ea541c6afd7 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA) |
| repository.mail.fl_str_mv |
nivaldo@ufla.br || repositorio.biblioteca@ufla.br |
| _version_ |
1854947676045443072 |