Algoritmos matemáticos aplicados em resultados experimentais

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: Nogueira, André Luiz
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/85/85131/tde-06062023-143404/
Resumo: Este trabalho teve como objetivo avaliar o impacto da imputação de dados (métodos: média, autoencoder, análise de agrupamento e c-médias), avaliar os métodos de detecção de outliers (métodos: Mahalanobis e Mahalanobis robusta) e padronização de dados (transformadas z-score, mínimo-máximo, mínimo-máximo melhorada, logarítmica e Box-Cox) na análise de agrupamento, assim como identificar os métodos mais adequados para a base de amostras arqueológicas estudada. A base de dados foi fornecida pelo Grupo de Estudos Arqueológicos do IPENCNEN/SP, de modo que foram analisadas 140 amostras de fragmentos cerâmicos de três sítios arqueológicos. Para análise das amostras foram utilizados 13 elementos químicos: As, Na, Ce, Cr, Eu, Fe, Hf, La, Nd, Sc, Sm, Th e U. Os resultados mostraram que não houve impacto da imputação de dados nos métodos de agrupamento hierárquicos, particionais/crisp, c-médias e c-médias com polinômio fuzzificador. A exclusão dos outliers detectados pela distância Mahalanobis teve impacto no aumento da coesão entre as amostras dos sítios B e C. As transformadas utilizadas para padronização das amostras alteraram os valores da estatística de Hopkins, bem como as imagens VAT. As funções implementadas, desenvolvidas no software estatístico R, deram origem a uma aplicação web.
id USP_30db1c9880d546bdbfa10548889ba797
oai_identifier_str oai:teses.usp.br:tde-06062023-143404
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Algoritmos matemáticos aplicados em resultados experimentaisMathematical algorithms applied to experimental resultsanálise de agrupamentoaplicação webcluster analysisimputaçãoimputationoutliersoutlierspadronizaçãoR softwaresoftware Rstandardizationweb applicationEste trabalho teve como objetivo avaliar o impacto da imputação de dados (métodos: média, autoencoder, análise de agrupamento e c-médias), avaliar os métodos de detecção de outliers (métodos: Mahalanobis e Mahalanobis robusta) e padronização de dados (transformadas z-score, mínimo-máximo, mínimo-máximo melhorada, logarítmica e Box-Cox) na análise de agrupamento, assim como identificar os métodos mais adequados para a base de amostras arqueológicas estudada. A base de dados foi fornecida pelo Grupo de Estudos Arqueológicos do IPENCNEN/SP, de modo que foram analisadas 140 amostras de fragmentos cerâmicos de três sítios arqueológicos. Para análise das amostras foram utilizados 13 elementos químicos: As, Na, Ce, Cr, Eu, Fe, Hf, La, Nd, Sc, Sm, Th e U. Os resultados mostraram que não houve impacto da imputação de dados nos métodos de agrupamento hierárquicos, particionais/crisp, c-médias e c-médias com polinômio fuzzificador. A exclusão dos outliers detectados pela distância Mahalanobis teve impacto no aumento da coesão entre as amostras dos sítios B e C. As transformadas utilizadas para padronização das amostras alteraram os valores da estatística de Hopkins, bem como as imagens VAT. As funções implementadas, desenvolvidas no software estatístico R, deram origem a uma aplicação web.This thesis aimed to evaluate the impact of data imputation (methods: mean, autoencoder, clustering and c-means), evaluate the methods of outliers detection (methods: Mahalanobis and robust Mahalanobis), and data standardization (transforms: z-score, min-max, min-max improved, logarithmic and Box-Cox) in cluster analysis, as well as to identify the most suitable method to the test basis for the archaeological sampling researched. The basis was provided by the Group of Archaeological Studies from IPEN-CNEN/SP, so were analysed 140 samples of pottery fragments from three archaeological sites. For sample analysis, were used 13 chemical elements: As, Na, Ce, Cr, Eu, Fe, Hf, La, Nd, Sc, Sm, Th and U. The results showed that there was no impact of data imputation on the hierarchical clustering methods, crisp partitions, c-means and c-means with fuzzifier polynomial. The exclusion of outliers detected by Mahalanobis distance had the impact of increasing cohesion between the samples of sites B and C. The transforms used to standardize the samples changed the Hopkins coefficient value as well as VAT images. The implemented functions, developed in the R statistical software, resulted in a web application.Biblioteca Digitais de Teses e Dissertações da USPMunita, Casimiro Jaime Alfredo SepúlvedaNogueira, André Luiz2023-03-23info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/85/85131/tde-06062023-143404/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2023-06-13T16:42:34Zoai:teses.usp.br:tde-06062023-143404Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-06-13T16:42:34Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Algoritmos matemáticos aplicados em resultados experimentais
Mathematical algorithms applied to experimental results
title Algoritmos matemáticos aplicados em resultados experimentais
spellingShingle Algoritmos matemáticos aplicados em resultados experimentais
Nogueira, André Luiz
análise de agrupamento
aplicação web
cluster analysis
imputação
imputation
outliers
outliers
padronização
R software
software R
standardization
web application
title_short Algoritmos matemáticos aplicados em resultados experimentais
title_full Algoritmos matemáticos aplicados em resultados experimentais
title_fullStr Algoritmos matemáticos aplicados em resultados experimentais
title_full_unstemmed Algoritmos matemáticos aplicados em resultados experimentais
title_sort Algoritmos matemáticos aplicados em resultados experimentais
author Nogueira, André Luiz
author_facet Nogueira, André Luiz
author_role author
dc.contributor.none.fl_str_mv Munita, Casimiro Jaime Alfredo Sepúlveda
dc.contributor.author.fl_str_mv Nogueira, André Luiz
dc.subject.por.fl_str_mv análise de agrupamento
aplicação web
cluster analysis
imputação
imputation
outliers
outliers
padronização
R software
software R
standardization
web application
topic análise de agrupamento
aplicação web
cluster analysis
imputação
imputation
outliers
outliers
padronização
R software
software R
standardization
web application
description Este trabalho teve como objetivo avaliar o impacto da imputação de dados (métodos: média, autoencoder, análise de agrupamento e c-médias), avaliar os métodos de detecção de outliers (métodos: Mahalanobis e Mahalanobis robusta) e padronização de dados (transformadas z-score, mínimo-máximo, mínimo-máximo melhorada, logarítmica e Box-Cox) na análise de agrupamento, assim como identificar os métodos mais adequados para a base de amostras arqueológicas estudada. A base de dados foi fornecida pelo Grupo de Estudos Arqueológicos do IPENCNEN/SP, de modo que foram analisadas 140 amostras de fragmentos cerâmicos de três sítios arqueológicos. Para análise das amostras foram utilizados 13 elementos químicos: As, Na, Ce, Cr, Eu, Fe, Hf, La, Nd, Sc, Sm, Th e U. Os resultados mostraram que não houve impacto da imputação de dados nos métodos de agrupamento hierárquicos, particionais/crisp, c-médias e c-médias com polinômio fuzzificador. A exclusão dos outliers detectados pela distância Mahalanobis teve impacto no aumento da coesão entre as amostras dos sítios B e C. As transformadas utilizadas para padronização das amostras alteraram os valores da estatística de Hopkins, bem como as imagens VAT. As funções implementadas, desenvolvidas no software estatístico R, deram origem a uma aplicação web.
publishDate 2023
dc.date.none.fl_str_mv 2023-03-23
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/85/85131/tde-06062023-143404/
url https://www.teses.usp.br/teses/disponiveis/85/85131/tde-06062023-143404/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1865490963593428992