Algoritmos matemáticos aplicados em resultados experimentais
| Ano de defesa: | 2023 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/85/85131/tde-06062023-143404/ |
Resumo: | Este trabalho teve como objetivo avaliar o impacto da imputação de dados (métodos: média, autoencoder, análise de agrupamento e c-médias), avaliar os métodos de detecção de outliers (métodos: Mahalanobis e Mahalanobis robusta) e padronização de dados (transformadas z-score, mínimo-máximo, mínimo-máximo melhorada, logarítmica e Box-Cox) na análise de agrupamento, assim como identificar os métodos mais adequados para a base de amostras arqueológicas estudada. A base de dados foi fornecida pelo Grupo de Estudos Arqueológicos do IPENCNEN/SP, de modo que foram analisadas 140 amostras de fragmentos cerâmicos de três sítios arqueológicos. Para análise das amostras foram utilizados 13 elementos químicos: As, Na, Ce, Cr, Eu, Fe, Hf, La, Nd, Sc, Sm, Th e U. Os resultados mostraram que não houve impacto da imputação de dados nos métodos de agrupamento hierárquicos, particionais/crisp, c-médias e c-médias com polinômio fuzzificador. A exclusão dos outliers detectados pela distância Mahalanobis teve impacto no aumento da coesão entre as amostras dos sítios B e C. As transformadas utilizadas para padronização das amostras alteraram os valores da estatística de Hopkins, bem como as imagens VAT. As funções implementadas, desenvolvidas no software estatístico R, deram origem a uma aplicação web. |
| id |
USP_30db1c9880d546bdbfa10548889ba797 |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-06062023-143404 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Algoritmos matemáticos aplicados em resultados experimentaisMathematical algorithms applied to experimental resultsanálise de agrupamentoaplicação webcluster analysisimputaçãoimputationoutliersoutlierspadronizaçãoR softwaresoftware Rstandardizationweb applicationEste trabalho teve como objetivo avaliar o impacto da imputação de dados (métodos: média, autoencoder, análise de agrupamento e c-médias), avaliar os métodos de detecção de outliers (métodos: Mahalanobis e Mahalanobis robusta) e padronização de dados (transformadas z-score, mínimo-máximo, mínimo-máximo melhorada, logarítmica e Box-Cox) na análise de agrupamento, assim como identificar os métodos mais adequados para a base de amostras arqueológicas estudada. A base de dados foi fornecida pelo Grupo de Estudos Arqueológicos do IPENCNEN/SP, de modo que foram analisadas 140 amostras de fragmentos cerâmicos de três sítios arqueológicos. Para análise das amostras foram utilizados 13 elementos químicos: As, Na, Ce, Cr, Eu, Fe, Hf, La, Nd, Sc, Sm, Th e U. Os resultados mostraram que não houve impacto da imputação de dados nos métodos de agrupamento hierárquicos, particionais/crisp, c-médias e c-médias com polinômio fuzzificador. A exclusão dos outliers detectados pela distância Mahalanobis teve impacto no aumento da coesão entre as amostras dos sítios B e C. As transformadas utilizadas para padronização das amostras alteraram os valores da estatística de Hopkins, bem como as imagens VAT. As funções implementadas, desenvolvidas no software estatístico R, deram origem a uma aplicação web.This thesis aimed to evaluate the impact of data imputation (methods: mean, autoencoder, clustering and c-means), evaluate the methods of outliers detection (methods: Mahalanobis and robust Mahalanobis), and data standardization (transforms: z-score, min-max, min-max improved, logarithmic and Box-Cox) in cluster analysis, as well as to identify the most suitable method to the test basis for the archaeological sampling researched. The basis was provided by the Group of Archaeological Studies from IPEN-CNEN/SP, so were analysed 140 samples of pottery fragments from three archaeological sites. For sample analysis, were used 13 chemical elements: As, Na, Ce, Cr, Eu, Fe, Hf, La, Nd, Sc, Sm, Th and U. The results showed that there was no impact of data imputation on the hierarchical clustering methods, crisp partitions, c-means and c-means with fuzzifier polynomial. The exclusion of outliers detected by Mahalanobis distance had the impact of increasing cohesion between the samples of sites B and C. The transforms used to standardize the samples changed the Hopkins coefficient value as well as VAT images. The implemented functions, developed in the R statistical software, resulted in a web application.Biblioteca Digitais de Teses e Dissertações da USPMunita, Casimiro Jaime Alfredo SepúlvedaNogueira, André Luiz2023-03-23info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/85/85131/tde-06062023-143404/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2023-06-13T16:42:34Zoai:teses.usp.br:tde-06062023-143404Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-06-13T16:42:34Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Algoritmos matemáticos aplicados em resultados experimentais Mathematical algorithms applied to experimental results |
| title |
Algoritmos matemáticos aplicados em resultados experimentais |
| spellingShingle |
Algoritmos matemáticos aplicados em resultados experimentais Nogueira, André Luiz análise de agrupamento aplicação web cluster analysis imputação imputation outliers outliers padronização R software software R standardization web application |
| title_short |
Algoritmos matemáticos aplicados em resultados experimentais |
| title_full |
Algoritmos matemáticos aplicados em resultados experimentais |
| title_fullStr |
Algoritmos matemáticos aplicados em resultados experimentais |
| title_full_unstemmed |
Algoritmos matemáticos aplicados em resultados experimentais |
| title_sort |
Algoritmos matemáticos aplicados em resultados experimentais |
| author |
Nogueira, André Luiz |
| author_facet |
Nogueira, André Luiz |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Munita, Casimiro Jaime Alfredo Sepúlveda |
| dc.contributor.author.fl_str_mv |
Nogueira, André Luiz |
| dc.subject.por.fl_str_mv |
análise de agrupamento aplicação web cluster analysis imputação imputation outliers outliers padronização R software software R standardization web application |
| topic |
análise de agrupamento aplicação web cluster analysis imputação imputation outliers outliers padronização R software software R standardization web application |
| description |
Este trabalho teve como objetivo avaliar o impacto da imputação de dados (métodos: média, autoencoder, análise de agrupamento e c-médias), avaliar os métodos de detecção de outliers (métodos: Mahalanobis e Mahalanobis robusta) e padronização de dados (transformadas z-score, mínimo-máximo, mínimo-máximo melhorada, logarítmica e Box-Cox) na análise de agrupamento, assim como identificar os métodos mais adequados para a base de amostras arqueológicas estudada. A base de dados foi fornecida pelo Grupo de Estudos Arqueológicos do IPENCNEN/SP, de modo que foram analisadas 140 amostras de fragmentos cerâmicos de três sítios arqueológicos. Para análise das amostras foram utilizados 13 elementos químicos: As, Na, Ce, Cr, Eu, Fe, Hf, La, Nd, Sc, Sm, Th e U. Os resultados mostraram que não houve impacto da imputação de dados nos métodos de agrupamento hierárquicos, particionais/crisp, c-médias e c-médias com polinômio fuzzificador. A exclusão dos outliers detectados pela distância Mahalanobis teve impacto no aumento da coesão entre as amostras dos sítios B e C. As transformadas utilizadas para padronização das amostras alteraram os valores da estatística de Hopkins, bem como as imagens VAT. As funções implementadas, desenvolvidas no software estatístico R, deram origem a uma aplicação web. |
| publishDate |
2023 |
| dc.date.none.fl_str_mv |
2023-03-23 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/85/85131/tde-06062023-143404/ |
| url |
https://www.teses.usp.br/teses/disponiveis/85/85131/tde-06062023-143404/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1865490963593428992 |