Análise de métodos de agrupamento de dados para detecção de anomalias na precificação e categorização de peças da indústria automotiva

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Guerreiro, Marcio Trindade
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Tecnológica Federal do Paraná
Ponta Grossa
Brasil
Programa de Pós-Graduação em Ciência da Computação
UTFPR
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://repositorio.utfpr.edu.br/jspui/handle/1/24489
Resumo: The manufacturing performance of a company to reduce costs is an extremely important action to ensure competitiveness and avoid wasting resources. The variables of processes and composition of products in the automotive industry generates a daily number of combinations of data configurations and scenarios that make their manual processing unfeasible. As a result, much of the knowledge generated ends up not being used directly in similar items, resulting in large differences in costs due to small structural and product design differences. The objective of this work is to compare the performance of clustering algorithms and provided pre-processing steps for the grouping of parts, considering physical manufacturing characteristics. Then, a costefficiency comparison of similar components is made, assisting in the decision making for the formation of strategies to reach the optimum point regarding the costs of these components. Grouping was performed using the following algorithms: K-Means, K-Medoids, Fuzzy C-Means - FCM, Hierarchical, Density Based Spatial Clustering of Applications with Noise - DBSCAN, Self Organizing Maps - SOM, Particle Swarm Optmization - PSO, Genetic Algorithm - GA and Differential Evolution - DE. As a comparison metric, the following indices were used: Sum of Squared Errors - SSE, Sum of Squares Within Clusters - SSW, Sum of Squares Between Clusters - SSB, Calinski-Harabasz - CH, WB and Silhouette index. The hierarchical algorithm was the one that obtained the best practical results, when checking the SI metric and in the general result scoring all different applied metrics.
id UTFPR-12_5462d3f0b31802c0d916eda53ac074df
oai_identifier_str oai:repositorio.utfpr.edu.br:1/24489
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling Análise de métodos de agrupamento de dados para detecção de anomalias na precificação e categorização de peças da indústria automotivaAnalysis of data clustering methods to detect anomalies in the pricing and categorization of automotive industry partsAnálise por agrupamentoProcessamento eletrônico de dadosAlgorítmos computacionaisIndústria automobilísticaControle de custoCluster analysisElectronic data processingComputer algorithmsAutomobile industry and tradeCost controlCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOEngenharia/Tecnologia/GestãoThe manufacturing performance of a company to reduce costs is an extremely important action to ensure competitiveness and avoid wasting resources. The variables of processes and composition of products in the automotive industry generates a daily number of combinations of data configurations and scenarios that make their manual processing unfeasible. As a result, much of the knowledge generated ends up not being used directly in similar items, resulting in large differences in costs due to small structural and product design differences. The objective of this work is to compare the performance of clustering algorithms and provided pre-processing steps for the grouping of parts, considering physical manufacturing characteristics. Then, a costefficiency comparison of similar components is made, assisting in the decision making for the formation of strategies to reach the optimum point regarding the costs of these components. Grouping was performed using the following algorithms: K-Means, K-Medoids, Fuzzy C-Means - FCM, Hierarchical, Density Based Spatial Clustering of Applications with Noise - DBSCAN, Self Organizing Maps - SOM, Particle Swarm Optmization - PSO, Genetic Algorithm - GA and Differential Evolution - DE. As a comparison metric, the following indices were used: Sum of Squared Errors - SSE, Sum of Squares Within Clusters - SSW, Sum of Squares Between Clusters - SSB, Calinski-Harabasz - CH, WB and Silhouette index. The hierarchical algorithm was the one that obtained the best practical results, when checking the SI metric and in the general result scoring all different applied metrics.O desempenho de fabricação de uma empresa para redução de custos é uma ação de extrema importância para garantir a competitividade e evitar desperdício de recursos. As variáveis de processos e composição de produtos na indústria automotiva, geram diariamente uma quantidade de combinações de configurações de dados e de cenários que tornam inviável seu processamento de forma manual. Com isso, boa parte do conhecimento gerado acaba não sendo utilizado diretamente em itens similares, acarretando, por muitas vezes, em grandes diferenças de custos por pequenas diferenças estruturais e de design do produto. O objetivo desse trabalho é comparar o desempenho de algoritmos de clusterização e munido de etapas de pré-processamento para o agrupamento de peças, considerando características físicas de fabricação. Em seguida, é feita uma comparação de eficiência de custo de componentes similares, auxiliando na tomada de decisão para formação de estratégias para alcançar o ponto ótimo relativo aos custos desses componentes. Foi realizado o agrupamento através dos seguintes algoritmos: K-Means, K-Medoids, Fuzzy C-Means - FCM, Hierarquico, Agrupamento por Densidade Espacial em Aplicações com Ruido (Density Based Spatial Clustering of Applications with Noise - DBSCAN), Mapas AutoOrganizáveis (Self Organizing Maps - SOM), Otimização por Enxame de Partículas (Particle Swarm Optmization - PSO), algoritmo Genético (Genetic Algorithm - GA) e Evolução Diferencial (Differential Evolution - DE). Como métrica de comparação utilizou-se os seguintes índices: Soma dos Erros Quadráticos (Sum of Squared Errors - SSE), Soma das Distâncias Internas (Sum of Squares Within Clusters - SSW), Soma das Distâncias Externas (Sum of Squares Between Clusters - SSB), (Calinski-Harabasz - CH), o índice WB e Silhouette. O algoritmo hierárquico foi o que obteve os melhores resultados práticos, quando verificada a métrica SI e no resultado geral pontuando-se todas diferentes métricas aplicadas.Universidade Tecnológica Federal do ParanáPonta GrossaBrasilPrograma de Pós-Graduação em Ciência da ComputaçãoUTFPRSiqueira, Hugo Valadareshttps://orcid.org/0000-0002-1278-4602http://lattes.cnpq.br/6904980376005290Trojan, Flaviohttps://orcid.org/0000-0003-2274-5321http://lattes.cnpq.br/1688457940211697Siqueira, Hugo Valadareshttps://orcid.org/0000-0002-1278-4602http://lattes.cnpq.br/6904980376005290Bastos Filho, Carmelo Jose Albanezhttps://orcid.org/0000-0002-0924-5341http://lattes.cnpq.br/9745937989094036Trojan, Flaviohttps://orcid.org/0000-0003-2274-5321http://lattes.cnpq.br/1688457940211697Góis, Lourival Aparecido dehttps://orcid.org/0000-0002-9435-5472http://lattes.cnpq.br/6240013151229068Stevan Junior, Sergio Luizhttps://orcid.org/0000-0002-4783-5350http://lattes.cnpq.br/1661935150054196Guerreiro, Marcio Trindade2021-03-01T21:41:07Z2021-03-01T21:41:07Z2021-02-05info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfGUERREIRO, Marcio Trindade. Análise de métodos de agrupamento de dados para detecção de anomalias na precificação e categorização de peças da indústria automotiva. 2021. Dissertação (Mestrado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2021.http://repositorio.utfpr.edu.br/jspui/handle/1/24489porAttribution-NonCommercial-ShareAlike 4.0 Internationalhttp://creativecommons.org/licenses/by-nc-sa/4.0/info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPR2021-03-02T06:11:03Zoai:repositorio.utfpr.edu.br:1/24489Repositório InstitucionalPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestriut@utfpr.edu.br || sibi@utfpr.edu.bropendoar:2021-03-02T06:11:03Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.none.fl_str_mv Análise de métodos de agrupamento de dados para detecção de anomalias na precificação e categorização de peças da indústria automotiva
Analysis of data clustering methods to detect anomalies in the pricing and categorization of automotive industry parts
title Análise de métodos de agrupamento de dados para detecção de anomalias na precificação e categorização de peças da indústria automotiva
spellingShingle Análise de métodos de agrupamento de dados para detecção de anomalias na precificação e categorização de peças da indústria automotiva
Guerreiro, Marcio Trindade
Análise por agrupamento
Processamento eletrônico de dados
Algorítmos computacionais
Indústria automobilística
Controle de custo
Cluster analysis
Electronic data processing
Computer algorithms
Automobile industry and trade
Cost control
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Engenharia/Tecnologia/Gestão
title_short Análise de métodos de agrupamento de dados para detecção de anomalias na precificação e categorização de peças da indústria automotiva
title_full Análise de métodos de agrupamento de dados para detecção de anomalias na precificação e categorização de peças da indústria automotiva
title_fullStr Análise de métodos de agrupamento de dados para detecção de anomalias na precificação e categorização de peças da indústria automotiva
title_full_unstemmed Análise de métodos de agrupamento de dados para detecção de anomalias na precificação e categorização de peças da indústria automotiva
title_sort Análise de métodos de agrupamento de dados para detecção de anomalias na precificação e categorização de peças da indústria automotiva
author Guerreiro, Marcio Trindade
author_facet Guerreiro, Marcio Trindade
author_role author
dc.contributor.none.fl_str_mv Siqueira, Hugo Valadares
https://orcid.org/0000-0002-1278-4602
http://lattes.cnpq.br/6904980376005290
Trojan, Flavio
https://orcid.org/0000-0003-2274-5321
http://lattes.cnpq.br/1688457940211697
Siqueira, Hugo Valadares
https://orcid.org/0000-0002-1278-4602
http://lattes.cnpq.br/6904980376005290
Bastos Filho, Carmelo Jose Albanez
https://orcid.org/0000-0002-0924-5341
http://lattes.cnpq.br/9745937989094036
Trojan, Flavio
https://orcid.org/0000-0003-2274-5321
http://lattes.cnpq.br/1688457940211697
Góis, Lourival Aparecido de
https://orcid.org/0000-0002-9435-5472
http://lattes.cnpq.br/6240013151229068
Stevan Junior, Sergio Luiz
https://orcid.org/0000-0002-4783-5350
http://lattes.cnpq.br/1661935150054196
dc.contributor.author.fl_str_mv Guerreiro, Marcio Trindade
dc.subject.por.fl_str_mv Análise por agrupamento
Processamento eletrônico de dados
Algorítmos computacionais
Indústria automobilística
Controle de custo
Cluster analysis
Electronic data processing
Computer algorithms
Automobile industry and trade
Cost control
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Engenharia/Tecnologia/Gestão
topic Análise por agrupamento
Processamento eletrônico de dados
Algorítmos computacionais
Indústria automobilística
Controle de custo
Cluster analysis
Electronic data processing
Computer algorithms
Automobile industry and trade
Cost control
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Engenharia/Tecnologia/Gestão
description The manufacturing performance of a company to reduce costs is an extremely important action to ensure competitiveness and avoid wasting resources. The variables of processes and composition of products in the automotive industry generates a daily number of combinations of data configurations and scenarios that make their manual processing unfeasible. As a result, much of the knowledge generated ends up not being used directly in similar items, resulting in large differences in costs due to small structural and product design differences. The objective of this work is to compare the performance of clustering algorithms and provided pre-processing steps for the grouping of parts, considering physical manufacturing characteristics. Then, a costefficiency comparison of similar components is made, assisting in the decision making for the formation of strategies to reach the optimum point regarding the costs of these components. Grouping was performed using the following algorithms: K-Means, K-Medoids, Fuzzy C-Means - FCM, Hierarchical, Density Based Spatial Clustering of Applications with Noise - DBSCAN, Self Organizing Maps - SOM, Particle Swarm Optmization - PSO, Genetic Algorithm - GA and Differential Evolution - DE. As a comparison metric, the following indices were used: Sum of Squared Errors - SSE, Sum of Squares Within Clusters - SSW, Sum of Squares Between Clusters - SSB, Calinski-Harabasz - CH, WB and Silhouette index. The hierarchical algorithm was the one that obtained the best practical results, when checking the SI metric and in the general result scoring all different applied metrics.
publishDate 2021
dc.date.none.fl_str_mv 2021-03-01T21:41:07Z
2021-03-01T21:41:07Z
2021-02-05
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv GUERREIRO, Marcio Trindade. Análise de métodos de agrupamento de dados para detecção de anomalias na precificação e categorização de peças da indústria automotiva. 2021. Dissertação (Mestrado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2021.
http://repositorio.utfpr.edu.br/jspui/handle/1/24489
identifier_str_mv GUERREIRO, Marcio Trindade. Análise de métodos de agrupamento de dados para detecção de anomalias na precificação e categorização de peças da indústria automotiva. 2021. Dissertação (Mestrado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2021.
url http://repositorio.utfpr.edu.br/jspui/handle/1/24489
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-ShareAlike 4.0 International
http://creativecommons.org/licenses/by-nc-sa/4.0/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-ShareAlike 4.0 International
http://creativecommons.org/licenses/by-nc-sa/4.0/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Ponta Grossa
Brasil
Programa de Pós-Graduação em Ciência da Computação
UTFPR
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Ponta Grossa
Brasil
Programa de Pós-Graduação em Ciência da Computação
UTFPR
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv riut@utfpr.edu.br || sibi@utfpr.edu.br
_version_ 1850498283907055616