Classificação de alto nível baseada em redes usando betweenness centrality e interação atributo-atributo

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Vilca Zuñiga, Esteban Wilfredo
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/59/59143/tde-16112023-144830/
Resumo: A democratização da tecnologia proporcionada pela internet, tecnologia em nuvem e mídia social aumentou drasticamente a quantidade de dados coletados. Aprendizado de máquina é um campo de inteligência artificial que produz informações valiosas a partir de dados. Especificamente, aprendizado supervisionado é um tipo de aprendizado de máquina que se concentra no uso de dados rotulados para aprender a prever o rótulo de dados futuros. Neste tópico, os algoritmos de classificação de alto nível usam a estrutura e relação entre os dados para classificar em vez de atributos físicos como distância. Redes complexas são uma estrutura de dados que fornece métricas para avaliar os dados como um sistema. Eles fornecem medidas para a conectividade, comunicabilidade ou dispersão da interação de dados. Neste estudo, exploramos propriedades de rede complexas e interação atributoatributo para desenvolver novas técnicas de classificação de alto nível. Em primeiro lugar, aplicamos métrica de betweenness centrality, que captura características globais e locais de rede. Este método reduz o número de métricas avaliadas e executa uma melhoria na accuracy em comparação com outros algoritmos de alto nível. Em seguida, exploramos uma nova metodologia de construção de rede complexa para capturar medidas estruturais usando a interação atributo-atributo. Essa interação constrói e avalia cada atributo independentemente e os combina usando uma equação ponderada otimizada. Finalmente, analisamos os resultados obtidos por essas métricas em conjuntos de dados sintéticos e reais e os comparamos com outros algoritmos clássicos de baixo e alto nível. As técnicas propostas apresentam algumas características promissoras como a redução das métricas utilizadas para classificação, resiliência diante de dados não normalizados e uma nova métrica de avaliação de rede derivada da metodologia de construção.
id USP_aa06bc8e5e335660e517356f7e39abe7
oai_identifier_str oai:teses.usp.br:tde-16112023-144830
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Classificação de alto nível baseada em redes usando betweenness centrality e interação atributo-atributoNetwork-based high-level classification using betweenness centrality and attribute-attribute interactionAprendizado de máquinaAprendizado supervisionadoClassificação de alto nívelComplex networksHigh-level classificationMachine learningRedes complexasSupervised learningA democratização da tecnologia proporcionada pela internet, tecnologia em nuvem e mídia social aumentou drasticamente a quantidade de dados coletados. Aprendizado de máquina é um campo de inteligência artificial que produz informações valiosas a partir de dados. Especificamente, aprendizado supervisionado é um tipo de aprendizado de máquina que se concentra no uso de dados rotulados para aprender a prever o rótulo de dados futuros. Neste tópico, os algoritmos de classificação de alto nível usam a estrutura e relação entre os dados para classificar em vez de atributos físicos como distância. Redes complexas são uma estrutura de dados que fornece métricas para avaliar os dados como um sistema. Eles fornecem medidas para a conectividade, comunicabilidade ou dispersão da interação de dados. Neste estudo, exploramos propriedades de rede complexas e interação atributoatributo para desenvolver novas técnicas de classificação de alto nível. Em primeiro lugar, aplicamos métrica de betweenness centrality, que captura características globais e locais de rede. Este método reduz o número de métricas avaliadas e executa uma melhoria na accuracy em comparação com outros algoritmos de alto nível. Em seguida, exploramos uma nova metodologia de construção de rede complexa para capturar medidas estruturais usando a interação atributo-atributo. Essa interação constrói e avalia cada atributo independentemente e os combina usando uma equação ponderada otimizada. Finalmente, analisamos os resultados obtidos por essas métricas em conjuntos de dados sintéticos e reais e os comparamos com outros algoritmos clássicos de baixo e alto nível. As técnicas propostas apresentam algumas características promissoras como a redução das métricas utilizadas para classificação, resiliência diante de dados não normalizados e uma nova métrica de avaliação de rede derivada da metodologia de construção.The democratization of technology caused by the internet, cloud technology, social media increase dramatically the quantity of data collected. Machine learning is an artificial intelligence field that produces valuable information from data. Supervised learning is a type of machine learning that focuses on using labeled data to learn to predict the label of future data. In this area, the High-level classification algorithms use the structure of the relation between the data for classification instead of physical attributes like distance. Complex networks are a data structure that provides metrics to evaluate the data as a system. They provide measures to the connectivity, communicability, or sparseness of the data interaction. In this study, we explore complex network properties and attributeattribute interaction to develop new high-level classification techniques. Firstly, we exploit a mixed metric betweenness centrality that captures global and local characteristics for classification. This method reduces the number of metrics evaluated and performs an improvement compared to other high-level algorithms. Then, we explore a new complex network building methodology to capture structural measures using attribute-attribute interaction. This interaction builds and evaluates each attribute independently and combining them using an optimized weighted equation. Finally, we analyze the results obtained by these metrics in synthetic and real datasets and compare them to other classical low-level and high-level algorithms. The proposed techniques present some promising characteristics as the reduction of metrics used for classification, resilience in front of non-normalized data, and a new network evaluation metric derived from the building methodology.Biblioteca Digitais de Teses e Dissertações da USPLiang, ZhaoVilca Zuñiga, Esteban Wilfredo2021-09-01info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/59/59143/tde-16112023-144830/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2023-12-21T13:44:02Zoai:teses.usp.br:tde-16112023-144830Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-12-21T13:44:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Classificação de alto nível baseada em redes usando betweenness centrality e interação atributo-atributo
Network-based high-level classification using betweenness centrality and attribute-attribute interaction
title Classificação de alto nível baseada em redes usando betweenness centrality e interação atributo-atributo
spellingShingle Classificação de alto nível baseada em redes usando betweenness centrality e interação atributo-atributo
Vilca Zuñiga, Esteban Wilfredo
Aprendizado de máquina
Aprendizado supervisionado
Classificação de alto nível
Complex networks
High-level classification
Machine learning
Redes complexas
Supervised learning
title_short Classificação de alto nível baseada em redes usando betweenness centrality e interação atributo-atributo
title_full Classificação de alto nível baseada em redes usando betweenness centrality e interação atributo-atributo
title_fullStr Classificação de alto nível baseada em redes usando betweenness centrality e interação atributo-atributo
title_full_unstemmed Classificação de alto nível baseada em redes usando betweenness centrality e interação atributo-atributo
title_sort Classificação de alto nível baseada em redes usando betweenness centrality e interação atributo-atributo
author Vilca Zuñiga, Esteban Wilfredo
author_facet Vilca Zuñiga, Esteban Wilfredo
author_role author
dc.contributor.none.fl_str_mv Liang, Zhao
dc.contributor.author.fl_str_mv Vilca Zuñiga, Esteban Wilfredo
dc.subject.por.fl_str_mv Aprendizado de máquina
Aprendizado supervisionado
Classificação de alto nível
Complex networks
High-level classification
Machine learning
Redes complexas
Supervised learning
topic Aprendizado de máquina
Aprendizado supervisionado
Classificação de alto nível
Complex networks
High-level classification
Machine learning
Redes complexas
Supervised learning
description A democratização da tecnologia proporcionada pela internet, tecnologia em nuvem e mídia social aumentou drasticamente a quantidade de dados coletados. Aprendizado de máquina é um campo de inteligência artificial que produz informações valiosas a partir de dados. Especificamente, aprendizado supervisionado é um tipo de aprendizado de máquina que se concentra no uso de dados rotulados para aprender a prever o rótulo de dados futuros. Neste tópico, os algoritmos de classificação de alto nível usam a estrutura e relação entre os dados para classificar em vez de atributos físicos como distância. Redes complexas são uma estrutura de dados que fornece métricas para avaliar os dados como um sistema. Eles fornecem medidas para a conectividade, comunicabilidade ou dispersão da interação de dados. Neste estudo, exploramos propriedades de rede complexas e interação atributoatributo para desenvolver novas técnicas de classificação de alto nível. Em primeiro lugar, aplicamos métrica de betweenness centrality, que captura características globais e locais de rede. Este método reduz o número de métricas avaliadas e executa uma melhoria na accuracy em comparação com outros algoritmos de alto nível. Em seguida, exploramos uma nova metodologia de construção de rede complexa para capturar medidas estruturais usando a interação atributo-atributo. Essa interação constrói e avalia cada atributo independentemente e os combina usando uma equação ponderada otimizada. Finalmente, analisamos os resultados obtidos por essas métricas em conjuntos de dados sintéticos e reais e os comparamos com outros algoritmos clássicos de baixo e alto nível. As técnicas propostas apresentam algumas características promissoras como a redução das métricas utilizadas para classificação, resiliência diante de dados não normalizados e uma nova métrica de avaliação de rede derivada da metodologia de construção.
publishDate 2021
dc.date.none.fl_str_mv 2021-09-01
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/59/59143/tde-16112023-144830/
url https://www.teses.usp.br/teses/disponiveis/59/59143/tde-16112023-144830/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1815258229702131712