Classificação de alto nível baseada em redes usando betweenness centrality e interação atributo-atributo
| Ano de defesa: | 2021 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/59/59143/tde-16112023-144830/ |
Resumo: | A democratização da tecnologia proporcionada pela internet, tecnologia em nuvem e mídia social aumentou drasticamente a quantidade de dados coletados. Aprendizado de máquina é um campo de inteligência artificial que produz informações valiosas a partir de dados. Especificamente, aprendizado supervisionado é um tipo de aprendizado de máquina que se concentra no uso de dados rotulados para aprender a prever o rótulo de dados futuros. Neste tópico, os algoritmos de classificação de alto nível usam a estrutura e relação entre os dados para classificar em vez de atributos físicos como distância. Redes complexas são uma estrutura de dados que fornece métricas para avaliar os dados como um sistema. Eles fornecem medidas para a conectividade, comunicabilidade ou dispersão da interação de dados. Neste estudo, exploramos propriedades de rede complexas e interação atributoatributo para desenvolver novas técnicas de classificação de alto nível. Em primeiro lugar, aplicamos métrica de betweenness centrality, que captura características globais e locais de rede. Este método reduz o número de métricas avaliadas e executa uma melhoria na accuracy em comparação com outros algoritmos de alto nível. Em seguida, exploramos uma nova metodologia de construção de rede complexa para capturar medidas estruturais usando a interação atributo-atributo. Essa interação constrói e avalia cada atributo independentemente e os combina usando uma equação ponderada otimizada. Finalmente, analisamos os resultados obtidos por essas métricas em conjuntos de dados sintéticos e reais e os comparamos com outros algoritmos clássicos de baixo e alto nível. As técnicas propostas apresentam algumas características promissoras como a redução das métricas utilizadas para classificação, resiliência diante de dados não normalizados e uma nova métrica de avaliação de rede derivada da metodologia de construção. |
| id |
USP_aa06bc8e5e335660e517356f7e39abe7 |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-16112023-144830 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Classificação de alto nível baseada em redes usando betweenness centrality e interação atributo-atributoNetwork-based high-level classification using betweenness centrality and attribute-attribute interactionAprendizado de máquinaAprendizado supervisionadoClassificação de alto nívelComplex networksHigh-level classificationMachine learningRedes complexasSupervised learningA democratização da tecnologia proporcionada pela internet, tecnologia em nuvem e mídia social aumentou drasticamente a quantidade de dados coletados. Aprendizado de máquina é um campo de inteligência artificial que produz informações valiosas a partir de dados. Especificamente, aprendizado supervisionado é um tipo de aprendizado de máquina que se concentra no uso de dados rotulados para aprender a prever o rótulo de dados futuros. Neste tópico, os algoritmos de classificação de alto nível usam a estrutura e relação entre os dados para classificar em vez de atributos físicos como distância. Redes complexas são uma estrutura de dados que fornece métricas para avaliar os dados como um sistema. Eles fornecem medidas para a conectividade, comunicabilidade ou dispersão da interação de dados. Neste estudo, exploramos propriedades de rede complexas e interação atributoatributo para desenvolver novas técnicas de classificação de alto nível. Em primeiro lugar, aplicamos métrica de betweenness centrality, que captura características globais e locais de rede. Este método reduz o número de métricas avaliadas e executa uma melhoria na accuracy em comparação com outros algoritmos de alto nível. Em seguida, exploramos uma nova metodologia de construção de rede complexa para capturar medidas estruturais usando a interação atributo-atributo. Essa interação constrói e avalia cada atributo independentemente e os combina usando uma equação ponderada otimizada. Finalmente, analisamos os resultados obtidos por essas métricas em conjuntos de dados sintéticos e reais e os comparamos com outros algoritmos clássicos de baixo e alto nível. As técnicas propostas apresentam algumas características promissoras como a redução das métricas utilizadas para classificação, resiliência diante de dados não normalizados e uma nova métrica de avaliação de rede derivada da metodologia de construção.The democratization of technology caused by the internet, cloud technology, social media increase dramatically the quantity of data collected. Machine learning is an artificial intelligence field that produces valuable information from data. Supervised learning is a type of machine learning that focuses on using labeled data to learn to predict the label of future data. In this area, the High-level classification algorithms use the structure of the relation between the data for classification instead of physical attributes like distance. Complex networks are a data structure that provides metrics to evaluate the data as a system. They provide measures to the connectivity, communicability, or sparseness of the data interaction. In this study, we explore complex network properties and attributeattribute interaction to develop new high-level classification techniques. Firstly, we exploit a mixed metric betweenness centrality that captures global and local characteristics for classification. This method reduces the number of metrics evaluated and performs an improvement compared to other high-level algorithms. Then, we explore a new complex network building methodology to capture structural measures using attribute-attribute interaction. This interaction builds and evaluates each attribute independently and combining them using an optimized weighted equation. Finally, we analyze the results obtained by these metrics in synthetic and real datasets and compare them to other classical low-level and high-level algorithms. The proposed techniques present some promising characteristics as the reduction of metrics used for classification, resilience in front of non-normalized data, and a new network evaluation metric derived from the building methodology.Biblioteca Digitais de Teses e Dissertações da USPLiang, ZhaoVilca Zuñiga, Esteban Wilfredo2021-09-01info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/59/59143/tde-16112023-144830/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2023-12-21T13:44:02Zoai:teses.usp.br:tde-16112023-144830Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-12-21T13:44:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Classificação de alto nível baseada em redes usando betweenness centrality e interação atributo-atributo Network-based high-level classification using betweenness centrality and attribute-attribute interaction |
| title |
Classificação de alto nível baseada em redes usando betweenness centrality e interação atributo-atributo |
| spellingShingle |
Classificação de alto nível baseada em redes usando betweenness centrality e interação atributo-atributo Vilca Zuñiga, Esteban Wilfredo Aprendizado de máquina Aprendizado supervisionado Classificação de alto nível Complex networks High-level classification Machine learning Redes complexas Supervised learning |
| title_short |
Classificação de alto nível baseada em redes usando betweenness centrality e interação atributo-atributo |
| title_full |
Classificação de alto nível baseada em redes usando betweenness centrality e interação atributo-atributo |
| title_fullStr |
Classificação de alto nível baseada em redes usando betweenness centrality e interação atributo-atributo |
| title_full_unstemmed |
Classificação de alto nível baseada em redes usando betweenness centrality e interação atributo-atributo |
| title_sort |
Classificação de alto nível baseada em redes usando betweenness centrality e interação atributo-atributo |
| author |
Vilca Zuñiga, Esteban Wilfredo |
| author_facet |
Vilca Zuñiga, Esteban Wilfredo |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Liang, Zhao |
| dc.contributor.author.fl_str_mv |
Vilca Zuñiga, Esteban Wilfredo |
| dc.subject.por.fl_str_mv |
Aprendizado de máquina Aprendizado supervisionado Classificação de alto nível Complex networks High-level classification Machine learning Redes complexas Supervised learning |
| topic |
Aprendizado de máquina Aprendizado supervisionado Classificação de alto nível Complex networks High-level classification Machine learning Redes complexas Supervised learning |
| description |
A democratização da tecnologia proporcionada pela internet, tecnologia em nuvem e mídia social aumentou drasticamente a quantidade de dados coletados. Aprendizado de máquina é um campo de inteligência artificial que produz informações valiosas a partir de dados. Especificamente, aprendizado supervisionado é um tipo de aprendizado de máquina que se concentra no uso de dados rotulados para aprender a prever o rótulo de dados futuros. Neste tópico, os algoritmos de classificação de alto nível usam a estrutura e relação entre os dados para classificar em vez de atributos físicos como distância. Redes complexas são uma estrutura de dados que fornece métricas para avaliar os dados como um sistema. Eles fornecem medidas para a conectividade, comunicabilidade ou dispersão da interação de dados. Neste estudo, exploramos propriedades de rede complexas e interação atributoatributo para desenvolver novas técnicas de classificação de alto nível. Em primeiro lugar, aplicamos métrica de betweenness centrality, que captura características globais e locais de rede. Este método reduz o número de métricas avaliadas e executa uma melhoria na accuracy em comparação com outros algoritmos de alto nível. Em seguida, exploramos uma nova metodologia de construção de rede complexa para capturar medidas estruturais usando a interação atributo-atributo. Essa interação constrói e avalia cada atributo independentemente e os combina usando uma equação ponderada otimizada. Finalmente, analisamos os resultados obtidos por essas métricas em conjuntos de dados sintéticos e reais e os comparamos com outros algoritmos clássicos de baixo e alto nível. As técnicas propostas apresentam algumas características promissoras como a redução das métricas utilizadas para classificação, resiliência diante de dados não normalizados e uma nova métrica de avaliação de rede derivada da metodologia de construção. |
| publishDate |
2021 |
| dc.date.none.fl_str_mv |
2021-09-01 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/59/59143/tde-16112023-144830/ |
| url |
https://www.teses.usp.br/teses/disponiveis/59/59143/tde-16112023-144830/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1815258229702131712 |