Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Lima, Bruno Vicente Alves de
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal do Rio Grande do Norte
Brasil
UFRN
PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.ufrn.br/handle/123456789/33968
Resumo: The expressive growth of modern data sets, combined with the difficulty of obtaining information about labels, has made semi-supervised learning one of the problems of practical importance in modern data analysis. In most cases, obtaining a dataset with enough examples to induce a classifier can be costly, as it is necessary to perform labeling of the data by an expert. Unlabeled data is easier to obtain but more difficult to analyze and interpret. In the semi-supervised learning problem, there is a database formed by a small labeled part and a larger unlabelled part, with two possible aspects: semi-supervised classification and semi-supervised clustering. With this, this work aims to apply models that use deep learning techniques in semi-supervised learning. Using a deep autoencoder, the data was transformed to feature space Z, and, from that, these data were clustered and labeled, with the help of the labeled data. Information Theory Learning techniques were applied to increase the robustness of the model proposed in this work. Experiments performed showed the proposed model efficiency in labeling and classifying data after training. It was also compared to other classic semi-supervised learning models, such as co-training, tri-training, STRED and SEEDED K-means, as well as other more recent works, showing the proposed model feasibility for the semi-supervised learning problem. Finally, the model was applied to a real problem in remote sensing problem and stream data classification.
id UFRN_192833fe1b71602b11cb6ee92c8bbfcb
oai_identifier_str oai:repositorio.ufrn.br:123456789/33968
network_acronym_str UFRN
network_name_str Repositório Institucional da UFRN
repository_id_str
spelling Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da InformaçãoSemissupervisionadoDeep LearningRotulaçãoAgrupamentoClassificaçãoTeoria da InformaçãoThe expressive growth of modern data sets, combined with the difficulty of obtaining information about labels, has made semi-supervised learning one of the problems of practical importance in modern data analysis. In most cases, obtaining a dataset with enough examples to induce a classifier can be costly, as it is necessary to perform labeling of the data by an expert. Unlabeled data is easier to obtain but more difficult to analyze and interpret. In the semi-supervised learning problem, there is a database formed by a small labeled part and a larger unlabelled part, with two possible aspects: semi-supervised classification and semi-supervised clustering. With this, this work aims to apply models that use deep learning techniques in semi-supervised learning. Using a deep autoencoder, the data was transformed to feature space Z, and, from that, these data were clustered and labeled, with the help of the labeled data. Information Theory Learning techniques were applied to increase the robustness of the model proposed in this work. Experiments performed showed the proposed model efficiency in labeling and classifying data after training. It was also compared to other classic semi-supervised learning models, such as co-training, tri-training, STRED and SEEDED K-means, as well as other more recent works, showing the proposed model feasibility for the semi-supervised learning problem. Finally, the model was applied to a real problem in remote sensing problem and stream data classification.O crescimento expressivo de conjuntos de dados modernos, combinado à dificuldade de obter informações sobre rótulos, tornou o aprendizado semissupervisionado um dos problemas de importância prática na análise moderna de dados. Na maioria dos casos, obter conjunto de dados com a quantidade de exemplos suficientes para induzir um classificador, pode ser oneroso, pois é necessário que seja realizada uma rotulação dos dados por um especialista. Dados não rotulados são mais fáceis de serem obtidos, porém mais difíceis de serem analisados e interpretados. No problema do aprendizado semissupervisionado, têm-se uma base de dados formada por uma pequena parte rotulada e uma parte maior não rotulada, sendo possível duas vertentes: classificação semissupervisionada e agrupamento semissupervisionado. A partir disso, o objetivo deste trabalho baseia-se na aplicação de modelos que utilizam técnicas de Deep Learning no aprendizado semissupervisionado. Utilizando um deep autoencoder transformou-se os dados para um espaço de características Z e a partir disso agrupou-se e rotulou-se esses dados, com auxílio dos dados rotulados. Aplicou-se técnicas de Aprendizado por Teoria da Informação para aumentar a robustez do modelo proposto neste trabalho. Experimentos realizados apontaram a eficiência do modelo proposto em rotular e classificar dados a após o treinamento. Comparou-se também o com outros modelos clássicos de aprendizado semissupervisionado, como co-training, tri-training, STRED e SEEDED K-means, bem como outros trabalhos mais recente, mostrando a viabilidade do modelo proposto para o problema de aprendizagem semissupervisionada. E por fim, aplicou-se o modelo em um problema real na área de sensoriamento remoto e classificação de dados de stream.Universidade Federal do Rio Grande do NorteBrasilUFRNPROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃODoria Neto, Adrião Duartehttp://lattes.cnpq.br/6744627108761351http://lattes.cnpq.br/1987295209521433Araújo, Daniel Sabino Amorim dehttp://lattes.cnpq.br/4744754780165354Silva, Ivan Nunes dahttp://lattes.cnpq.br/0448891472280429Melo, Jorge Dantas dehttp://lattes.cnpq.br/7325007451912598Machado, Vinicius Pontehttp://lattes.cnpq.br/9385561556243194Lima, Bruno Vicente Alves de2021-09-17T15:48:57Z2021-09-17T15:48:57Z2021-06-09info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfLIMA, Bruno Vicente Alves de. Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação. 2021. 155f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2021.https://repositorio.ufrn.br/handle/123456789/33968info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRN2022-05-02T15:30:55Zoai:repositorio.ufrn.br:123456789/33968Repositório InstitucionalPUBhttp://repositorio.ufrn.br/oai/repositorio@bczm.ufrn.bropendoar:2022-05-02T15:30:55Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false
dc.title.none.fl_str_mv Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação
title Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação
spellingShingle Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação
Lima, Bruno Vicente Alves de
Semissupervisionado
Deep Learning
Rotulação
Agrupamento
Classificação
Teoria da Informação
title_short Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação
title_full Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação
title_fullStr Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação
title_full_unstemmed Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação
title_sort Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação
author Lima, Bruno Vicente Alves de
author_facet Lima, Bruno Vicente Alves de
author_role author
dc.contributor.none.fl_str_mv Doria Neto, Adrião Duarte
http://lattes.cnpq.br/6744627108761351
http://lattes.cnpq.br/1987295209521433
Araújo, Daniel Sabino Amorim de
http://lattes.cnpq.br/4744754780165354
Silva, Ivan Nunes da
http://lattes.cnpq.br/0448891472280429
Melo, Jorge Dantas de
http://lattes.cnpq.br/7325007451912598
Machado, Vinicius Ponte
http://lattes.cnpq.br/9385561556243194
dc.contributor.author.fl_str_mv Lima, Bruno Vicente Alves de
dc.subject.por.fl_str_mv Semissupervisionado
Deep Learning
Rotulação
Agrupamento
Classificação
Teoria da Informação
topic Semissupervisionado
Deep Learning
Rotulação
Agrupamento
Classificação
Teoria da Informação
description The expressive growth of modern data sets, combined with the difficulty of obtaining information about labels, has made semi-supervised learning one of the problems of practical importance in modern data analysis. In most cases, obtaining a dataset with enough examples to induce a classifier can be costly, as it is necessary to perform labeling of the data by an expert. Unlabeled data is easier to obtain but more difficult to analyze and interpret. In the semi-supervised learning problem, there is a database formed by a small labeled part and a larger unlabelled part, with two possible aspects: semi-supervised classification and semi-supervised clustering. With this, this work aims to apply models that use deep learning techniques in semi-supervised learning. Using a deep autoencoder, the data was transformed to feature space Z, and, from that, these data were clustered and labeled, with the help of the labeled data. Information Theory Learning techniques were applied to increase the robustness of the model proposed in this work. Experiments performed showed the proposed model efficiency in labeling and classifying data after training. It was also compared to other classic semi-supervised learning models, such as co-training, tri-training, STRED and SEEDED K-means, as well as other more recent works, showing the proposed model feasibility for the semi-supervised learning problem. Finally, the model was applied to a real problem in remote sensing problem and stream data classification.
publishDate 2021
dc.date.none.fl_str_mv 2021-09-17T15:48:57Z
2021-09-17T15:48:57Z
2021-06-09
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv LIMA, Bruno Vicente Alves de. Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação. 2021. 155f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2021.
https://repositorio.ufrn.br/handle/123456789/33968
identifier_str_mv LIMA, Bruno Vicente Alves de. Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação. 2021. 155f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2021.
url https://repositorio.ufrn.br/handle/123456789/33968
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
Brasil
UFRN
PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO
publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
Brasil
UFRN
PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRN
instname:Universidade Federal do Rio Grande do Norte (UFRN)
instacron:UFRN
instname_str Universidade Federal do Rio Grande do Norte (UFRN)
instacron_str UFRN
institution UFRN
reponame_str Repositório Institucional da UFRN
collection Repositório Institucional da UFRN
repository.name.fl_str_mv Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)
repository.mail.fl_str_mv repositorio@bczm.ufrn.br
_version_ 1855758903288004608