Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação
| Ano de defesa: | 2021 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal do Rio Grande do Norte
Brasil UFRN PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO |
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://repositorio.ufrn.br/handle/123456789/33968 |
Resumo: | The expressive growth of modern data sets, combined with the difficulty of obtaining information about labels, has made semi-supervised learning one of the problems of practical importance in modern data analysis. In most cases, obtaining a dataset with enough examples to induce a classifier can be costly, as it is necessary to perform labeling of the data by an expert. Unlabeled data is easier to obtain but more difficult to analyze and interpret. In the semi-supervised learning problem, there is a database formed by a small labeled part and a larger unlabelled part, with two possible aspects: semi-supervised classification and semi-supervised clustering. With this, this work aims to apply models that use deep learning techniques in semi-supervised learning. Using a deep autoencoder, the data was transformed to feature space Z, and, from that, these data were clustered and labeled, with the help of the labeled data. Information Theory Learning techniques were applied to increase the robustness of the model proposed in this work. Experiments performed showed the proposed model efficiency in labeling and classifying data after training. It was also compared to other classic semi-supervised learning models, such as co-training, tri-training, STRED and SEEDED K-means, as well as other more recent works, showing the proposed model feasibility for the semi-supervised learning problem. Finally, the model was applied to a real problem in remote sensing problem and stream data classification. |
| id |
UFRN_192833fe1b71602b11cb6ee92c8bbfcb |
|---|---|
| oai_identifier_str |
oai:repositorio.ufrn.br:123456789/33968 |
| network_acronym_str |
UFRN |
| network_name_str |
Repositório Institucional da UFRN |
| repository_id_str |
|
| spelling |
Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da InformaçãoSemissupervisionadoDeep LearningRotulaçãoAgrupamentoClassificaçãoTeoria da InformaçãoThe expressive growth of modern data sets, combined with the difficulty of obtaining information about labels, has made semi-supervised learning one of the problems of practical importance in modern data analysis. In most cases, obtaining a dataset with enough examples to induce a classifier can be costly, as it is necessary to perform labeling of the data by an expert. Unlabeled data is easier to obtain but more difficult to analyze and interpret. In the semi-supervised learning problem, there is a database formed by a small labeled part and a larger unlabelled part, with two possible aspects: semi-supervised classification and semi-supervised clustering. With this, this work aims to apply models that use deep learning techniques in semi-supervised learning. Using a deep autoencoder, the data was transformed to feature space Z, and, from that, these data were clustered and labeled, with the help of the labeled data. Information Theory Learning techniques were applied to increase the robustness of the model proposed in this work. Experiments performed showed the proposed model efficiency in labeling and classifying data after training. It was also compared to other classic semi-supervised learning models, such as co-training, tri-training, STRED and SEEDED K-means, as well as other more recent works, showing the proposed model feasibility for the semi-supervised learning problem. Finally, the model was applied to a real problem in remote sensing problem and stream data classification.O crescimento expressivo de conjuntos de dados modernos, combinado à dificuldade de obter informações sobre rótulos, tornou o aprendizado semissupervisionado um dos problemas de importância prática na análise moderna de dados. Na maioria dos casos, obter conjunto de dados com a quantidade de exemplos suficientes para induzir um classificador, pode ser oneroso, pois é necessário que seja realizada uma rotulação dos dados por um especialista. Dados não rotulados são mais fáceis de serem obtidos, porém mais difíceis de serem analisados e interpretados. No problema do aprendizado semissupervisionado, têm-se uma base de dados formada por uma pequena parte rotulada e uma parte maior não rotulada, sendo possível duas vertentes: classificação semissupervisionada e agrupamento semissupervisionado. A partir disso, o objetivo deste trabalho baseia-se na aplicação de modelos que utilizam técnicas de Deep Learning no aprendizado semissupervisionado. Utilizando um deep autoencoder transformou-se os dados para um espaço de características Z e a partir disso agrupou-se e rotulou-se esses dados, com auxílio dos dados rotulados. Aplicou-se técnicas de Aprendizado por Teoria da Informação para aumentar a robustez do modelo proposto neste trabalho. Experimentos realizados apontaram a eficiência do modelo proposto em rotular e classificar dados a após o treinamento. Comparou-se também o com outros modelos clássicos de aprendizado semissupervisionado, como co-training, tri-training, STRED e SEEDED K-means, bem como outros trabalhos mais recente, mostrando a viabilidade do modelo proposto para o problema de aprendizagem semissupervisionada. E por fim, aplicou-se o modelo em um problema real na área de sensoriamento remoto e classificação de dados de stream.Universidade Federal do Rio Grande do NorteBrasilUFRNPROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃODoria Neto, Adrião Duartehttp://lattes.cnpq.br/6744627108761351http://lattes.cnpq.br/1987295209521433Araújo, Daniel Sabino Amorim dehttp://lattes.cnpq.br/4744754780165354Silva, Ivan Nunes dahttp://lattes.cnpq.br/0448891472280429Melo, Jorge Dantas dehttp://lattes.cnpq.br/7325007451912598Machado, Vinicius Pontehttp://lattes.cnpq.br/9385561556243194Lima, Bruno Vicente Alves de2021-09-17T15:48:57Z2021-09-17T15:48:57Z2021-06-09info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfLIMA, Bruno Vicente Alves de. Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação. 2021. 155f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2021.https://repositorio.ufrn.br/handle/123456789/33968info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRN2022-05-02T15:30:55Zoai:repositorio.ufrn.br:123456789/33968Repositório InstitucionalPUBhttp://repositorio.ufrn.br/oai/repositorio@bczm.ufrn.bropendoar:2022-05-02T15:30:55Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false |
| dc.title.none.fl_str_mv |
Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação |
| title |
Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação |
| spellingShingle |
Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação Lima, Bruno Vicente Alves de Semissupervisionado Deep Learning Rotulação Agrupamento Classificação Teoria da Informação |
| title_short |
Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação |
| title_full |
Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação |
| title_fullStr |
Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação |
| title_full_unstemmed |
Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação |
| title_sort |
Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação |
| author |
Lima, Bruno Vicente Alves de |
| author_facet |
Lima, Bruno Vicente Alves de |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Doria Neto, Adrião Duarte http://lattes.cnpq.br/6744627108761351 http://lattes.cnpq.br/1987295209521433 Araújo, Daniel Sabino Amorim de http://lattes.cnpq.br/4744754780165354 Silva, Ivan Nunes da http://lattes.cnpq.br/0448891472280429 Melo, Jorge Dantas de http://lattes.cnpq.br/7325007451912598 Machado, Vinicius Ponte http://lattes.cnpq.br/9385561556243194 |
| dc.contributor.author.fl_str_mv |
Lima, Bruno Vicente Alves de |
| dc.subject.por.fl_str_mv |
Semissupervisionado Deep Learning Rotulação Agrupamento Classificação Teoria da Informação |
| topic |
Semissupervisionado Deep Learning Rotulação Agrupamento Classificação Teoria da Informação |
| description |
The expressive growth of modern data sets, combined with the difficulty of obtaining information about labels, has made semi-supervised learning one of the problems of practical importance in modern data analysis. In most cases, obtaining a dataset with enough examples to induce a classifier can be costly, as it is necessary to perform labeling of the data by an expert. Unlabeled data is easier to obtain but more difficult to analyze and interpret. In the semi-supervised learning problem, there is a database formed by a small labeled part and a larger unlabelled part, with two possible aspects: semi-supervised classification and semi-supervised clustering. With this, this work aims to apply models that use deep learning techniques in semi-supervised learning. Using a deep autoencoder, the data was transformed to feature space Z, and, from that, these data were clustered and labeled, with the help of the labeled data. Information Theory Learning techniques were applied to increase the robustness of the model proposed in this work. Experiments performed showed the proposed model efficiency in labeling and classifying data after training. It was also compared to other classic semi-supervised learning models, such as co-training, tri-training, STRED and SEEDED K-means, as well as other more recent works, showing the proposed model feasibility for the semi-supervised learning problem. Finally, the model was applied to a real problem in remote sensing problem and stream data classification. |
| publishDate |
2021 |
| dc.date.none.fl_str_mv |
2021-09-17T15:48:57Z 2021-09-17T15:48:57Z 2021-06-09 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
LIMA, Bruno Vicente Alves de. Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação. 2021. 155f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2021. https://repositorio.ufrn.br/handle/123456789/33968 |
| identifier_str_mv |
LIMA, Bruno Vicente Alves de. Aprendizagem semissupervisionada por meio de técnicas de Deep Learning e de Teoria da Informação. 2021. 155f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2021. |
| url |
https://repositorio.ufrn.br/handle/123456789/33968 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Norte Brasil UFRN PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO |
| publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Norte Brasil UFRN PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRN instname:Universidade Federal do Rio Grande do Norte (UFRN) instacron:UFRN |
| instname_str |
Universidade Federal do Rio Grande do Norte (UFRN) |
| instacron_str |
UFRN |
| institution |
UFRN |
| reponame_str |
Repositório Institucional da UFRN |
| collection |
Repositório Institucional da UFRN |
| repository.name.fl_str_mv |
Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN) |
| repository.mail.fl_str_mv |
repositorio@bczm.ufrn.br |
| _version_ |
1855758903288004608 |