Anotação de dados guiada por projeção de características
Ano de defesa: | 2019 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
[s.n.]
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | https://hdl.handle.net/20.500.12733/1637994 |
Resumo: | Orientador: Alexandre Xavier Falcão |
id |
UNICAMP-30_ca5e670cfe4edb8dc3f6e4d4aef54644 |
---|---|
oai_identifier_str |
oai::1101352 |
network_acronym_str |
UNICAMP-30 |
network_name_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository_id_str |
|
spelling |
Anotação de dados guiada por projeção de característicasData annotation guided by feature projectionAprendizado de máquinaVisualização da informaçãoAprendizagem semi-supervisionadaMachine learningInformation visualizationSemi-supervised learningOrientador: Alexandre Xavier FalcãoDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de ComputaçãoResumo: Anotação de dados baseada na inspeção visual do usuário (supervisão) de cada amostra de treinamento pode ser um processo trabalhoso, especialmente quando o número de amostras é alto --- um conhecido problema no aprendizado de parâmetros de redes neurais com muitas camadas escondidas em Aprendizado de Máquina. A anotação de dados pelo usuário pode ser ainda mais trabalhosa, particularmente, em áreas que requerem um profissional com conhecimento especializado, como Medicina e Biologia. Tradicionalmente, estudos têm apresentado soluções que empregam o aprendizado semi-supervisionado para lidar com tal questão, a fim de propagar rótulos a partir de poucas amostras supervisionados para amostras não-supervisionadas, explorando a distribuição dessas amostras no espaço de características. Contudo, tais trabalhos não consideram a habilidade cognitiva do usuário para entender projeções do espaço de características com o propósito de aumentar a quantidade de amostras rotuladas para o aprendizado de máquina. Neste trabalho, explorou-se a habilidade cognitiva do usuário assistido por uma ferramenta de analítica visual na tarefa de propagar rótulos para uma grande quantidade de amostras não-supervisionadas. O usuário é guiado pelo conhecimento de rótulo de poucas amostras, bem como pela informação visual da distribuição das amostras na projeção do espaço de características. Além disso, investigou-se uma abordagem de anotação de dados semi-automática, ou seja, que combina as estratégias de propagação de rótulos manual e automática, utilizando uma projeção apropriada do espaço de características e estimação de rótulo semi-supervisionada com medida de certeza para reduzir o esforço do usuário. O método é validado em dois contextos: em uma base conhecida de imagens, MNIST, e em bases de imagens de parasitos intestinais de humanos com e sem impurezas fecais (uma classe adversa que torna o problema mais desafiador). O estudo avaliou duas abordagens automáticas para aprendizado semi-supervisionado nos espaços latente e projetado. Além disso, avaliou dois classificadores supervisionados treinados com os conjuntos rotulados. Por fim, os experimentos visaram escolher a solução que melhor reduz o esforço do usuário para a anotação de dados e, ao mesmo tempo, aumenta os resultados de acurácia na classificação do conjunto de teste. Os resultados sugerem que ferramentas de analítica visual, quando utilizadas para combinar as habilidades complementares de humanos e máquinas, possibilitam um aprendizado de máquina mais eficazAbstract: Data annotation using visual inspection (supervision) of each training sample can be a laborious process, especially when the number of samples is high --- a well-known problem in deep learning. The data annotation by the user can be even more laborious, particularly in areas that requires an expert with specialized knowledge, such as Medicine and Biology. Traditionally, studies have presented solutions that employ semi-supervised learning to deal with such issue to propagate labels from a few supervised samples to unsupervised samples by exploring the distribution of those samples in the feature space. However, such works do not consider the user's cognitive ability to understand feature space projections for the purpose of increasing the number of labeled samples for machine learning. In this work, we present data annotation methods in which the user is assisted by a visual analytics tool in the task of propagating labels to a large number of unsupervised samples. The user is guided by the knowledge of few labeled samples as well as the visual information of the sample distribution in feature space projection. Also, we investigate a semi-automatic data annotation approach. That is, we combine manual and automatic label propagation using an appropriate feature space projection and semi-supervised label estimation based on a certainty measure to reduce user effort in data annotation. We validate the method in two contexts: on a known image database, MNIST, and on images of human intestinal parasites with and without fecal impurities (an adverse class that makes the problem even more challenging). We evaluate two automatic approaches to semi-supervised learning in latent and projected spaces. In addition, we evaluate two supervised classifiers, trained with the labeled sets. Finally, the experiments aim to choose the solution that best reduces the user effort for data annotation and also increases the classification accuracy on test sets. The results suggest that visual analytics tools can provide more effective machine learning whenever they combine the complementary skills of humans and machinesMestradoCiência da ComputaçãoMestra em Ciência da ComputaçãoCAPESFAPESP2016/25776-0, 2017/25327-3[s.n.]Falcão, Alexandre Xavier, 1966-Rezende, Pedro Jussieu dePonti, Moacir AntonelliUniversidade Estadual de Campinas. Instituto de ComputaçãoPrograma de Pós-Graduação em Ciência da ComputaçãoUNIVERSIDADE ESTADUAL DE CAMPINASBenato, Bárbara Caroline, 1994-20192019-09-10T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf1 recurso online (76 p.) : il., digital, arquivo PDF.https://hdl.handle.net/20.500.12733/1637994BENATO, Bárbara Caroline. Anotação de dados guiada por projeção de características. 2019. 1 recurso online (76 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1637994. Acesso em: 26 abr. 2024.https://repositorio.unicamp.br/acervo/detalhe/1101352Requisitos do sistema: Software para leitura de arquivo em PDFporreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2020-02-12T14:44:44Zoai::1101352Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2020-02-12T14:44:44Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false |
dc.title.none.fl_str_mv |
Anotação de dados guiada por projeção de características Data annotation guided by feature projection |
title |
Anotação de dados guiada por projeção de características |
spellingShingle |
Anotação de dados guiada por projeção de características Benato, Bárbara Caroline, 1994- Aprendizado de máquina Visualização da informação Aprendizagem semi-supervisionada Machine learning Information visualization Semi-supervised learning |
title_short |
Anotação de dados guiada por projeção de características |
title_full |
Anotação de dados guiada por projeção de características |
title_fullStr |
Anotação de dados guiada por projeção de características |
title_full_unstemmed |
Anotação de dados guiada por projeção de características |
title_sort |
Anotação de dados guiada por projeção de características |
author |
Benato, Bárbara Caroline, 1994- |
author_facet |
Benato, Bárbara Caroline, 1994- |
author_role |
author |
dc.contributor.none.fl_str_mv |
Falcão, Alexandre Xavier, 1966- Rezende, Pedro Jussieu de Ponti, Moacir Antonelli Universidade Estadual de Campinas. Instituto de Computação Programa de Pós-Graduação em Ciência da Computação UNIVERSIDADE ESTADUAL DE CAMPINAS |
dc.contributor.author.fl_str_mv |
Benato, Bárbara Caroline, 1994- |
dc.subject.por.fl_str_mv |
Aprendizado de máquina Visualização da informação Aprendizagem semi-supervisionada Machine learning Information visualization Semi-supervised learning |
topic |
Aprendizado de máquina Visualização da informação Aprendizagem semi-supervisionada Machine learning Information visualization Semi-supervised learning |
description |
Orientador: Alexandre Xavier Falcão |
publishDate |
2019 |
dc.date.none.fl_str_mv |
2019 2019-09-10T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/20.500.12733/1637994 BENATO, Bárbara Caroline. Anotação de dados guiada por projeção de características. 2019. 1 recurso online (76 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1637994. Acesso em: 26 abr. 2024. |
url |
https://hdl.handle.net/20.500.12733/1637994 |
identifier_str_mv |
BENATO, Bárbara Caroline. Anotação de dados guiada por projeção de características. 2019. 1 recurso online (76 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1637994. Acesso em: 26 abr. 2024. |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://repositorio.unicamp.br/acervo/detalhe/1101352 Requisitos do sistema: Software para leitura de arquivo em PDF |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf 1 recurso online (76 p.) : il., digital, arquivo PDF. |
dc.publisher.none.fl_str_mv |
[s.n.] |
publisher.none.fl_str_mv |
[s.n.] |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) instname:Universidade Estadual de Campinas (UNICAMP) instacron:UNICAMP |
instname_str |
Universidade Estadual de Campinas (UNICAMP) |
instacron_str |
UNICAMP |
institution |
UNICAMP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
collection |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP) |
repository.mail.fl_str_mv |
sbubd@unicamp.br |
_version_ |
1797405516986580992 |