Anotação de dados guiada por projeção de características

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Benato, Bárbara Caroline, 1994-
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: [s.n.]
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://hdl.handle.net/20.500.12733/1637994
Resumo: Orientador: Alexandre Xavier Falcão
id UNICAMP-30_ca5e670cfe4edb8dc3f6e4d4aef54644
oai_identifier_str oai::1101352
network_acronym_str UNICAMP-30
network_name_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository_id_str
spelling Anotação de dados guiada por projeção de característicasData annotation guided by feature projectionAprendizado de máquinaVisualização da informaçãoAprendizagem semi-supervisionadaMachine learningInformation visualizationSemi-supervised learningOrientador: Alexandre Xavier FalcãoDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de ComputaçãoResumo: Anotação de dados baseada na inspeção visual do usuário (supervisão) de cada amostra de treinamento pode ser um processo trabalhoso, especialmente quando o número de amostras é alto --- um conhecido problema no aprendizado de parâmetros de redes neurais com muitas camadas escondidas em Aprendizado de Máquina. A anotação de dados pelo usuário pode ser ainda mais trabalhosa, particularmente, em áreas que requerem um profissional com conhecimento especializado, como Medicina e Biologia. Tradicionalmente, estudos têm apresentado soluções que empregam o aprendizado semi-supervisionado para lidar com tal questão, a fim de propagar rótulos a partir de poucas amostras supervisionados para amostras não-supervisionadas, explorando a distribuição dessas amostras no espaço de características. Contudo, tais trabalhos não consideram a habilidade cognitiva do usuário para entender projeções do espaço de características com o propósito de aumentar a quantidade de amostras rotuladas para o aprendizado de máquina. Neste trabalho, explorou-se a habilidade cognitiva do usuário assistido por uma ferramenta de analítica visual na tarefa de propagar rótulos para uma grande quantidade de amostras não-supervisionadas. O usuário é guiado pelo conhecimento de rótulo de poucas amostras, bem como pela informação visual da distribuição das amostras na projeção do espaço de características. Além disso, investigou-se uma abordagem de anotação de dados semi-automática, ou seja, que combina as estratégias de propagação de rótulos manual e automática, utilizando uma projeção apropriada do espaço de características e estimação de rótulo semi-supervisionada com medida de certeza para reduzir o esforço do usuário. O método é validado em dois contextos: em uma base conhecida de imagens, MNIST, e em bases de imagens de parasitos intestinais de humanos com e sem impurezas fecais (uma classe adversa que torna o problema mais desafiador). O estudo avaliou duas abordagens automáticas para aprendizado semi-supervisionado nos espaços latente e projetado. Além disso, avaliou dois classificadores supervisionados treinados com os conjuntos rotulados. Por fim, os experimentos visaram escolher a solução que melhor reduz o esforço do usuário para a anotação de dados e, ao mesmo tempo, aumenta os resultados de acurácia na classificação do conjunto de teste. Os resultados sugerem que ferramentas de analítica visual, quando utilizadas para combinar as habilidades complementares de humanos e máquinas, possibilitam um aprendizado de máquina mais eficazAbstract: Data annotation using visual inspection (supervision) of each training sample can be a laborious process, especially when the number of samples is high --- a well-known problem in deep learning. The data annotation by the user can be even more laborious, particularly in areas that requires an expert with specialized knowledge, such as Medicine and Biology. Traditionally, studies have presented solutions that employ semi-supervised learning to deal with such issue to propagate labels from a few supervised samples to unsupervised samples by exploring the distribution of those samples in the feature space. However, such works do not consider the user's cognitive ability to understand feature space projections for the purpose of increasing the number of labeled samples for machine learning. In this work, we present data annotation methods in which the user is assisted by a visual analytics tool in the task of propagating labels to a large number of unsupervised samples. The user is guided by the knowledge of few labeled samples as well as the visual information of the sample distribution in feature space projection. Also, we investigate a semi-automatic data annotation approach. That is, we combine manual and automatic label propagation using an appropriate feature space projection and semi-supervised label estimation based on a certainty measure to reduce user effort in data annotation. We validate the method in two contexts: on a known image database, MNIST, and on images of human intestinal parasites with and without fecal impurities (an adverse class that makes the problem even more challenging). We evaluate two automatic approaches to semi-supervised learning in latent and projected spaces. In addition, we evaluate two supervised classifiers, trained with the labeled sets. Finally, the experiments aim to choose the solution that best reduces the user effort for data annotation and also increases the classification accuracy on test sets. The results suggest that visual analytics tools can provide more effective machine learning whenever they combine the complementary skills of humans and machinesMestradoCiência da ComputaçãoMestra em Ciência da ComputaçãoCAPESFAPESP2016/25776-0, 2017/25327-3[s.n.]Falcão, Alexandre Xavier, 1966-Rezende, Pedro Jussieu dePonti, Moacir AntonelliUniversidade Estadual de Campinas. Instituto de ComputaçãoPrograma de Pós-Graduação em Ciência da ComputaçãoUNIVERSIDADE ESTADUAL DE CAMPINASBenato, Bárbara Caroline, 1994-20192019-09-10T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdf1 recurso online (76 p.) : il., digital, arquivo PDF.https://hdl.handle.net/20.500.12733/1637994BENATO, Bárbara Caroline. Anotação de dados guiada por projeção de características. 2019. 1 recurso online (76 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1637994. Acesso em: 26 abr. 2024.https://repositorio.unicamp.br/acervo/detalhe/1101352Requisitos do sistema: Software para leitura de arquivo em PDFporreponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)instname:Universidade Estadual de Campinas (UNICAMP)instacron:UNICAMPinfo:eu-repo/semantics/openAccess2020-02-12T14:44:44Zoai::1101352Biblioteca Digital de Teses e DissertaçõesPUBhttp://repositorio.unicamp.br/oai/tese/oai.aspsbubd@unicamp.bropendoar:2020-02-12T14:44:44Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)false
dc.title.none.fl_str_mv Anotação de dados guiada por projeção de características
Data annotation guided by feature projection
title Anotação de dados guiada por projeção de características
spellingShingle Anotação de dados guiada por projeção de características
Benato, Bárbara Caroline, 1994-
Aprendizado de máquina
Visualização da informação
Aprendizagem semi-supervisionada
Machine learning
Information visualization
Semi-supervised learning
title_short Anotação de dados guiada por projeção de características
title_full Anotação de dados guiada por projeção de características
title_fullStr Anotação de dados guiada por projeção de características
title_full_unstemmed Anotação de dados guiada por projeção de características
title_sort Anotação de dados guiada por projeção de características
author Benato, Bárbara Caroline, 1994-
author_facet Benato, Bárbara Caroline, 1994-
author_role author
dc.contributor.none.fl_str_mv Falcão, Alexandre Xavier, 1966-
Rezende, Pedro Jussieu de
Ponti, Moacir Antonelli
Universidade Estadual de Campinas. Instituto de Computação
Programa de Pós-Graduação em Ciência da Computação
UNIVERSIDADE ESTADUAL DE CAMPINAS
dc.contributor.author.fl_str_mv Benato, Bárbara Caroline, 1994-
dc.subject.por.fl_str_mv Aprendizado de máquina
Visualização da informação
Aprendizagem semi-supervisionada
Machine learning
Information visualization
Semi-supervised learning
topic Aprendizado de máquina
Visualização da informação
Aprendizagem semi-supervisionada
Machine learning
Information visualization
Semi-supervised learning
description Orientador: Alexandre Xavier Falcão
publishDate 2019
dc.date.none.fl_str_mv 2019
2019-09-10T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/20.500.12733/1637994
BENATO, Bárbara Caroline. Anotação de dados guiada por projeção de características. 2019. 1 recurso online (76 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1637994. Acesso em: 26 abr. 2024.
url https://hdl.handle.net/20.500.12733/1637994
identifier_str_mv BENATO, Bárbara Caroline. Anotação de dados guiada por projeção de características. 2019. 1 recurso online (76 p.) Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. Disponível em: https://hdl.handle.net/20.500.12733/1637994. Acesso em: 26 abr. 2024.
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://repositorio.unicamp.br/acervo/detalhe/1101352
Requisitos do sistema: Software para leitura de arquivo em PDF
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
1 recurso online (76 p.) : il., digital, arquivo PDF.
dc.publisher.none.fl_str_mv [s.n.]
publisher.none.fl_str_mv [s.n.]
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
instname:Universidade Estadual de Campinas (UNICAMP)
instacron:UNICAMP
instname_str Universidade Estadual de Campinas (UNICAMP)
instacron_str UNICAMP
institution UNICAMP
reponame_str Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
collection Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP) - Universidade Estadual de Campinas (UNICAMP)
repository.mail.fl_str_mv sbubd@unicamp.br
_version_ 1797405516986580992