Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Oliveira, Anne de Souza
Outros Autores: http://lattes.cnpq.br/0700648537595120
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal do Amazonas
Faculdade de Tecnologia
Brasil
UFAM
Programa de Pós-graduação em Engenharia Elétrica
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
L2
Link de acesso: https://tede.ufam.edu.br/handle/tede/6956
Resumo: Este trabalho apresenta a utilização de redes neurais convolucionais na classificação das configurações de mão da língua brasileira de sinais. Para elaborar modelos com capacidade de aprendizagem relacionada a essa língua, foi utilizado o conjunto de dados LibrasImage. As arquiteturas de redes utilizadas foram selecionadas com base na pesquisa bibliográfica sistemática realizada. Diferentes valores de hiperparâmetros foram testados para verificação e escolha daqueles que melhor se adequassem a tarefa de classificação. Os treinamentos dos modelos foram realizados por 500 épocas com três arquiteturas diferentes e duas técnicas de regularização (dropout e L2). Para testar o desempenho dos doze modelos com relação a classificação das configurações de mão, a acurácia foi a medida de desempenho escolhida para comparação. Para cada uma das arquiteturas, o modelo com maior acurácia foi selecionado para ser analisado com relação a sensibilidade, área sob a curva ROC e taxa de erro para cada uma das configurações de mão presentes no conjunto de dados LibrasImage. O modelo com melhor desempenho com relação as medidas citadas, foi comparado ao modelo treinado com o classificador k-vizinhos mais próximos, apresentado no trabalho de Costa Filho et al. (2017), para diferentes medidas de avaliação: acurácia, sensibilidade, precisão e F1 score. Os resultados mostraram que a utilização de redes neurais convolucionais é uma técnica que melhora a aprendizagem das configurações de mão da língua brasileira de sinais em relação ao outro método de classificação disponível na literatura que foi testado com o mesmo conjunto de dados, apresentando uma acurácia de 97,98%. A diferença de desempenho entre os dois métodos, em termos de acurácia, foi avaliada com o teste qui-quadrado de Pearson, cujo resultado mostrou ser estatisticamente significativo.
id UFAM_34b8bfa45870308079f7c2f593303a28
oai_identifier_str oai:https://tede.ufam.edu.br/handle/:tede/6956
network_acronym_str UFAM
network_name_str Biblioteca Digital de Teses e Dissertações da UFAM
repository_id_str
spelling Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinaisLíngua Brasileira de SinaisRedes neurais convolucionaisReconhecimento de sinaisAprendizagem profundaTécnicas de regularizaçãoDropoutL2Classificação das configurações de mãoENGENHARIAS: ENGENHARIA ELÉTRICAEste trabalho apresenta a utilização de redes neurais convolucionais na classificação das configurações de mão da língua brasileira de sinais. Para elaborar modelos com capacidade de aprendizagem relacionada a essa língua, foi utilizado o conjunto de dados LibrasImage. As arquiteturas de redes utilizadas foram selecionadas com base na pesquisa bibliográfica sistemática realizada. Diferentes valores de hiperparâmetros foram testados para verificação e escolha daqueles que melhor se adequassem a tarefa de classificação. Os treinamentos dos modelos foram realizados por 500 épocas com três arquiteturas diferentes e duas técnicas de regularização (dropout e L2). Para testar o desempenho dos doze modelos com relação a classificação das configurações de mão, a acurácia foi a medida de desempenho escolhida para comparação. Para cada uma das arquiteturas, o modelo com maior acurácia foi selecionado para ser analisado com relação a sensibilidade, área sob a curva ROC e taxa de erro para cada uma das configurações de mão presentes no conjunto de dados LibrasImage. O modelo com melhor desempenho com relação as medidas citadas, foi comparado ao modelo treinado com o classificador k-vizinhos mais próximos, apresentado no trabalho de Costa Filho et al. (2017), para diferentes medidas de avaliação: acurácia, sensibilidade, precisão e F1 score. Os resultados mostraram que a utilização de redes neurais convolucionais é uma técnica que melhora a aprendizagem das configurações de mão da língua brasileira de sinais em relação ao outro método de classificação disponível na literatura que foi testado com o mesmo conjunto de dados, apresentando uma acurácia de 97,98%. A diferença de desempenho entre os dois métodos, em termos de acurácia, foi avaliada com o teste qui-quadrado de Pearson, cujo resultado mostrou ser estatisticamente significativo.This work presents a method to classify Brazilian sign language hand configurations using convolutional neural networks. The network architectures used were selected based on a systematic bibliographic research. Several experiments were done using different values of hyperparameters aiming to obtain the best fit the classification task. The models training was carried out for 500 epochs using three different architectures and two regularization techniques (dropout and L2). LibrasImage, a data set of hand configurations depth images was used in the training and testing steps of the models. The models were analyzed with respect to the accuracy, sensitivity, area under the ROC curve and error rate for each hand configuration. The best result obtained was an accuracy of 97.98%. This result shows that the use of convolutional neural network improves the classification of Brazilian sign language hand configurations in relation to the method that uses the k-nearest neighbor classifier, that was tested with the same dataset. The difference in performance between the two methods was statistically significant by Pearson chi-square test.Universidade Federal do AmazonasFaculdade de TecnologiaBrasilUFAMPrograma de Pós-graduação em Engenharia ElétricaCosta, Marly Guimarães Fernandeshttp://lattes.cnpq.br/7169358412541736Pereira, José Raimundo Gomeshttp://lattes.cnpq.br/3697983438100904Oliveira, Jozias Parente dehttp://lattes.cnpq.br/1169202481169729Oliveira, Anne de Souzahttp://lattes.cnpq.br/07006485375951202019-02-18T14:49:04Z2019-01-03info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisimage/pngapplication/pdfOLIVEIRA, Anne de Souza. Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais. 2019. 96 f. Dissertação (Mestrado em Engenharia Elétrica) - Faculdade de Tecnologia, Universidade Federal do Amazonas, Manaus, 2019.https://tede.ufam.edu.br/handle/tede/6956porhttp://creativecommons.org/licenses/by/4.0/info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFAMinstname:Universidade Federal do Amazonas (UFAM)instacron:UFAM2019-02-19T05:03:52Zoai:https://tede.ufam.edu.br/handle/:tede/6956Biblioteca Digital de Teses e Dissertaçõeshttp://200.129.163.131:8080/PUBhttp://200.129.163.131:8080/oai/requestddbc@ufam.edu.br||ddbc@ufam.edu.bropendoar:65922019-02-19T05:03:52Biblioteca Digital de Teses e Dissertações da UFAM - Universidade Federal do Amazonas (UFAM)false
dc.title.none.fl_str_mv Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais
title Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais
spellingShingle Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais
Oliveira, Anne de Souza
Língua Brasileira de Sinais
Redes neurais convolucionais
Reconhecimento de sinais
Aprendizagem profunda
Técnicas de regularização
Dropout
L2
Classificação das configurações de mão
ENGENHARIAS: ENGENHARIA ELÉTRICA
title_short Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais
title_full Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais
title_fullStr Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais
title_full_unstemmed Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais
title_sort Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais
author Oliveira, Anne de Souza
author_facet Oliveira, Anne de Souza
http://lattes.cnpq.br/0700648537595120
author_role author
author2 http://lattes.cnpq.br/0700648537595120
author2_role author
dc.contributor.none.fl_str_mv Costa, Marly Guimarães Fernandes
http://lattes.cnpq.br/7169358412541736
Pereira, José Raimundo Gomes
http://lattes.cnpq.br/3697983438100904
Oliveira, Jozias Parente de
http://lattes.cnpq.br/1169202481169729
dc.contributor.author.fl_str_mv Oliveira, Anne de Souza
http://lattes.cnpq.br/0700648537595120
dc.subject.por.fl_str_mv Língua Brasileira de Sinais
Redes neurais convolucionais
Reconhecimento de sinais
Aprendizagem profunda
Técnicas de regularização
Dropout
L2
Classificação das configurações de mão
ENGENHARIAS: ENGENHARIA ELÉTRICA
topic Língua Brasileira de Sinais
Redes neurais convolucionais
Reconhecimento de sinais
Aprendizagem profunda
Técnicas de regularização
Dropout
L2
Classificação das configurações de mão
ENGENHARIAS: ENGENHARIA ELÉTRICA
description Este trabalho apresenta a utilização de redes neurais convolucionais na classificação das configurações de mão da língua brasileira de sinais. Para elaborar modelos com capacidade de aprendizagem relacionada a essa língua, foi utilizado o conjunto de dados LibrasImage. As arquiteturas de redes utilizadas foram selecionadas com base na pesquisa bibliográfica sistemática realizada. Diferentes valores de hiperparâmetros foram testados para verificação e escolha daqueles que melhor se adequassem a tarefa de classificação. Os treinamentos dos modelos foram realizados por 500 épocas com três arquiteturas diferentes e duas técnicas de regularização (dropout e L2). Para testar o desempenho dos doze modelos com relação a classificação das configurações de mão, a acurácia foi a medida de desempenho escolhida para comparação. Para cada uma das arquiteturas, o modelo com maior acurácia foi selecionado para ser analisado com relação a sensibilidade, área sob a curva ROC e taxa de erro para cada uma das configurações de mão presentes no conjunto de dados LibrasImage. O modelo com melhor desempenho com relação as medidas citadas, foi comparado ao modelo treinado com o classificador k-vizinhos mais próximos, apresentado no trabalho de Costa Filho et al. (2017), para diferentes medidas de avaliação: acurácia, sensibilidade, precisão e F1 score. Os resultados mostraram que a utilização de redes neurais convolucionais é uma técnica que melhora a aprendizagem das configurações de mão da língua brasileira de sinais em relação ao outro método de classificação disponível na literatura que foi testado com o mesmo conjunto de dados, apresentando uma acurácia de 97,98%. A diferença de desempenho entre os dois métodos, em termos de acurácia, foi avaliada com o teste qui-quadrado de Pearson, cujo resultado mostrou ser estatisticamente significativo.
publishDate 2019
dc.date.none.fl_str_mv 2019-02-18T14:49:04Z
2019-01-03
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv OLIVEIRA, Anne de Souza. Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais. 2019. 96 f. Dissertação (Mestrado em Engenharia Elétrica) - Faculdade de Tecnologia, Universidade Federal do Amazonas, Manaus, 2019.
https://tede.ufam.edu.br/handle/tede/6956
identifier_str_mv OLIVEIRA, Anne de Souza. Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais. 2019. 96 f. Dissertação (Mestrado em Engenharia Elétrica) - Faculdade de Tecnologia, Universidade Federal do Amazonas, Manaus, 2019.
url https://tede.ufam.edu.br/handle/tede/6956
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by/4.0/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by/4.0/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv image/png
application/pdf
dc.publisher.none.fl_str_mv Universidade Federal do Amazonas
Faculdade de Tecnologia
Brasil
UFAM
Programa de Pós-graduação em Engenharia Elétrica
publisher.none.fl_str_mv Universidade Federal do Amazonas
Faculdade de Tecnologia
Brasil
UFAM
Programa de Pós-graduação em Engenharia Elétrica
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da UFAM
instname:Universidade Federal do Amazonas (UFAM)
instacron:UFAM
instname_str Universidade Federal do Amazonas (UFAM)
instacron_str UFAM
institution UFAM
reponame_str Biblioteca Digital de Teses e Dissertações da UFAM
collection Biblioteca Digital de Teses e Dissertações da UFAM
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da UFAM - Universidade Federal do Amazonas (UFAM)
repository.mail.fl_str_mv ddbc@ufam.edu.br||ddbc@ufam.edu.br
_version_ 1851781290891673600