Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais
| Ano de defesa: | 2019 |
|---|---|
| Autor(a) principal: | |
| Outros Autores: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal do Amazonas
Faculdade de Tecnologia Brasil UFAM Programa de Pós-graduação em Engenharia Elétrica |
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://tede.ufam.edu.br/handle/tede/6956 |
Resumo: | Este trabalho apresenta a utilização de redes neurais convolucionais na classificação das configurações de mão da língua brasileira de sinais. Para elaborar modelos com capacidade de aprendizagem relacionada a essa língua, foi utilizado o conjunto de dados LibrasImage. As arquiteturas de redes utilizadas foram selecionadas com base na pesquisa bibliográfica sistemática realizada. Diferentes valores de hiperparâmetros foram testados para verificação e escolha daqueles que melhor se adequassem a tarefa de classificação. Os treinamentos dos modelos foram realizados por 500 épocas com três arquiteturas diferentes e duas técnicas de regularização (dropout e L2). Para testar o desempenho dos doze modelos com relação a classificação das configurações de mão, a acurácia foi a medida de desempenho escolhida para comparação. Para cada uma das arquiteturas, o modelo com maior acurácia foi selecionado para ser analisado com relação a sensibilidade, área sob a curva ROC e taxa de erro para cada uma das configurações de mão presentes no conjunto de dados LibrasImage. O modelo com melhor desempenho com relação as medidas citadas, foi comparado ao modelo treinado com o classificador k-vizinhos mais próximos, apresentado no trabalho de Costa Filho et al. (2017), para diferentes medidas de avaliação: acurácia, sensibilidade, precisão e F1 score. Os resultados mostraram que a utilização de redes neurais convolucionais é uma técnica que melhora a aprendizagem das configurações de mão da língua brasileira de sinais em relação ao outro método de classificação disponível na literatura que foi testado com o mesmo conjunto de dados, apresentando uma acurácia de 97,98%. A diferença de desempenho entre os dois métodos, em termos de acurácia, foi avaliada com o teste qui-quadrado de Pearson, cujo resultado mostrou ser estatisticamente significativo. |
| id |
UFAM_34b8bfa45870308079f7c2f593303a28 |
|---|---|
| oai_identifier_str |
oai:https://tede.ufam.edu.br/handle/:tede/6956 |
| network_acronym_str |
UFAM |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da UFAM |
| repository_id_str |
|
| spelling |
Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinaisLíngua Brasileira de SinaisRedes neurais convolucionaisReconhecimento de sinaisAprendizagem profundaTécnicas de regularizaçãoDropoutL2Classificação das configurações de mãoENGENHARIAS: ENGENHARIA ELÉTRICAEste trabalho apresenta a utilização de redes neurais convolucionais na classificação das configurações de mão da língua brasileira de sinais. Para elaborar modelos com capacidade de aprendizagem relacionada a essa língua, foi utilizado o conjunto de dados LibrasImage. As arquiteturas de redes utilizadas foram selecionadas com base na pesquisa bibliográfica sistemática realizada. Diferentes valores de hiperparâmetros foram testados para verificação e escolha daqueles que melhor se adequassem a tarefa de classificação. Os treinamentos dos modelos foram realizados por 500 épocas com três arquiteturas diferentes e duas técnicas de regularização (dropout e L2). Para testar o desempenho dos doze modelos com relação a classificação das configurações de mão, a acurácia foi a medida de desempenho escolhida para comparação. Para cada uma das arquiteturas, o modelo com maior acurácia foi selecionado para ser analisado com relação a sensibilidade, área sob a curva ROC e taxa de erro para cada uma das configurações de mão presentes no conjunto de dados LibrasImage. O modelo com melhor desempenho com relação as medidas citadas, foi comparado ao modelo treinado com o classificador k-vizinhos mais próximos, apresentado no trabalho de Costa Filho et al. (2017), para diferentes medidas de avaliação: acurácia, sensibilidade, precisão e F1 score. Os resultados mostraram que a utilização de redes neurais convolucionais é uma técnica que melhora a aprendizagem das configurações de mão da língua brasileira de sinais em relação ao outro método de classificação disponível na literatura que foi testado com o mesmo conjunto de dados, apresentando uma acurácia de 97,98%. A diferença de desempenho entre os dois métodos, em termos de acurácia, foi avaliada com o teste qui-quadrado de Pearson, cujo resultado mostrou ser estatisticamente significativo.This work presents a method to classify Brazilian sign language hand configurations using convolutional neural networks. The network architectures used were selected based on a systematic bibliographic research. Several experiments were done using different values of hyperparameters aiming to obtain the best fit the classification task. The models training was carried out for 500 epochs using three different architectures and two regularization techniques (dropout and L2). LibrasImage, a data set of hand configurations depth images was used in the training and testing steps of the models. The models were analyzed with respect to the accuracy, sensitivity, area under the ROC curve and error rate for each hand configuration. The best result obtained was an accuracy of 97.98%. This result shows that the use of convolutional neural network improves the classification of Brazilian sign language hand configurations in relation to the method that uses the k-nearest neighbor classifier, that was tested with the same dataset. The difference in performance between the two methods was statistically significant by Pearson chi-square test.Universidade Federal do AmazonasFaculdade de TecnologiaBrasilUFAMPrograma de Pós-graduação em Engenharia ElétricaCosta, Marly Guimarães Fernandeshttp://lattes.cnpq.br/7169358412541736Pereira, José Raimundo Gomeshttp://lattes.cnpq.br/3697983438100904Oliveira, Jozias Parente dehttp://lattes.cnpq.br/1169202481169729Oliveira, Anne de Souzahttp://lattes.cnpq.br/07006485375951202019-02-18T14:49:04Z2019-01-03info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisimage/pngapplication/pdfOLIVEIRA, Anne de Souza. Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais. 2019. 96 f. Dissertação (Mestrado em Engenharia Elétrica) - Faculdade de Tecnologia, Universidade Federal do Amazonas, Manaus, 2019.https://tede.ufam.edu.br/handle/tede/6956porhttp://creativecommons.org/licenses/by/4.0/info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFAMinstname:Universidade Federal do Amazonas (UFAM)instacron:UFAM2019-02-19T05:03:52Zoai:https://tede.ufam.edu.br/handle/:tede/6956Biblioteca Digital de Teses e Dissertaçõeshttp://200.129.163.131:8080/PUBhttp://200.129.163.131:8080/oai/requestddbc@ufam.edu.br||ddbc@ufam.edu.bropendoar:65922019-02-19T05:03:52Biblioteca Digital de Teses e Dissertações da UFAM - Universidade Federal do Amazonas (UFAM)false |
| dc.title.none.fl_str_mv |
Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais |
| title |
Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais |
| spellingShingle |
Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais Oliveira, Anne de Souza Língua Brasileira de Sinais Redes neurais convolucionais Reconhecimento de sinais Aprendizagem profunda Técnicas de regularização Dropout L2 Classificação das configurações de mão ENGENHARIAS: ENGENHARIA ELÉTRICA |
| title_short |
Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais |
| title_full |
Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais |
| title_fullStr |
Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais |
| title_full_unstemmed |
Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais |
| title_sort |
Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais |
| author |
Oliveira, Anne de Souza |
| author_facet |
Oliveira, Anne de Souza http://lattes.cnpq.br/0700648537595120 |
| author_role |
author |
| author2 |
http://lattes.cnpq.br/0700648537595120 |
| author2_role |
author |
| dc.contributor.none.fl_str_mv |
Costa, Marly Guimarães Fernandes http://lattes.cnpq.br/7169358412541736 Pereira, José Raimundo Gomes http://lattes.cnpq.br/3697983438100904 Oliveira, Jozias Parente de http://lattes.cnpq.br/1169202481169729 |
| dc.contributor.author.fl_str_mv |
Oliveira, Anne de Souza http://lattes.cnpq.br/0700648537595120 |
| dc.subject.por.fl_str_mv |
Língua Brasileira de Sinais Redes neurais convolucionais Reconhecimento de sinais Aprendizagem profunda Técnicas de regularização Dropout L2 Classificação das configurações de mão ENGENHARIAS: ENGENHARIA ELÉTRICA |
| topic |
Língua Brasileira de Sinais Redes neurais convolucionais Reconhecimento de sinais Aprendizagem profunda Técnicas de regularização Dropout L2 Classificação das configurações de mão ENGENHARIAS: ENGENHARIA ELÉTRICA |
| description |
Este trabalho apresenta a utilização de redes neurais convolucionais na classificação das configurações de mão da língua brasileira de sinais. Para elaborar modelos com capacidade de aprendizagem relacionada a essa língua, foi utilizado o conjunto de dados LibrasImage. As arquiteturas de redes utilizadas foram selecionadas com base na pesquisa bibliográfica sistemática realizada. Diferentes valores de hiperparâmetros foram testados para verificação e escolha daqueles que melhor se adequassem a tarefa de classificação. Os treinamentos dos modelos foram realizados por 500 épocas com três arquiteturas diferentes e duas técnicas de regularização (dropout e L2). Para testar o desempenho dos doze modelos com relação a classificação das configurações de mão, a acurácia foi a medida de desempenho escolhida para comparação. Para cada uma das arquiteturas, o modelo com maior acurácia foi selecionado para ser analisado com relação a sensibilidade, área sob a curva ROC e taxa de erro para cada uma das configurações de mão presentes no conjunto de dados LibrasImage. O modelo com melhor desempenho com relação as medidas citadas, foi comparado ao modelo treinado com o classificador k-vizinhos mais próximos, apresentado no trabalho de Costa Filho et al. (2017), para diferentes medidas de avaliação: acurácia, sensibilidade, precisão e F1 score. Os resultados mostraram que a utilização de redes neurais convolucionais é uma técnica que melhora a aprendizagem das configurações de mão da língua brasileira de sinais em relação ao outro método de classificação disponível na literatura que foi testado com o mesmo conjunto de dados, apresentando uma acurácia de 97,98%. A diferença de desempenho entre os dois métodos, em termos de acurácia, foi avaliada com o teste qui-quadrado de Pearson, cujo resultado mostrou ser estatisticamente significativo. |
| publishDate |
2019 |
| dc.date.none.fl_str_mv |
2019-02-18T14:49:04Z 2019-01-03 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
OLIVEIRA, Anne de Souza. Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais. 2019. 96 f. Dissertação (Mestrado em Engenharia Elétrica) - Faculdade de Tecnologia, Universidade Federal do Amazonas, Manaus, 2019. https://tede.ufam.edu.br/handle/tede/6956 |
| identifier_str_mv |
OLIVEIRA, Anne de Souza. Uso de técnicas de aprendizagem profunda na classificação de configurações de mão de língua de sinais. 2019. 96 f. Dissertação (Mestrado em Engenharia Elétrica) - Faculdade de Tecnologia, Universidade Federal do Amazonas, Manaus, 2019. |
| url |
https://tede.ufam.edu.br/handle/tede/6956 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
http://creativecommons.org/licenses/by/4.0/ info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by/4.0/ |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
image/png application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Federal do Amazonas Faculdade de Tecnologia Brasil UFAM Programa de Pós-graduação em Engenharia Elétrica |
| publisher.none.fl_str_mv |
Universidade Federal do Amazonas Faculdade de Tecnologia Brasil UFAM Programa de Pós-graduação em Engenharia Elétrica |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFAM instname:Universidade Federal do Amazonas (UFAM) instacron:UFAM |
| instname_str |
Universidade Federal do Amazonas (UFAM) |
| instacron_str |
UFAM |
| institution |
UFAM |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da UFAM |
| collection |
Biblioteca Digital de Teses e Dissertações da UFAM |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFAM - Universidade Federal do Amazonas (UFAM) |
| repository.mail.fl_str_mv |
ddbc@ufam.edu.br||ddbc@ufam.edu.br |
| _version_ |
1851781290891673600 |