Reconhecimento de dígitos manuscritos: busca de um classificador com máxima taxa de acerto

Gil, Adriano Mendes; http://lattes.cnpq.br/5124923772763451

Reconhecimento de dígitos manuscritos: busca de um classificador com máxima taxa de acerto

Detalhes bibliográficos
Ano de defesa:	2014
Autor(a) principal:	Gil, Adriano Mendes
Outros Autores:	http://lattes.cnpq.br/5124923772763451
Orientador(a):	Não Informado pela instituição
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Dissertação
Tipo de acesso:	Acesso aberto
Idioma:	por
Instituição de defesa:	Universidade Federal do Amazonas Faculdade de Tecnologia Brasil UFAM Programa de Pós-graduação em Engenharia Elétrica
Programa de Pós-Graduação:	Não Informado pela instituição
Departamento:	Não Informado pela instituição
País:	Não Informado pela instituição
Palavras-chave em Português:	Redes neurais Reconhecimento de padrões Dígitos manuscritos Máquina de vetores de suporte Neural network Pattern recognition Handwritten digits Support vector machines ENGENHARIAS: ENGENHARIA ELÉTRICA
Link de acesso:	http://tede.ufam.edu.br/handle/handle/4428
Resumo:	Sistemas de reconhecimento ótico de caracteres, também conhecidos como OCR, permitem identificar e reconhecer caracteres impressos por meio de imagens, uma funcionalidade já bem difundida em scanners, dispositivos móveis, entre outros. Existe uma crescente necessidade de reconhecimento de caracteres manuscritos para uso em várias situações, tais como reconhecimento de valores nominais em cheques de bancos, reconhecimento dos dígitos manuscritos de endereço postal para redirecionamento automatizado de cartas nos correios. Reconhecimento de dígitos manuscritos esbarra na dificuldade de lidar com uma grande variação intraclasse, devido a diferentes estilos de escrita, diferentes graus de inclinação dos caracteres. Este trabalho apresenta três estratégias utilizando três diferentes métodos de reconhecimento de padrões e dois métodos de extração de características. A primeira estratégia utilizou Descritores de Fourier e a técnica de transição de borda para extrair valores representativos do contorno dos caracteres e como camada de classificação utilizou uma rede neural MLP em associação com um conjunto de classificadores SVM para validar e corrigir eventuais erros da rede MLP. A segunda estratégia figurou como base comparativa para as demais estratégias por utilizar um algoritmo clássico de redes neurais convolutivas, LeNet5, e como características utilizou as próprias imagens dos dígitos. A terceira estratégia fez uso de um conjunto de classificadores SVM em uma árvore de decisão desbalanceada para a classificação dos dígitos a partir unicamente de suas imagens. Como resultados dos experimentos, a primeira estratégia provou não ser totalmente efetiva por obter resultados em torno de 80% de taxa de acerto. A segunda estratégia obteve 0,9% de taxa de erro que apesar de ter sido alta, ainda é muito menor se comparada com os melhores resultados obtidos na literatura. A terceira estratégia por sua vez logrou sucesso em reconhecer 100% das amostras de teste da base MNist de dígitos manuscritos, devido ao sucesso do treinamento de cada um dos classificadores SVM, que apesar de utilizarem uma enorme quantidade de vetores de suporte, atingiram individualmente 0% de taxa de erro.

Metadados do item

id	UFAM_dfd1a1b3ec92844db761b75976d0a3b1
oai_identifier_str	oai:https://tede.ufam.edu.br/handle/:tede/4428
network_acronym_str	UFAM
network_name_str	Biblioteca Digital de Teses e Dissertações da UFAM
repository_id_str
spelling	Reconhecimento de dígitos manuscritos: busca de um classificador com máxima taxa de acertoRedes neuraisReconhecimento de padrõesDígitos manuscritosMáquina de vetores de suporteNeural networkPattern recognitionHandwritten digitsSupport vector machinesENGENHARIAS: ENGENHARIA ELÉTRICASistemas de reconhecimento ótico de caracteres, também conhecidos como OCR, permitem identificar e reconhecer caracteres impressos por meio de imagens, uma funcionalidade já bem difundida em scanners, dispositivos móveis, entre outros. Existe uma crescente necessidade de reconhecimento de caracteres manuscritos para uso em várias situações, tais como reconhecimento de valores nominais em cheques de bancos, reconhecimento dos dígitos manuscritos de endereço postal para redirecionamento automatizado de cartas nos correios. Reconhecimento de dígitos manuscritos esbarra na dificuldade de lidar com uma grande variação intraclasse, devido a diferentes estilos de escrita, diferentes graus de inclinação dos caracteres. Este trabalho apresenta três estratégias utilizando três diferentes métodos de reconhecimento de padrões e dois métodos de extração de características. A primeira estratégia utilizou Descritores de Fourier e a técnica de transição de borda para extrair valores representativos do contorno dos caracteres e como camada de classificação utilizou uma rede neural MLP em associação com um conjunto de classificadores SVM para validar e corrigir eventuais erros da rede MLP. A segunda estratégia figurou como base comparativa para as demais estratégias por utilizar um algoritmo clássico de redes neurais convolutivas, LeNet5, e como características utilizou as próprias imagens dos dígitos. A terceira estratégia fez uso de um conjunto de classificadores SVM em uma árvore de decisão desbalanceada para a classificação dos dígitos a partir unicamente de suas imagens. Como resultados dos experimentos, a primeira estratégia provou não ser totalmente efetiva por obter resultados em torno de 80% de taxa de acerto. A segunda estratégia obteve 0,9% de taxa de erro que apesar de ter sido alta, ainda é muito menor se comparada com os melhores resultados obtidos na literatura. A terceira estratégia por sua vez logrou sucesso em reconhecer 100% das amostras de teste da base MNist de dígitos manuscritos, devido ao sucesso do treinamento de cada um dos classificadores SVM, que apesar de utilizarem uma enorme quantidade de vetores de suporte, atingiram individualmente 0% de taxa de erro.Optical character recognition system, aka OCR, allows identifying and recognizing printed characters from pictures. A wide range of devices already has such functionality, e.g, scanners and mobile devices. The current everyday tasks has an increasing demand for handwritten character recognition, for example, recognize specified amount on bank checks, identify postal address to automate some aspects of letter delivery. Handwritten digit recognition faces the difficulty of great intraclass variability, due to different writing stiles and different character slant degrees. This work presents three strategies to address handwritten digit recognition by means of three pattern recognition methods and two feature extraction algorithms. The first strategy makes use of Fourier Descriptor and Boundary Transition Technique to extract representative values from digits contours in order to recognize digits is used a neural network Multilayer Perceptron and a set of Support Vector Machines classifiers to validate neural network output. The second strategy represents this work's baseline using the classic convolutional neural networks algorithm from literature, LeNet5. Such algorithm received as input the raw digit images without preprocessing. The third strategy used a unbalanced decision tree in which support vector machines actuated as decision points and as representative feature received the raw digit images. Late experiments showed that first strategy was not effective enough to recognize digits; only about 80% of characters were successfully recognized. By means of Convolutional Neural Network was possible to achieve 0.9% of error rate, not so impressive if compared to literature best results. The third strategy was capable to recognize 100% of test samples from handwritten digits dataset of MNist. Each support vector machine classifier achieved 0% of error rate, due to an enormous amount of support vectors.CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível SuperiorUniversidade Federal do AmazonasFaculdade de TecnologiaBrasilUFAMPrograma de Pós-graduação em Engenharia ElétricaCosta Filho, Cícero Ferreira Fernandeshttp://lattes.cnpq.br/3029011770761387Gil, Adriano Mendeshttp://lattes.cnpq.br/51249237727634512015-07-20T14:04:10Z2014-05-13info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfGIL, Adriano Mendes. Reconhecimento de dígitos manuscritos: busca de um classificador com máxima taxa de acerto. 2014. 93 f. Dissertação (Mestrado em Engenharia Elétrica) - Universidade Federal do Amazonas, Manaus, 2014.http://tede.ufam.edu.br/handle/handle/4428porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFAMinstname:Universidade Federal do Amazonas (UFAM)instacron:UFAM2017-04-26T19:49:49Zoai:https://tede.ufam.edu.br/handle/:tede/4428Biblioteca Digital de Teses e Dissertaçõeshttp://200.129.163.131:8080/PUBhttp://200.129.163.131:8080/oai/requestddbc@ufam.edu.br\|\|ddbc@ufam.edu.bropendoar:65922017-04-26T19:49:49Biblioteca Digital de Teses e Dissertações da UFAM - Universidade Federal do Amazonas (UFAM)false
dc.title.none.fl_str_mv	Reconhecimento de dígitos manuscritos: busca de um classificador com máxima taxa de acerto
title	Reconhecimento de dígitos manuscritos: busca de um classificador com máxima taxa de acerto
spellingShingle	Reconhecimento de dígitos manuscritos: busca de um classificador com máxima taxa de acerto Gil, Adriano Mendes Redes neurais Reconhecimento de padrões Dígitos manuscritos Máquina de vetores de suporte Neural network Pattern recognition Handwritten digits Support vector machines ENGENHARIAS: ENGENHARIA ELÉTRICA
title_short	Reconhecimento de dígitos manuscritos: busca de um classificador com máxima taxa de acerto
title_full	Reconhecimento de dígitos manuscritos: busca de um classificador com máxima taxa de acerto
title_fullStr	Reconhecimento de dígitos manuscritos: busca de um classificador com máxima taxa de acerto
title_full_unstemmed	Reconhecimento de dígitos manuscritos: busca de um classificador com máxima taxa de acerto
title_sort	Reconhecimento de dígitos manuscritos: busca de um classificador com máxima taxa de acerto
author	Gil, Adriano Mendes
author_facet	Gil, Adriano Mendes http://lattes.cnpq.br/5124923772763451
author_role	author
author2	http://lattes.cnpq.br/5124923772763451
author2_role	author
dc.contributor.none.fl_str_mv	Costa Filho, Cícero Ferreira Fernandes http://lattes.cnpq.br/3029011770761387
dc.contributor.author.fl_str_mv	Gil, Adriano Mendes http://lattes.cnpq.br/5124923772763451
dc.subject.por.fl_str_mv	Redes neurais Reconhecimento de padrões Dígitos manuscritos Máquina de vetores de suporte Neural network Pattern recognition Handwritten digits Support vector machines ENGENHARIAS: ENGENHARIA ELÉTRICA
topic	Redes neurais Reconhecimento de padrões Dígitos manuscritos Máquina de vetores de suporte Neural network Pattern recognition Handwritten digits Support vector machines ENGENHARIAS: ENGENHARIA ELÉTRICA
description	Sistemas de reconhecimento ótico de caracteres, também conhecidos como OCR, permitem identificar e reconhecer caracteres impressos por meio de imagens, uma funcionalidade já bem difundida em scanners, dispositivos móveis, entre outros. Existe uma crescente necessidade de reconhecimento de caracteres manuscritos para uso em várias situações, tais como reconhecimento de valores nominais em cheques de bancos, reconhecimento dos dígitos manuscritos de endereço postal para redirecionamento automatizado de cartas nos correios. Reconhecimento de dígitos manuscritos esbarra na dificuldade de lidar com uma grande variação intraclasse, devido a diferentes estilos de escrita, diferentes graus de inclinação dos caracteres. Este trabalho apresenta três estratégias utilizando três diferentes métodos de reconhecimento de padrões e dois métodos de extração de características. A primeira estratégia utilizou Descritores de Fourier e a técnica de transição de borda para extrair valores representativos do contorno dos caracteres e como camada de classificação utilizou uma rede neural MLP em associação com um conjunto de classificadores SVM para validar e corrigir eventuais erros da rede MLP. A segunda estratégia figurou como base comparativa para as demais estratégias por utilizar um algoritmo clássico de redes neurais convolutivas, LeNet5, e como características utilizou as próprias imagens dos dígitos. A terceira estratégia fez uso de um conjunto de classificadores SVM em uma árvore de decisão desbalanceada para a classificação dos dígitos a partir unicamente de suas imagens. Como resultados dos experimentos, a primeira estratégia provou não ser totalmente efetiva por obter resultados em torno de 80% de taxa de acerto. A segunda estratégia obteve 0,9% de taxa de erro que apesar de ter sido alta, ainda é muito menor se comparada com os melhores resultados obtidos na literatura. A terceira estratégia por sua vez logrou sucesso em reconhecer 100% das amostras de teste da base MNist de dígitos manuscritos, devido ao sucesso do treinamento de cada um dos classificadores SVM, que apesar de utilizarem uma enorme quantidade de vetores de suporte, atingiram individualmente 0% de taxa de erro.
publishDate	2014
dc.date.none.fl_str_mv	2014-05-13 2015-07-20T14:04:10Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	GIL, Adriano Mendes. Reconhecimento de dígitos manuscritos: busca de um classificador com máxima taxa de acerto. 2014. 93 f. Dissertação (Mestrado em Engenharia Elétrica) - Universidade Federal do Amazonas, Manaus, 2014. http://tede.ufam.edu.br/handle/handle/4428
identifier_str_mv	GIL, Adriano Mendes. Reconhecimento de dígitos manuscritos: busca de um classificador com máxima taxa de acerto. 2014. 93 f. Dissertação (Mestrado em Engenharia Elétrica) - Universidade Federal do Amazonas, Manaus, 2014.
url	http://tede.ufam.edu.br/handle/handle/4428
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.publisher.none.fl_str_mv	Universidade Federal do Amazonas Faculdade de Tecnologia Brasil UFAM Programa de Pós-graduação em Engenharia Elétrica
publisher.none.fl_str_mv	Universidade Federal do Amazonas Faculdade de Tecnologia Brasil UFAM Programa de Pós-graduação em Engenharia Elétrica
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da UFAM instname:Universidade Federal do Amazonas (UFAM) instacron:UFAM
instname_str	Universidade Federal do Amazonas (UFAM)
instacron_str	UFAM
institution	UFAM
reponame_str	Biblioteca Digital de Teses e Dissertações da UFAM
collection	Biblioteca Digital de Teses e Dissertações da UFAM
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da UFAM - Universidade Federal do Amazonas (UFAM)
repository.mail.fl_str_mv	ddbc@ufam.edu.br\|\|ddbc@ufam.edu.br
_version_	1851781273079513088

Reconhecimento de dígitos manuscritos: busca de um classificador com máxima taxa de acerto

Registros relacionados