Estratégias para melhoria do desempenho de ferramentas comerciais de reconhecimento óptico de caracteres

Detalhes bibliográficos
Ano de defesa: 2008
Autor(a) principal: Ferreira Alves, Neide
Orientador(a): Dueire Lins, Rafael
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
OCR
Link de acesso: https://repositorio.ufpe.br/handle/123456789/5603
Resumo: Para avaliar a qualidade do desempenho de ferramentas comerciais de Reconhecimento Óptico de Caracteres (OCR) é necessário adquirir métricas para avaliar o quanto um texto transcrito está próximo do texto original, uma vez que quando uma imagem sofre alterações, por menores que sejam, estas influenciam nas transcrições dos OCR s. Neste trabalho será apresentada uma nova métrica para avaliar transcrições de OCR s: através da aplicação de técnicas de filtragem (brilho, contraste, resolução, rotação, etc.) na imagem original, para que as mudanças mínimas gerem inúmeras imagens, as quais serão submetidas ao OCR e resultarão em textos distintos. Um algoritmo foi desenvolvido para comparar os textos gerados, analisando desde a quantidade de linhas até a igualdade entre os caracteres. Através da análise de maior freqüência entre os caracteres, este algoritmo gera um novo arquivo-texto. Com o uso desta metodologia, o arquivo gerado ficou muito próximo do original com um índice de acerto maior que os arquivos transcritos sem o processo de filtragem
id UFPE_bf5ca355cecc8095c7f617f420b06c82
oai_identifier_str oai:repositorio.ufpe.br:123456789/5603
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str
spelling Ferreira Alves, NeideDueire Lins, Rafael 2014-06-12T17:40:35Z2014-06-12T17:40:35Z2008-01-31Ferreira Alves, Neide; Dueire Lins, Rafael. Estratégias para melhoria do desempenho de ferramentas comerciais de reconhecimento óptico de caracteres. 2008. Dissertação (Mestrado). Programa de Pós-Graduação em Engenharia Elétrica, Universidade Federal de Pernambuco, Recife, 2008.https://repositorio.ufpe.br/handle/123456789/5603Para avaliar a qualidade do desempenho de ferramentas comerciais de Reconhecimento Óptico de Caracteres (OCR) é necessário adquirir métricas para avaliar o quanto um texto transcrito está próximo do texto original, uma vez que quando uma imagem sofre alterações, por menores que sejam, estas influenciam nas transcrições dos OCR s. Neste trabalho será apresentada uma nova métrica para avaliar transcrições de OCR s: através da aplicação de técnicas de filtragem (brilho, contraste, resolução, rotação, etc.) na imagem original, para que as mudanças mínimas gerem inúmeras imagens, as quais serão submetidas ao OCR e resultarão em textos distintos. Um algoritmo foi desenvolvido para comparar os textos gerados, analisando desde a quantidade de linhas até a igualdade entre os caracteres. Através da análise de maior freqüência entre os caracteres, este algoritmo gera um novo arquivo-texto. Com o uso desta metodologia, o arquivo gerado ficou muito próximo do original com um índice de acerto maior que os arquivos transcritos sem o processo de filtragemporUniversidade Federal de PernambucoAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessOCRReconhecimento de PadrõesProcessamento de ImagensEstratégias para melhoria do desempenho de ferramentas comerciais de reconhecimento óptico de caracteresinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPETHUMBNAILarquivo7036_1.pdf.jpgarquivo7036_1.pdf.jpgGenerated Thumbnailimage/jpeg1191https://repositorio.ufpe.br/bitstream/123456789/5603/4/arquivo7036_1.pdf.jpg7f57da7ba27e8502bcffe8df88930eb5MD54ORIGINALarquivo7036_1.pdfapplication/pdf2047609https://repositorio.ufpe.br/bitstream/123456789/5603/1/arquivo7036_1.pdfe3d87bd28e5314c857de9b11d1bc348aMD51LICENSElicense.txttext/plain1748https://repositorio.ufpe.br/bitstream/123456789/5603/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52TEXTarquivo7036_1.pdf.txtarquivo7036_1.pdf.txtExtracted texttext/plain257920https://repositorio.ufpe.br/bitstream/123456789/5603/3/arquivo7036_1.pdf.txta107326e012ebfb422548c5555ce1d7bMD53123456789/56032019-10-25 11:56:51.29oai:repositorio.ufpe.br:123456789/5603Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212019-10-25T14:56:51Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.pt_BR.fl_str_mv Estratégias para melhoria do desempenho de ferramentas comerciais de reconhecimento óptico de caracteres
title Estratégias para melhoria do desempenho de ferramentas comerciais de reconhecimento óptico de caracteres
spellingShingle Estratégias para melhoria do desempenho de ferramentas comerciais de reconhecimento óptico de caracteres
Ferreira Alves, Neide
OCR
Reconhecimento de Padrões
Processamento de Imagens
title_short Estratégias para melhoria do desempenho de ferramentas comerciais de reconhecimento óptico de caracteres
title_full Estratégias para melhoria do desempenho de ferramentas comerciais de reconhecimento óptico de caracteres
title_fullStr Estratégias para melhoria do desempenho de ferramentas comerciais de reconhecimento óptico de caracteres
title_full_unstemmed Estratégias para melhoria do desempenho de ferramentas comerciais de reconhecimento óptico de caracteres
title_sort Estratégias para melhoria do desempenho de ferramentas comerciais de reconhecimento óptico de caracteres
author Ferreira Alves, Neide
author_facet Ferreira Alves, Neide
author_role author
dc.contributor.author.fl_str_mv Ferreira Alves, Neide
dc.contributor.advisor1.fl_str_mv Dueire Lins, Rafael
contributor_str_mv Dueire Lins, Rafael
dc.subject.por.fl_str_mv OCR
Reconhecimento de Padrões
Processamento de Imagens
topic OCR
Reconhecimento de Padrões
Processamento de Imagens
description Para avaliar a qualidade do desempenho de ferramentas comerciais de Reconhecimento Óptico de Caracteres (OCR) é necessário adquirir métricas para avaliar o quanto um texto transcrito está próximo do texto original, uma vez que quando uma imagem sofre alterações, por menores que sejam, estas influenciam nas transcrições dos OCR s. Neste trabalho será apresentada uma nova métrica para avaliar transcrições de OCR s: através da aplicação de técnicas de filtragem (brilho, contraste, resolução, rotação, etc.) na imagem original, para que as mudanças mínimas gerem inúmeras imagens, as quais serão submetidas ao OCR e resultarão em textos distintos. Um algoritmo foi desenvolvido para comparar os textos gerados, analisando desde a quantidade de linhas até a igualdade entre os caracteres. Através da análise de maior freqüência entre os caracteres, este algoritmo gera um novo arquivo-texto. Com o uso desta metodologia, o arquivo gerado ficou muito próximo do original com um índice de acerto maior que os arquivos transcritos sem o processo de filtragem
publishDate 2008
dc.date.issued.fl_str_mv 2008-01-31
dc.date.accessioned.fl_str_mv 2014-06-12T17:40:35Z
dc.date.available.fl_str_mv 2014-06-12T17:40:35Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv Ferreira Alves, Neide; Dueire Lins, Rafael. Estratégias para melhoria do desempenho de ferramentas comerciais de reconhecimento óptico de caracteres. 2008. Dissertação (Mestrado). Programa de Pós-Graduação em Engenharia Elétrica, Universidade Federal de Pernambuco, Recife, 2008.
dc.identifier.uri.fl_str_mv https://repositorio.ufpe.br/handle/123456789/5603
identifier_str_mv Ferreira Alves, Neide; Dueire Lins, Rafael. Estratégias para melhoria do desempenho de ferramentas comerciais de reconhecimento óptico de caracteres. 2008. Dissertação (Mestrado). Programa de Pós-Graduação em Engenharia Elétrica, Universidade Federal de Pernambuco, Recife, 2008.
url https://repositorio.ufpe.br/handle/123456789/5603
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
bitstream.url.fl_str_mv https://repositorio.ufpe.br/bitstream/123456789/5603/4/arquivo7036_1.pdf.jpg
https://repositorio.ufpe.br/bitstream/123456789/5603/1/arquivo7036_1.pdf
https://repositorio.ufpe.br/bitstream/123456789/5603/2/license.txt
https://repositorio.ufpe.br/bitstream/123456789/5603/3/arquivo7036_1.pdf.txt
bitstream.checksum.fl_str_mv 7f57da7ba27e8502bcffe8df88930eb5
e3d87bd28e5314c857de9b11d1bc348a
8a4605be74aa9ea9d79846c1fba20a33
a107326e012ebfb422548c5555ce1d7b
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1802311116271910912