Binarização de Imagens de Documentos Históricos Baseada em Imagem de Contraste

Detalhes bibliográficos
Ano de defesa: 2014
Autor(a) principal: ARRUDA, Alisson Werner Arruda de
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/10481
Resumo: Binarização de imagens de documentos históricos não é uma tarefa trivial, devido aos mais variados problemas pertinentes a este tipo de imagem, tais como a presença de manchas, variação de contraste, iluminação não-uniforme, entre outros. Atualmente, ainda não há uma solução consolidada que resolva esses tipos de problemas com precisão. Métodos atuais geralmente acarretam na perda de elementos de texto e/ou recuperação de elementos do fundo (papel). Tais consequências não são aceitáveis, tendo em vista que documentos históricos podem conter informações de valor inestimável. Um novo algoritmo para binarização de imagens de documentos históricos é apresentado nesta dissertação, a fim de contribuir para a evolução da área em questão. A partir de uma imagem de entrada em tons de cinza, o método propõe o seu mapeamento em duas novas imagens de contraste, que são combinadas para criar uma imagem binarizada "fraca", caracterizada pela exclusão do fundo e de parte do texto. Ao mesmo tempo, é utilizado o algoritmo de limiarização de Valizadeh e Kabir para criar uma imagem binarizada "forte", caracterizada pela preservação máxima do texto, como também parte do fundo. O resultado final da binarização é produzido pela reconstrução da imagem binarizada fraca através da imagem binarizada forte. Uma etapa de pós-processamento é aplicada à imagem binarizada fraca para remover possíveis ruídos. O método proposto foi testado em duas bases bem conhecidas de imagens de documentos, sendo a primeira do DIBCO 2011 (Document Image Binarization Contest), e a segunda do H-DIBCO 2012 (Handwritten Document Image Binarization Contest), ambas contendo diversos tipos de degradação. Os resultados alcançados mostraram-se bastante satisfatórios do ponto de vista qualitativo (visual) e quantitativo (alcançando altos valores em diversas medidas de avaliação).
id UFPE_83e5803bd6333faed598dd7bf8b641a5
oai_identifier_str oai:repositorio.ufpe.br:123456789/10481
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str
spelling Binarização de Imagens de Documentos Históricos Baseada em Imagem de ContrasteAnálise de Imagens de Documentos HistóricosBinarizaçãoImagem de ContrasteSegmentação de ImagensBinarização de imagens de documentos históricos não é uma tarefa trivial, devido aos mais variados problemas pertinentes a este tipo de imagem, tais como a presença de manchas, variação de contraste, iluminação não-uniforme, entre outros. Atualmente, ainda não há uma solução consolidada que resolva esses tipos de problemas com precisão. Métodos atuais geralmente acarretam na perda de elementos de texto e/ou recuperação de elementos do fundo (papel). Tais consequências não são aceitáveis, tendo em vista que documentos históricos podem conter informações de valor inestimável. Um novo algoritmo para binarização de imagens de documentos históricos é apresentado nesta dissertação, a fim de contribuir para a evolução da área em questão. A partir de uma imagem de entrada em tons de cinza, o método propõe o seu mapeamento em duas novas imagens de contraste, que são combinadas para criar uma imagem binarizada "fraca", caracterizada pela exclusão do fundo e de parte do texto. Ao mesmo tempo, é utilizado o algoritmo de limiarização de Valizadeh e Kabir para criar uma imagem binarizada "forte", caracterizada pela preservação máxima do texto, como também parte do fundo. O resultado final da binarização é produzido pela reconstrução da imagem binarizada fraca através da imagem binarizada forte. Uma etapa de pós-processamento é aplicada à imagem binarizada fraca para remover possíveis ruídos. O método proposto foi testado em duas bases bem conhecidas de imagens de documentos, sendo a primeira do DIBCO 2011 (Document Image Binarization Contest), e a segunda do H-DIBCO 2012 (Handwritten Document Image Binarization Contest), ambas contendo diversos tipos de degradação. Os resultados alcançados mostraram-se bastante satisfatórios do ponto de vista qualitativo (visual) e quantitativo (alcançando altos valores em diversas medidas de avaliação).CAPESUniversidade Federal de PernambucoMELLO, Carlos Alexandre Barros deARRUDA, Alisson Werner Arruda de2015-03-04T18:27:08Z2015-03-04T18:27:08Z2014-02-27info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfARRUDA, Alisson Werner Arruda de. Binarização de imagens de documentos históricos baseada em imagem de contraste. Recife, 2014. 70 f. Dissertação (mestrado) - UFPE, Centro de Informática, Programa de Pós-graduação em Ciência da Computação, 2014.https://repositorio.ufpe.br/handle/123456789/10481porAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPE2019-10-25T07:25:20Zoai:repositorio.ufpe.br:123456789/10481Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212019-10-25T07:25:20Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.none.fl_str_mv Binarização de Imagens de Documentos Históricos Baseada em Imagem de Contraste
title Binarização de Imagens de Documentos Históricos Baseada em Imagem de Contraste
spellingShingle Binarização de Imagens de Documentos Históricos Baseada em Imagem de Contraste
ARRUDA, Alisson Werner Arruda de
Análise de Imagens de Documentos Históricos
Binarização
Imagem de Contraste
Segmentação de Imagens
title_short Binarização de Imagens de Documentos Históricos Baseada em Imagem de Contraste
title_full Binarização de Imagens de Documentos Históricos Baseada em Imagem de Contraste
title_fullStr Binarização de Imagens de Documentos Históricos Baseada em Imagem de Contraste
title_full_unstemmed Binarização de Imagens de Documentos Históricos Baseada em Imagem de Contraste
title_sort Binarização de Imagens de Documentos Históricos Baseada em Imagem de Contraste
author ARRUDA, Alisson Werner Arruda de
author_facet ARRUDA, Alisson Werner Arruda de
author_role author
dc.contributor.none.fl_str_mv MELLO, Carlos Alexandre Barros de
dc.contributor.author.fl_str_mv ARRUDA, Alisson Werner Arruda de
dc.subject.por.fl_str_mv Análise de Imagens de Documentos Históricos
Binarização
Imagem de Contraste
Segmentação de Imagens
topic Análise de Imagens de Documentos Históricos
Binarização
Imagem de Contraste
Segmentação de Imagens
description Binarização de imagens de documentos históricos não é uma tarefa trivial, devido aos mais variados problemas pertinentes a este tipo de imagem, tais como a presença de manchas, variação de contraste, iluminação não-uniforme, entre outros. Atualmente, ainda não há uma solução consolidada que resolva esses tipos de problemas com precisão. Métodos atuais geralmente acarretam na perda de elementos de texto e/ou recuperação de elementos do fundo (papel). Tais consequências não são aceitáveis, tendo em vista que documentos históricos podem conter informações de valor inestimável. Um novo algoritmo para binarização de imagens de documentos históricos é apresentado nesta dissertação, a fim de contribuir para a evolução da área em questão. A partir de uma imagem de entrada em tons de cinza, o método propõe o seu mapeamento em duas novas imagens de contraste, que são combinadas para criar uma imagem binarizada "fraca", caracterizada pela exclusão do fundo e de parte do texto. Ao mesmo tempo, é utilizado o algoritmo de limiarização de Valizadeh e Kabir para criar uma imagem binarizada "forte", caracterizada pela preservação máxima do texto, como também parte do fundo. O resultado final da binarização é produzido pela reconstrução da imagem binarizada fraca através da imagem binarizada forte. Uma etapa de pós-processamento é aplicada à imagem binarizada fraca para remover possíveis ruídos. O método proposto foi testado em duas bases bem conhecidas de imagens de documentos, sendo a primeira do DIBCO 2011 (Document Image Binarization Contest), e a segunda do H-DIBCO 2012 (Handwritten Document Image Binarization Contest), ambas contendo diversos tipos de degradação. Os resultados alcançados mostraram-se bastante satisfatórios do ponto de vista qualitativo (visual) e quantitativo (alcançando altos valores em diversas medidas de avaliação).
publishDate 2014
dc.date.none.fl_str_mv 2014-02-27
2015-03-04T18:27:08Z
2015-03-04T18:27:08Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv ARRUDA, Alisson Werner Arruda de. Binarização de imagens de documentos históricos baseada em imagem de contraste. Recife, 2014. 70 f. Dissertação (mestrado) - UFPE, Centro de Informática, Programa de Pós-graduação em Ciência da Computação, 2014.
https://repositorio.ufpe.br/handle/123456789/10481
identifier_str_mv ARRUDA, Alisson Werner Arruda de. Binarização de imagens de documentos históricos baseada em imagem de contraste. Recife, 2014. 70 f. Dissertação (mestrado) - UFPE, Centro de Informática, Programa de Pós-graduação em Ciência da Computação, 2014.
url https://repositorio.ufpe.br/handle/123456789/10481
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1856042096815767552