Identificação de escritores usando CNN's com abordagem de dissimilaridade

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Helal, Lucas Georges
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Estadual de Maringá
Brasil
Programa de Pós-Graduação em Ciência da Computação
UEM
Maringa
Centro de Ciências de Tecnologia
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://repositorio.uem.br:8080/jspui/handle/1/5361
Resumo: The writer identification using handwritten documents has become an important research topic in documents forensics analysis. That is because it can be used as an identifying characteristic of a person. There are several databases composed of handwritten documents available for research, using different languages and alphabets. To obtain the objectives of this work, the following databases were utilized: CVL and BFL both used for single-script, for documents written in the same alphabet and the LAMIS-MSHD database which is built for multi-script, that is, documents written with differents alphabets. Besides that, several techniques were applied in writer identification process. The objective of this work is to evaluate the performance of the artificial intelligence technique known as Convolutional Neural Network (CNN) in writer identification utilizing handwritten documents. For this, a CNN will be used for the classification of the writers, also for feature extraction that will be evaluated in the SVM classifier and dissimilarity procedures are to be applied. Initially, experiments were developed using the traditional pattern recognition approach, based on feature engineering (or handcrafted features). In these experiments, the texture generation is done from the original documents and later, the features were extracted with the texture descriptors LBP and LPQ. Furthermore, the impact of the classification in the SVM was evaluated with and without the use of the dissimilarity approach, obtaining through combination rules of classifiers, a consensual decision in relation to the final decision. After a series of experiments, the approach with feature dissimilarity obtained through CNN, presented superior results in relation to the literature
id UEM-10_9aaf0a25db0d64a857945f046136bec6
oai_identifier_str oai:localhost:1/5361
network_acronym_str UEM-10
network_name_str Repositório Institucional da Universidade Estadual de Maringá (RI-UEM)
repository_id_str
spelling Identificação de escritores usando CNN's com abordagem de dissimilaridadeConvolutional Neural Network (CNN)Inteligência artificialRede neuralCNPQ::CIENCIAS EXATAS E DA TERRACNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOThe writer identification using handwritten documents has become an important research topic in documents forensics analysis. That is because it can be used as an identifying characteristic of a person. There are several databases composed of handwritten documents available for research, using different languages and alphabets. To obtain the objectives of this work, the following databases were utilized: CVL and BFL both used for single-script, for documents written in the same alphabet and the LAMIS-MSHD database which is built for multi-script, that is, documents written with differents alphabets. Besides that, several techniques were applied in writer identification process. The objective of this work is to evaluate the performance of the artificial intelligence technique known as Convolutional Neural Network (CNN) in writer identification utilizing handwritten documents. For this, a CNN will be used for the classification of the writers, also for feature extraction that will be evaluated in the SVM classifier and dissimilarity procedures are to be applied. Initially, experiments were developed using the traditional pattern recognition approach, based on feature engineering (or handcrafted features). In these experiments, the texture generation is done from the original documents and later, the features were extracted with the texture descriptors LBP and LPQ. Furthermore, the impact of the classification in the SVM was evaluated with and without the use of the dissimilarity approach, obtaining through combination rules of classifiers, a consensual decision in relation to the final decision. After a series of experiments, the approach with feature dissimilarity obtained through CNN, presented superior results in relation to the literatureA identificação de escritores utilizando manuscritos tornou-se um tema importante de pesquisa para análise de documentos forenses, assim, a escrita pode ser considerada uma característica usada para distinguir uma pessoa. Existem diferentes bases de dados de escritores utilizando manuscritos e contendo diferentes alfabetos. Para atingir os objetivos deste trabalho, foram utilizadas as bases de dados: CVL e a BFL ambas sendo single-script, com documentos escritos no mesmo alfabeto, e a base LAMIS-MSHD que é multi-script, ou seja, escritas em diferentes alfabetos. Além disso, várias técnicas foram aplicadas no processo de identificação de escritores. Portanto, o objetivo deste trabalho é avaliar o desempenho da técnica de inteligência artificial conhecida como Convolutional Neural Network (CNN) na identificação de escritores utilizando manuscritos. Assim, será utilizada uma CNN tanto para a classificação dos escritores, quanto para extração de características que serão submetidas ao classificador SVM e também aplicado a dissimilaridade para novos experimentos. Inicialmente, foram desenvolvidos experimentos utilizando-se a abordagem tradicional de reconhecimento de padrões, baseada na engenharia de características (ou handcraftedfeatures). Nestes experimentos, foi utilizado a geração de textura a partir dos documentos originais e posteriormente, foram extraídas as características com os descritores de textura LBP e LPQ. Assim, avaliado o impacto da classificação no SVM com e sem o uso da abordagem de dissimilaridade, obtendo com regras de combinação de classificadores uma decisão consensual em relação à decisão final. Depois de uma série de experimentos, a abordagem com dissimilaridade nas características obtidas por meio da CNN, apresentou resultados superiores em relação à literaturaUniversidade Estadual de MaringáBrasilPrograma de Pós-Graduação em Ciência da ComputaçãoUEMMaringaCentro de Ciências de TecnologiaGonçalves, Diego BertolinHelal, Lucas Georges2019-06-15T13:18:30Z2019-06-15T13:18:30Z2019-02-22info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisHELAL, Lucas Georges. Identificação de escritores usando CNN's com abordagem de dissimilaridade. 2019. 73 f. Dissertação (mestrado em Ciência da Computação)--Universidade Estadual de Maringá, Centro de Tecnologia, Departamento de Informática, 2019, Maringá, PR.http://repositorio.uem.br:8080/jspui/handle/1/5361porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da Universidade Estadual de Maringá (RI-UEM)instname:Universidade Estadual de Maringá (UEM)instacron:UEM2019-06-15T13:18:30Zoai:localhost:1/5361Repositório InstitucionalPUBhttp://repositorio.uem.br:8080/oai/requestopendoar:2024-04-23T14:58:33.005620Repositório Institucional da Universidade Estadual de Maringá (RI-UEM) - Universidade Estadual de Maringá (UEM)false
dc.title.none.fl_str_mv Identificação de escritores usando CNN's com abordagem de dissimilaridade
title Identificação de escritores usando CNN's com abordagem de dissimilaridade
spellingShingle Identificação de escritores usando CNN's com abordagem de dissimilaridade
Helal, Lucas Georges
Convolutional Neural Network (CNN)
Inteligência artificial
Rede neural
CNPQ::CIENCIAS EXATAS E DA TERRA
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Identificação de escritores usando CNN's com abordagem de dissimilaridade
title_full Identificação de escritores usando CNN's com abordagem de dissimilaridade
title_fullStr Identificação de escritores usando CNN's com abordagem de dissimilaridade
title_full_unstemmed Identificação de escritores usando CNN's com abordagem de dissimilaridade
title_sort Identificação de escritores usando CNN's com abordagem de dissimilaridade
author Helal, Lucas Georges
author_facet Helal, Lucas Georges
author_role author
dc.contributor.none.fl_str_mv Gonçalves, Diego Bertolin
dc.contributor.author.fl_str_mv Helal, Lucas Georges
dc.subject.por.fl_str_mv Convolutional Neural Network (CNN)
Inteligência artificial
Rede neural
CNPQ::CIENCIAS EXATAS E DA TERRA
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic Convolutional Neural Network (CNN)
Inteligência artificial
Rede neural
CNPQ::CIENCIAS EXATAS E DA TERRA
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description The writer identification using handwritten documents has become an important research topic in documents forensics analysis. That is because it can be used as an identifying characteristic of a person. There are several databases composed of handwritten documents available for research, using different languages and alphabets. To obtain the objectives of this work, the following databases were utilized: CVL and BFL both used for single-script, for documents written in the same alphabet and the LAMIS-MSHD database which is built for multi-script, that is, documents written with differents alphabets. Besides that, several techniques were applied in writer identification process. The objective of this work is to evaluate the performance of the artificial intelligence technique known as Convolutional Neural Network (CNN) in writer identification utilizing handwritten documents. For this, a CNN will be used for the classification of the writers, also for feature extraction that will be evaluated in the SVM classifier and dissimilarity procedures are to be applied. Initially, experiments were developed using the traditional pattern recognition approach, based on feature engineering (or handcrafted features). In these experiments, the texture generation is done from the original documents and later, the features were extracted with the texture descriptors LBP and LPQ. Furthermore, the impact of the classification in the SVM was evaluated with and without the use of the dissimilarity approach, obtaining through combination rules of classifiers, a consensual decision in relation to the final decision. After a series of experiments, the approach with feature dissimilarity obtained through CNN, presented superior results in relation to the literature
publishDate 2019
dc.date.none.fl_str_mv 2019-06-15T13:18:30Z
2019-06-15T13:18:30Z
2019-02-22
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv HELAL, Lucas Georges. Identificação de escritores usando CNN's com abordagem de dissimilaridade. 2019. 73 f. Dissertação (mestrado em Ciência da Computação)--Universidade Estadual de Maringá, Centro de Tecnologia, Departamento de Informática, 2019, Maringá, PR.
http://repositorio.uem.br:8080/jspui/handle/1/5361
identifier_str_mv HELAL, Lucas Georges. Identificação de escritores usando CNN's com abordagem de dissimilaridade. 2019. 73 f. Dissertação (mestrado em Ciência da Computação)--Universidade Estadual de Maringá, Centro de Tecnologia, Departamento de Informática, 2019, Maringá, PR.
url http://repositorio.uem.br:8080/jspui/handle/1/5361
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Estadual de Maringá
Brasil
Programa de Pós-Graduação em Ciência da Computação
UEM
Maringa
Centro de Ciências de Tecnologia
publisher.none.fl_str_mv Universidade Estadual de Maringá
Brasil
Programa de Pós-Graduação em Ciência da Computação
UEM
Maringa
Centro de Ciências de Tecnologia
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Estadual de Maringá (RI-UEM)
instname:Universidade Estadual de Maringá (UEM)
instacron:UEM
instname_str Universidade Estadual de Maringá (UEM)
instacron_str UEM
institution UEM
reponame_str Repositório Institucional da Universidade Estadual de Maringá (RI-UEM)
collection Repositório Institucional da Universidade Estadual de Maringá (RI-UEM)
repository.name.fl_str_mv Repositório Institucional da Universidade Estadual de Maringá (RI-UEM) - Universidade Estadual de Maringá (UEM)
repository.mail.fl_str_mv
_version_ 1797150444877774848