Reconhecimento de entidades nomeadas em documentos de editais de compras utilizando aprendizado profundo

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: Silva, Messias Gomes da
Orientador(a): Oliveira, Hilário Tomaz Alves de
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Serra
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.ifes.edu.br/handle/123456789/2944
Resumo: Desde o surgimento do termo Entidade Nomeada (EN) em 1996, a tarefa Reconhecimento de Entidades Nomeadas (REN) ganhou grande interesse da comunidade de Processamento de Linguagem Natural (PLN). A tarefa de REN consiste em identificar e classificar automaticamente entidades de interesse, como nome de pessoas, lugares, organizações, entre outros, a partir de documentos textuais. Ao aplicar sistemas de REN em um domínio específico, a complexidade da tarefa é aumentada e, geralmente, há a necessidade da construção ou utilização de um corpus específico para esse domínio. Neste trabalho, investigou-se a aplicação de modelos de redes neurais profundas para tarefa de REN visando identificar entidades de interesse em editais de licitações de compras escritos em português do Brasil. Inicialmente, foram avaliadas arquiteturas baseadas em redes neurais profundas, especialmente usando uma Bidirectional Long Short-Term Memory (BiLSTM) com o algoritmo Conditional Random Field (CRF), chamada de BiLSTM-CRF, em conjunto com representações baseadas em word embeddings tradicionais (Glove e Word2vec) e contextuais (BERT, Elmo e Flair). Os modelos de embeddings foram avaliados isoladamente e de forma combinada. As arquiteturas foram avaliadas em diversos experimentos utilizando os corpora do Harem (Total e Seletivo), Paramopama e LeNER. Com base nos resultados experimentais obtidos, pode-se concluir que a BiLSTM-CRF BERT Large -W2V, que foi a arquitetura construída com base na combinação dos embeddings extraídos do BERT Large e Word2vec, obteve os melhores resultados nos experimentos realizados e apresentou desempenho competitivo com outros sistemas do estado da arte no corpus Harem (Total e Seletivo). Posteriormente, um processo de anotação foi conduzido para identificação e classificação das entidades de interesse no domínio de editais de compra. Com isso, foi realizada a construção de um corpora contendo documentos de editais dos estados: Espírito Santo (ES), Minas Gerais (MG), Rio de Janeiro (RJ) e São Paulo (SP). Após o processo de anotação e revisão, os corpora foram utilizados em uma série de experimentos realizados para escolher o melhor modelo, o qual também foi baseado em uma BiLSTM-CRF, porém em conjunto somente com os word embeddings Glove, Word2Vec e BERT. Com base nos resultados experimentais obtidos, concluiu-se que o melhor modelo foi alcançado através de uma arquitetura usando BERT Base com o Word2vec Skip-gram que recebeu o nome BiLSTM-CRF BERT Base-W2V.
id IFES-2_e8a44537070f31715d370bce3c9277c0
oai_identifier_str oai:repositorio.ifes.edu.br:123456789/2944
network_acronym_str IFES-2
network_name_str Repositório Institucional do IFES
repository_id_str
spelling Silva, Messias Gomes daCastro, Fidelis Zanetti deGazolli, Kelly Assis de SouzaOliveira, Hilário Tomaz Alves de2023-02-24T17:48:36Z2023-02-24T17:48:36Z2022Silva, Messias Gomes da. Reconhecimento de entidades nomeadas em documentos de editais de compras utilizando aprendizado profundo . 2022 . 78 f. Dissertação (Mestre em Computação Aplicada ) - IFES, Serra, 2022.https://repositorio.ifes.edu.br/handle/123456789/294430004012075P4Desde o surgimento do termo Entidade Nomeada (EN) em 1996, a tarefa Reconhecimento de Entidades Nomeadas (REN) ganhou grande interesse da comunidade de Processamento de Linguagem Natural (PLN). A tarefa de REN consiste em identificar e classificar automaticamente entidades de interesse, como nome de pessoas, lugares, organizações, entre outros, a partir de documentos textuais. Ao aplicar sistemas de REN em um domínio específico, a complexidade da tarefa é aumentada e, geralmente, há a necessidade da construção ou utilização de um corpus específico para esse domínio. Neste trabalho, investigou-se a aplicação de modelos de redes neurais profundas para tarefa de REN visando identificar entidades de interesse em editais de licitações de compras escritos em português do Brasil. Inicialmente, foram avaliadas arquiteturas baseadas em redes neurais profundas, especialmente usando uma Bidirectional Long Short-Term Memory (BiLSTM) com o algoritmo Conditional Random Field (CRF), chamada de BiLSTM-CRF, em conjunto com representações baseadas em word embeddings tradicionais (Glove e Word2vec) e contextuais (BERT, Elmo e Flair). Os modelos de embeddings foram avaliados isoladamente e de forma combinada. As arquiteturas foram avaliadas em diversos experimentos utilizando os corpora do Harem (Total e Seletivo), Paramopama e LeNER. Com base nos resultados experimentais obtidos, pode-se concluir que a BiLSTM-CRF BERT Large -W2V, que foi a arquitetura construída com base na combinação dos embeddings extraídos do BERT Large e Word2vec, obteve os melhores resultados nos experimentos realizados e apresentou desempenho competitivo com outros sistemas do estado da arte no corpus Harem (Total e Seletivo). Posteriormente, um processo de anotação foi conduzido para identificação e classificação das entidades de interesse no domínio de editais de compra. Com isso, foi realizada a construção de um corpora contendo documentos de editais dos estados: Espírito Santo (ES), Minas Gerais (MG), Rio de Janeiro (RJ) e São Paulo (SP). Após o processo de anotação e revisão, os corpora foram utilizados em uma série de experimentos realizados para escolher o melhor modelo, o qual também foi baseado em uma BiLSTM-CRF, porém em conjunto somente com os word embeddings Glove, Word2Vec e BERT. Com base nos resultados experimentais obtidos, concluiu-se que o melhor modelo foi alcançado através de uma arquitetura usando BERT Base com o Word2vec Skip-gram que recebeu o nome BiLSTM-CRF BERT Base-W2V.78 f.Reconhecimento de Entidades NomeadasProcessamento de Linguagem NaturalRedes Neurais ProfundasWord EmbeddingsEditais de comprasLicitações.Reconhecimento de entidades nomeadas em documentos de editais de compras utilizando aprendizado profundoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisSerrainfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional do IFESinstname:Instituto Federal de Educação, Ciência e Tecnologia do Espírito Santo (IFES)instacron:IFESCampus Serrahttp://lattes.cnpq.br/4261938952361658http://orcid.org/0000-0002-0576-0397Ciências exatas e da terraInteligência Artificial (IA)http://lattes.cnpq.br/8980213630090119http://orcid.org/0000-0003-0643-7206Computação Aplicadahttp://lattes.cnpq.br/2373180848461397http://lattes.cnpq.br/0343732414150447https://orcid.org/0000-0001-9502-0220https://orcid.org/0000-0001-5551-3258LICENSElicense.txtlicense.txttext/plain; charset=utf-8934https://repositorio.ifes.edu.br/bitstreams/ccc1a3b0-7d28-4e8b-b37d-215bfe4b354b/downloadac7cb971050ed632be934da23d966924MD52falseAnonymousREADORIGINALDissertação - Messias - RECONHECIMENTO DE ENTIDADES NOMEADAS EM DOCUMENTOS DE EDITAIS DE COMPRAS UTILIZANDO APRENDIZADO PROFUNDO.pdfDissertação - Messias - RECONHECIMENTO DE ENTIDADES NOMEADAS EM DOCUMENTOS DE EDITAIS DE COMPRAS UTILIZANDO APRENDIZADO PROFUNDO.pdfDissertação de Mestradoapplication/pdf5628401https://repositorio.ifes.edu.br/bitstreams/e1036293-0f3a-4c3b-9638-2b4cb2781da6/downloadd7649b2233ffdd1b7ff56144d59cc91cMD51trueAnonymousREADTEXTDissertação - Messias - RECONHECIMENTO DE ENTIDADES NOMEADAS EM DOCUMENTOS DE EDITAIS DE COMPRAS UTILIZANDO APRENDIZADO PROFUNDO.pdf.txtDissertação - Messias - RECONHECIMENTO DE ENTIDADES NOMEADAS EM DOCUMENTOS DE EDITAIS DE COMPRAS UTILIZANDO APRENDIZADO PROFUNDO.pdf.txtExtracted texttext/plain153898https://repositorio.ifes.edu.br/bitstreams/1bc82553-06f7-4e69-a3e2-df7c3883abae/download3c38ae180873c150ed9f33f13a3584d8MD53falseAnonymousREADTHUMBNAILDissertação - Messias - RECONHECIMENTO DE ENTIDADES NOMEADAS EM DOCUMENTOS DE EDITAIS DE COMPRAS UTILIZANDO APRENDIZADO PROFUNDO.pdf.jpgDissertação - Messias - RECONHECIMENTO DE ENTIDADES NOMEADAS EM DOCUMENTOS DE EDITAIS DE COMPRAS UTILIZANDO APRENDIZADO PROFUNDO.pdf.jpgGenerated Thumbnailimage/jpeg2179https://repositorio.ifes.edu.br/bitstreams/5092319c-2b4f-4b84-82a2-f855602fb501/download6f45ac6f38cb0a195a8fb1df6a0c0ebaMD54falseAnonymousREAD123456789/29442025-09-10T18:58:34.139Zopen.accessoai:repositorio.ifes.edu.br:123456789/2944https://repositorio.ifes.edu.brRepositório InstitucionalPUBhttps://repositorio.ifes.edu.br/server/oai/requestrepositorio@ifes.edu.bropendoar:2025-09-10T18:58:34Repositório Institucional do IFES - Instituto Federal de Educação, Ciência e Tecnologia do Espírito Santo (IFES)falseQXV0b3JlcyBxdWUgc3VibWV0ZW0gYSBlc3RhIGNvbmZlcsOqbmNpYSBjb25jb3JkYW0gY29tIG9zIHNlZ3VpbnRlcyB0ZXJtb3M6CmEpIEF1dG9yZXMgbWFudMOpbSBvcyBkaXJlaXRvcyBhdXRvcmFpcyBzb2JyZSBvIHRyYWJhbGhvLCBwZXJtaXRpbmRvIMOgIGNvbmZlcsOqbmNpYSBjb2xvY8OhLWxvIHNvYiB1bWEgbGljZW7Dp2EgTGljZW7Dp2EgQ3JlYXRpdmUgQ29tbW9ucyBBdHRyaWJ1dGlvbiwgcXVlIHBlcm1pdGUgbGl2cmVtZW50ZSBhIG91dHJvcyBhY2Vzc2FyLCB1c2FyIGUgY29tcGFydGlsaGFyIG8gdHJhYmFsaG8gY29tIG8gY3LDqWRpdG8gZGUgYXV0b3JpYSBlIGFwcmVzZW50YcOnw6NvIGluaWNpYWwgbmVzdGEgY29uZmVyw6puY2lhLgpiKSBBdXRvcmVzIHBvZGVtIGFicmlyIG3Do28gZG9zIHRlcm1vcyBkYSBsaWNlbsOnYSBDQyBlIGRlZmluaXIgY29udHJhdG9zIGFkaWNpb25haXMgcGFyYSBhIGRpc3RyaWJ1acOnw6NvIG7Do28tZXhjbHVzaXZhIGUgc3Vic2Vxw7xlbnRlIHB1YmxpY2HDp8OjbyBkZXN0ZSB0cmFiYWxobyAoZXguOiBwdWJsaWNhciB1bWEgdmVyc8OjbyBhdHVhbGl6YWRhIGVtIHVtIHBlcmnDs2RpY28sIGRpc3BvbmliaWxpemFyIGVtIHJlcG9zaXTDs3JpbyBpbnN0aXR1Y2lvbmFsLCBvdSBwdWJsaWPDoS1sbyBlbSBsaXZybyksIGNvbSBvIGNyw6lkaXRvIGRlIGF1dG9yaWEgZSBhcHJlc2VudGHDp8OjbyBpbmljaWFsIG5lc3RhIGNvbmZlcsOqbmNpYS4KYykgQWzDqW0gZGlzc28sIGF1dG9yZXMgc8OjbyBpbmNlbnRpdmFkb3MgYSBwdWJsaWNhciBlIGNvbXBhcnRpbGhhciBzZXVzIHRyYWJhbGhvcyBvbmxpbmUgKGV4LjogZW0gcmVwb3NpdMOzcmlvIGluc3RpdHVjaW9uYWwgb3UgZW0gc3VhIHDDoWdpbmEgcGVzc29hbCkgYSBxdWFscXVlciBtb21lbnRvIGFudGVzIGUgZGVwb2lzIGRhIGNvbmZlcsOqCg==
dc.title.pt_BR.fl_str_mv Reconhecimento de entidades nomeadas em documentos de editais de compras utilizando aprendizado profundo
title Reconhecimento de entidades nomeadas em documentos de editais de compras utilizando aprendizado profundo
spellingShingle Reconhecimento de entidades nomeadas em documentos de editais de compras utilizando aprendizado profundo
Silva, Messias Gomes da
Reconhecimento de Entidades Nomeadas
Processamento de Linguagem Natural
Redes Neurais Profundas
Word Embeddings
Editais de compras
Licitações.
title_short Reconhecimento de entidades nomeadas em documentos de editais de compras utilizando aprendizado profundo
title_full Reconhecimento de entidades nomeadas em documentos de editais de compras utilizando aprendizado profundo
title_fullStr Reconhecimento de entidades nomeadas em documentos de editais de compras utilizando aprendizado profundo
title_full_unstemmed Reconhecimento de entidades nomeadas em documentos de editais de compras utilizando aprendizado profundo
title_sort Reconhecimento de entidades nomeadas em documentos de editais de compras utilizando aprendizado profundo
author Silva, Messias Gomes da
author_facet Silva, Messias Gomes da
author_role author
dc.contributor.member.none.fl_str_mv Castro, Fidelis Zanetti de
Gazolli, Kelly Assis de Souza
dc.contributor.author.fl_str_mv Silva, Messias Gomes da
dc.contributor.advisor1.fl_str_mv Oliveira, Hilário Tomaz Alves de
contributor_str_mv Oliveira, Hilário Tomaz Alves de
dc.subject.por.fl_str_mv Reconhecimento de Entidades Nomeadas
Processamento de Linguagem Natural
Redes Neurais Profundas
Word Embeddings
Editais de compras
Licitações.
topic Reconhecimento de Entidades Nomeadas
Processamento de Linguagem Natural
Redes Neurais Profundas
Word Embeddings
Editais de compras
Licitações.
description Desde o surgimento do termo Entidade Nomeada (EN) em 1996, a tarefa Reconhecimento de Entidades Nomeadas (REN) ganhou grande interesse da comunidade de Processamento de Linguagem Natural (PLN). A tarefa de REN consiste em identificar e classificar automaticamente entidades de interesse, como nome de pessoas, lugares, organizações, entre outros, a partir de documentos textuais. Ao aplicar sistemas de REN em um domínio específico, a complexidade da tarefa é aumentada e, geralmente, há a necessidade da construção ou utilização de um corpus específico para esse domínio. Neste trabalho, investigou-se a aplicação de modelos de redes neurais profundas para tarefa de REN visando identificar entidades de interesse em editais de licitações de compras escritos em português do Brasil. Inicialmente, foram avaliadas arquiteturas baseadas em redes neurais profundas, especialmente usando uma Bidirectional Long Short-Term Memory (BiLSTM) com o algoritmo Conditional Random Field (CRF), chamada de BiLSTM-CRF, em conjunto com representações baseadas em word embeddings tradicionais (Glove e Word2vec) e contextuais (BERT, Elmo e Flair). Os modelos de embeddings foram avaliados isoladamente e de forma combinada. As arquiteturas foram avaliadas em diversos experimentos utilizando os corpora do Harem (Total e Seletivo), Paramopama e LeNER. Com base nos resultados experimentais obtidos, pode-se concluir que a BiLSTM-CRF BERT Large -W2V, que foi a arquitetura construída com base na combinação dos embeddings extraídos do BERT Large e Word2vec, obteve os melhores resultados nos experimentos realizados e apresentou desempenho competitivo com outros sistemas do estado da arte no corpus Harem (Total e Seletivo). Posteriormente, um processo de anotação foi conduzido para identificação e classificação das entidades de interesse no domínio de editais de compra. Com isso, foi realizada a construção de um corpora contendo documentos de editais dos estados: Espírito Santo (ES), Minas Gerais (MG), Rio de Janeiro (RJ) e São Paulo (SP). Após o processo de anotação e revisão, os corpora foram utilizados em uma série de experimentos realizados para escolher o melhor modelo, o qual também foi baseado em uma BiLSTM-CRF, porém em conjunto somente com os word embeddings Glove, Word2Vec e BERT. Com base nos resultados experimentais obtidos, concluiu-se que o melhor modelo foi alcançado através de uma arquitetura usando BERT Base com o Word2vec Skip-gram que recebeu o nome BiLSTM-CRF BERT Base-W2V.
publishDate 2022
dc.date.issued.fl_str_mv 2022
dc.date.accessioned.fl_str_mv 2023-02-24T17:48:36Z
dc.date.available.fl_str_mv 2023-02-24T17:48:36Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv Silva, Messias Gomes da. Reconhecimento de entidades nomeadas em documentos de editais de compras utilizando aprendizado profundo . 2022 . 78 f. Dissertação (Mestre em Computação Aplicada ) - IFES, Serra, 2022.
dc.identifier.uri.fl_str_mv https://repositorio.ifes.edu.br/handle/123456789/2944
dc.identifier.capes.pt_BR.fl_str_mv 30004012075P4
identifier_str_mv Silva, Messias Gomes da. Reconhecimento de entidades nomeadas em documentos de editais de compras utilizando aprendizado profundo . 2022 . 78 f. Dissertação (Mestre em Computação Aplicada ) - IFES, Serra, 2022.
30004012075P4
url https://repositorio.ifes.edu.br/handle/123456789/2944
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 78 f.
dc.publisher.none.fl_str_mv Serra
publisher.none.fl_str_mv Serra
dc.source.none.fl_str_mv reponame:Repositório Institucional do IFES
instname:Instituto Federal de Educação, Ciência e Tecnologia do Espírito Santo (IFES)
instacron:IFES
instname_str Instituto Federal de Educação, Ciência e Tecnologia do Espírito Santo (IFES)
instacron_str IFES
institution IFES
reponame_str Repositório Institucional do IFES
collection Repositório Institucional do IFES
bitstream.url.fl_str_mv https://repositorio.ifes.edu.br/bitstreams/ccc1a3b0-7d28-4e8b-b37d-215bfe4b354b/download
https://repositorio.ifes.edu.br/bitstreams/e1036293-0f3a-4c3b-9638-2b4cb2781da6/download
https://repositorio.ifes.edu.br/bitstreams/1bc82553-06f7-4e69-a3e2-df7c3883abae/download
https://repositorio.ifes.edu.br/bitstreams/5092319c-2b4f-4b84-82a2-f855602fb501/download
bitstream.checksum.fl_str_mv ac7cb971050ed632be934da23d966924
d7649b2233ffdd1b7ff56144d59cc91c
3c38ae180873c150ed9f33f13a3584d8
6f45ac6f38cb0a195a8fb1df6a0c0eba
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional do IFES - Instituto Federal de Educação, Ciência e Tecnologia do Espírito Santo (IFES)
repository.mail.fl_str_mv repositorio@ifes.edu.br
_version_ 1865654659587244032