Reconhecimento de entidades nomeadas em documentos de editais de compras utilizando aprendizado profundo
| Ano de defesa: | 2022 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Serra
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://repositorio.ifes.edu.br/handle/123456789/2944 |
Resumo: | Desde o surgimento do termo Entidade Nomeada (EN) em 1996, a tarefa Reconhecimento de Entidades Nomeadas (REN) ganhou grande interesse da comunidade de Processamento de Linguagem Natural (PLN). A tarefa de REN consiste em identificar e classificar automaticamente entidades de interesse, como nome de pessoas, lugares, organizações, entre outros, a partir de documentos textuais. Ao aplicar sistemas de REN em um domínio específico, a complexidade da tarefa é aumentada e, geralmente, há a necessidade da construção ou utilização de um corpus específico para esse domínio. Neste trabalho, investigou-se a aplicação de modelos de redes neurais profundas para tarefa de REN visando identificar entidades de interesse em editais de licitações de compras escritos em português do Brasil. Inicialmente, foram avaliadas arquiteturas baseadas em redes neurais profundas, especialmente usando uma Bidirectional Long Short-Term Memory (BiLSTM) com o algoritmo Conditional Random Field (CRF), chamada de BiLSTM-CRF, em conjunto com representações baseadas em word embeddings tradicionais (Glove e Word2vec) e contextuais (BERT, Elmo e Flair). Os modelos de embeddings foram avaliados isoladamente e de forma combinada. As arquiteturas foram avaliadas em diversos experimentos utilizando os corpora do Harem (Total e Seletivo), Paramopama e LeNER. Com base nos resultados experimentais obtidos, pode-se concluir que a BiLSTM-CRF BERT Large -W2V, que foi a arquitetura construída com base na combinação dos embeddings extraídos do BERT Large e Word2vec, obteve os melhores resultados nos experimentos realizados e apresentou desempenho competitivo com outros sistemas do estado da arte no corpus Harem (Total e Seletivo). Posteriormente, um processo de anotação foi conduzido para identificação e classificação das entidades de interesse no domínio de editais de compra. Com isso, foi realizada a construção de um corpora contendo documentos de editais dos estados: Espírito Santo (ES), Minas Gerais (MG), Rio de Janeiro (RJ) e São Paulo (SP). Após o processo de anotação e revisão, os corpora foram utilizados em uma série de experimentos realizados para escolher o melhor modelo, o qual também foi baseado em uma BiLSTM-CRF, porém em conjunto somente com os word embeddings Glove, Word2Vec e BERT. Com base nos resultados experimentais obtidos, concluiu-se que o melhor modelo foi alcançado através de uma arquitetura usando BERT Base com o Word2vec Skip-gram que recebeu o nome BiLSTM-CRF BERT Base-W2V. |
| id |
IFES-2_e8a44537070f31715d370bce3c9277c0 |
|---|---|
| oai_identifier_str |
oai:repositorio.ifes.edu.br:123456789/2944 |
| network_acronym_str |
IFES-2 |
| network_name_str |
Repositório Institucional do IFES |
| repository_id_str |
|
| spelling |
Silva, Messias Gomes daCastro, Fidelis Zanetti deGazolli, Kelly Assis de SouzaOliveira, Hilário Tomaz Alves de2023-02-24T17:48:36Z2023-02-24T17:48:36Z2022Silva, Messias Gomes da. Reconhecimento de entidades nomeadas em documentos de editais de compras utilizando aprendizado profundo . 2022 . 78 f. Dissertação (Mestre em Computação Aplicada ) - IFES, Serra, 2022.https://repositorio.ifes.edu.br/handle/123456789/294430004012075P4Desde o surgimento do termo Entidade Nomeada (EN) em 1996, a tarefa Reconhecimento de Entidades Nomeadas (REN) ganhou grande interesse da comunidade de Processamento de Linguagem Natural (PLN). A tarefa de REN consiste em identificar e classificar automaticamente entidades de interesse, como nome de pessoas, lugares, organizações, entre outros, a partir de documentos textuais. Ao aplicar sistemas de REN em um domínio específico, a complexidade da tarefa é aumentada e, geralmente, há a necessidade da construção ou utilização de um corpus específico para esse domínio. Neste trabalho, investigou-se a aplicação de modelos de redes neurais profundas para tarefa de REN visando identificar entidades de interesse em editais de licitações de compras escritos em português do Brasil. Inicialmente, foram avaliadas arquiteturas baseadas em redes neurais profundas, especialmente usando uma Bidirectional Long Short-Term Memory (BiLSTM) com o algoritmo Conditional Random Field (CRF), chamada de BiLSTM-CRF, em conjunto com representações baseadas em word embeddings tradicionais (Glove e Word2vec) e contextuais (BERT, Elmo e Flair). Os modelos de embeddings foram avaliados isoladamente e de forma combinada. As arquiteturas foram avaliadas em diversos experimentos utilizando os corpora do Harem (Total e Seletivo), Paramopama e LeNER. Com base nos resultados experimentais obtidos, pode-se concluir que a BiLSTM-CRF BERT Large -W2V, que foi a arquitetura construída com base na combinação dos embeddings extraídos do BERT Large e Word2vec, obteve os melhores resultados nos experimentos realizados e apresentou desempenho competitivo com outros sistemas do estado da arte no corpus Harem (Total e Seletivo). Posteriormente, um processo de anotação foi conduzido para identificação e classificação das entidades de interesse no domínio de editais de compra. Com isso, foi realizada a construção de um corpora contendo documentos de editais dos estados: Espírito Santo (ES), Minas Gerais (MG), Rio de Janeiro (RJ) e São Paulo (SP). Após o processo de anotação e revisão, os corpora foram utilizados em uma série de experimentos realizados para escolher o melhor modelo, o qual também foi baseado em uma BiLSTM-CRF, porém em conjunto somente com os word embeddings Glove, Word2Vec e BERT. Com base nos resultados experimentais obtidos, concluiu-se que o melhor modelo foi alcançado através de uma arquitetura usando BERT Base com o Word2vec Skip-gram que recebeu o nome BiLSTM-CRF BERT Base-W2V.78 f.Reconhecimento de Entidades NomeadasProcessamento de Linguagem NaturalRedes Neurais ProfundasWord EmbeddingsEditais de comprasLicitações.Reconhecimento de entidades nomeadas em documentos de editais de compras utilizando aprendizado profundoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisSerrainfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional do IFESinstname:Instituto Federal de Educação, Ciência e Tecnologia do Espírito Santo (IFES)instacron:IFESCampus Serrahttp://lattes.cnpq.br/4261938952361658http://orcid.org/0000-0002-0576-0397Ciências exatas e da terraInteligência Artificial (IA)http://lattes.cnpq.br/8980213630090119http://orcid.org/0000-0003-0643-7206Computação Aplicadahttp://lattes.cnpq.br/2373180848461397http://lattes.cnpq.br/0343732414150447https://orcid.org/0000-0001-9502-0220https://orcid.org/0000-0001-5551-3258LICENSElicense.txtlicense.txttext/plain; charset=utf-8934https://repositorio.ifes.edu.br/bitstreams/ccc1a3b0-7d28-4e8b-b37d-215bfe4b354b/downloadac7cb971050ed632be934da23d966924MD52falseAnonymousREADORIGINALDissertação - Messias - RECONHECIMENTO DE ENTIDADES NOMEADAS EM DOCUMENTOS DE EDITAIS DE COMPRAS UTILIZANDO APRENDIZADO PROFUNDO.pdfDissertação - Messias - RECONHECIMENTO DE ENTIDADES NOMEADAS EM DOCUMENTOS DE EDITAIS DE COMPRAS UTILIZANDO APRENDIZADO PROFUNDO.pdfDissertação de Mestradoapplication/pdf5628401https://repositorio.ifes.edu.br/bitstreams/e1036293-0f3a-4c3b-9638-2b4cb2781da6/downloadd7649b2233ffdd1b7ff56144d59cc91cMD51trueAnonymousREADTEXTDissertação - Messias - RECONHECIMENTO DE ENTIDADES NOMEADAS EM DOCUMENTOS DE EDITAIS DE COMPRAS UTILIZANDO APRENDIZADO PROFUNDO.pdf.txtDissertação - Messias - RECONHECIMENTO DE ENTIDADES NOMEADAS EM DOCUMENTOS DE EDITAIS DE COMPRAS UTILIZANDO APRENDIZADO PROFUNDO.pdf.txtExtracted texttext/plain153898https://repositorio.ifes.edu.br/bitstreams/1bc82553-06f7-4e69-a3e2-df7c3883abae/download3c38ae180873c150ed9f33f13a3584d8MD53falseAnonymousREADTHUMBNAILDissertação - Messias - RECONHECIMENTO DE ENTIDADES NOMEADAS EM DOCUMENTOS DE EDITAIS DE COMPRAS UTILIZANDO APRENDIZADO PROFUNDO.pdf.jpgDissertação - Messias - RECONHECIMENTO DE ENTIDADES NOMEADAS EM DOCUMENTOS DE EDITAIS DE COMPRAS UTILIZANDO APRENDIZADO PROFUNDO.pdf.jpgGenerated Thumbnailimage/jpeg2179https://repositorio.ifes.edu.br/bitstreams/5092319c-2b4f-4b84-82a2-f855602fb501/download6f45ac6f38cb0a195a8fb1df6a0c0ebaMD54falseAnonymousREAD123456789/29442025-09-10T18:58:34.139Zopen.accessoai:repositorio.ifes.edu.br:123456789/2944https://repositorio.ifes.edu.brRepositório InstitucionalPUBhttps://repositorio.ifes.edu.br/server/oai/requestrepositorio@ifes.edu.bropendoar:2025-09-10T18:58:34Repositório Institucional do IFES - Instituto Federal de Educação, Ciência e Tecnologia do Espírito Santo (IFES)falseQXV0b3JlcyBxdWUgc3VibWV0ZW0gYSBlc3RhIGNvbmZlcsOqbmNpYSBjb25jb3JkYW0gY29tIG9zIHNlZ3VpbnRlcyB0ZXJtb3M6CmEpIEF1dG9yZXMgbWFudMOpbSBvcyBkaXJlaXRvcyBhdXRvcmFpcyBzb2JyZSBvIHRyYWJhbGhvLCBwZXJtaXRpbmRvIMOgIGNvbmZlcsOqbmNpYSBjb2xvY8OhLWxvIHNvYiB1bWEgbGljZW7Dp2EgTGljZW7Dp2EgQ3JlYXRpdmUgQ29tbW9ucyBBdHRyaWJ1dGlvbiwgcXVlIHBlcm1pdGUgbGl2cmVtZW50ZSBhIG91dHJvcyBhY2Vzc2FyLCB1c2FyIGUgY29tcGFydGlsaGFyIG8gdHJhYmFsaG8gY29tIG8gY3LDqWRpdG8gZGUgYXV0b3JpYSBlIGFwcmVzZW50YcOnw6NvIGluaWNpYWwgbmVzdGEgY29uZmVyw6puY2lhLgpiKSBBdXRvcmVzIHBvZGVtIGFicmlyIG3Do28gZG9zIHRlcm1vcyBkYSBsaWNlbsOnYSBDQyBlIGRlZmluaXIgY29udHJhdG9zIGFkaWNpb25haXMgcGFyYSBhIGRpc3RyaWJ1acOnw6NvIG7Do28tZXhjbHVzaXZhIGUgc3Vic2Vxw7xlbnRlIHB1YmxpY2HDp8OjbyBkZXN0ZSB0cmFiYWxobyAoZXguOiBwdWJsaWNhciB1bWEgdmVyc8OjbyBhdHVhbGl6YWRhIGVtIHVtIHBlcmnDs2RpY28sIGRpc3BvbmliaWxpemFyIGVtIHJlcG9zaXTDs3JpbyBpbnN0aXR1Y2lvbmFsLCBvdSBwdWJsaWPDoS1sbyBlbSBsaXZybyksIGNvbSBvIGNyw6lkaXRvIGRlIGF1dG9yaWEgZSBhcHJlc2VudGHDp8OjbyBpbmljaWFsIG5lc3RhIGNvbmZlcsOqbmNpYS4KYykgQWzDqW0gZGlzc28sIGF1dG9yZXMgc8OjbyBpbmNlbnRpdmFkb3MgYSBwdWJsaWNhciBlIGNvbXBhcnRpbGhhciBzZXVzIHRyYWJhbGhvcyBvbmxpbmUgKGV4LjogZW0gcmVwb3NpdMOzcmlvIGluc3RpdHVjaW9uYWwgb3UgZW0gc3VhIHDDoWdpbmEgcGVzc29hbCkgYSBxdWFscXVlciBtb21lbnRvIGFudGVzIGUgZGVwb2lzIGRhIGNvbmZlcsOqCg== |
| dc.title.pt_BR.fl_str_mv |
Reconhecimento de entidades nomeadas em documentos de editais de compras utilizando aprendizado profundo |
| title |
Reconhecimento de entidades nomeadas em documentos de editais de compras utilizando aprendizado profundo |
| spellingShingle |
Reconhecimento de entidades nomeadas em documentos de editais de compras utilizando aprendizado profundo Silva, Messias Gomes da Reconhecimento de Entidades Nomeadas Processamento de Linguagem Natural Redes Neurais Profundas Word Embeddings Editais de compras Licitações. |
| title_short |
Reconhecimento de entidades nomeadas em documentos de editais de compras utilizando aprendizado profundo |
| title_full |
Reconhecimento de entidades nomeadas em documentos de editais de compras utilizando aprendizado profundo |
| title_fullStr |
Reconhecimento de entidades nomeadas em documentos de editais de compras utilizando aprendizado profundo |
| title_full_unstemmed |
Reconhecimento de entidades nomeadas em documentos de editais de compras utilizando aprendizado profundo |
| title_sort |
Reconhecimento de entidades nomeadas em documentos de editais de compras utilizando aprendizado profundo |
| author |
Silva, Messias Gomes da |
| author_facet |
Silva, Messias Gomes da |
| author_role |
author |
| dc.contributor.member.none.fl_str_mv |
Castro, Fidelis Zanetti de Gazolli, Kelly Assis de Souza |
| dc.contributor.author.fl_str_mv |
Silva, Messias Gomes da |
| dc.contributor.advisor1.fl_str_mv |
Oliveira, Hilário Tomaz Alves de |
| contributor_str_mv |
Oliveira, Hilário Tomaz Alves de |
| dc.subject.por.fl_str_mv |
Reconhecimento de Entidades Nomeadas Processamento de Linguagem Natural Redes Neurais Profundas Word Embeddings Editais de compras Licitações. |
| topic |
Reconhecimento de Entidades Nomeadas Processamento de Linguagem Natural Redes Neurais Profundas Word Embeddings Editais de compras Licitações. |
| description |
Desde o surgimento do termo Entidade Nomeada (EN) em 1996, a tarefa Reconhecimento de Entidades Nomeadas (REN) ganhou grande interesse da comunidade de Processamento de Linguagem Natural (PLN). A tarefa de REN consiste em identificar e classificar automaticamente entidades de interesse, como nome de pessoas, lugares, organizações, entre outros, a partir de documentos textuais. Ao aplicar sistemas de REN em um domínio específico, a complexidade da tarefa é aumentada e, geralmente, há a necessidade da construção ou utilização de um corpus específico para esse domínio. Neste trabalho, investigou-se a aplicação de modelos de redes neurais profundas para tarefa de REN visando identificar entidades de interesse em editais de licitações de compras escritos em português do Brasil. Inicialmente, foram avaliadas arquiteturas baseadas em redes neurais profundas, especialmente usando uma Bidirectional Long Short-Term Memory (BiLSTM) com o algoritmo Conditional Random Field (CRF), chamada de BiLSTM-CRF, em conjunto com representações baseadas em word embeddings tradicionais (Glove e Word2vec) e contextuais (BERT, Elmo e Flair). Os modelos de embeddings foram avaliados isoladamente e de forma combinada. As arquiteturas foram avaliadas em diversos experimentos utilizando os corpora do Harem (Total e Seletivo), Paramopama e LeNER. Com base nos resultados experimentais obtidos, pode-se concluir que a BiLSTM-CRF BERT Large -W2V, que foi a arquitetura construída com base na combinação dos embeddings extraídos do BERT Large e Word2vec, obteve os melhores resultados nos experimentos realizados e apresentou desempenho competitivo com outros sistemas do estado da arte no corpus Harem (Total e Seletivo). Posteriormente, um processo de anotação foi conduzido para identificação e classificação das entidades de interesse no domínio de editais de compra. Com isso, foi realizada a construção de um corpora contendo documentos de editais dos estados: Espírito Santo (ES), Minas Gerais (MG), Rio de Janeiro (RJ) e São Paulo (SP). Após o processo de anotação e revisão, os corpora foram utilizados em uma série de experimentos realizados para escolher o melhor modelo, o qual também foi baseado em uma BiLSTM-CRF, porém em conjunto somente com os word embeddings Glove, Word2Vec e BERT. Com base nos resultados experimentais obtidos, concluiu-se que o melhor modelo foi alcançado através de uma arquitetura usando BERT Base com o Word2vec Skip-gram que recebeu o nome BiLSTM-CRF BERT Base-W2V. |
| publishDate |
2022 |
| dc.date.issued.fl_str_mv |
2022 |
| dc.date.accessioned.fl_str_mv |
2023-02-24T17:48:36Z |
| dc.date.available.fl_str_mv |
2023-02-24T17:48:36Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
Silva, Messias Gomes da. Reconhecimento de entidades nomeadas em documentos de editais de compras utilizando aprendizado profundo . 2022 . 78 f. Dissertação (Mestre em Computação Aplicada ) - IFES, Serra, 2022. |
| dc.identifier.uri.fl_str_mv |
https://repositorio.ifes.edu.br/handle/123456789/2944 |
| dc.identifier.capes.pt_BR.fl_str_mv |
30004012075P4 |
| identifier_str_mv |
Silva, Messias Gomes da. Reconhecimento de entidades nomeadas em documentos de editais de compras utilizando aprendizado profundo . 2022 . 78 f. Dissertação (Mestre em Computação Aplicada ) - IFES, Serra, 2022. 30004012075P4 |
| url |
https://repositorio.ifes.edu.br/handle/123456789/2944 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
78 f. |
| dc.publisher.none.fl_str_mv |
Serra |
| publisher.none.fl_str_mv |
Serra |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional do IFES instname:Instituto Federal de Educação, Ciência e Tecnologia do Espírito Santo (IFES) instacron:IFES |
| instname_str |
Instituto Federal de Educação, Ciência e Tecnologia do Espírito Santo (IFES) |
| instacron_str |
IFES |
| institution |
IFES |
| reponame_str |
Repositório Institucional do IFES |
| collection |
Repositório Institucional do IFES |
| bitstream.url.fl_str_mv |
https://repositorio.ifes.edu.br/bitstreams/ccc1a3b0-7d28-4e8b-b37d-215bfe4b354b/download https://repositorio.ifes.edu.br/bitstreams/e1036293-0f3a-4c3b-9638-2b4cb2781da6/download https://repositorio.ifes.edu.br/bitstreams/1bc82553-06f7-4e69-a3e2-df7c3883abae/download https://repositorio.ifes.edu.br/bitstreams/5092319c-2b4f-4b84-82a2-f855602fb501/download |
| bitstream.checksum.fl_str_mv |
ac7cb971050ed632be934da23d966924 d7649b2233ffdd1b7ff56144d59cc91c 3c38ae180873c150ed9f33f13a3584d8 6f45ac6f38cb0a195a8fb1df6a0c0eba |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional do IFES - Instituto Federal de Educação, Ciência e Tecnologia do Espírito Santo (IFES) |
| repository.mail.fl_str_mv |
repositorio@ifes.edu.br |
| _version_ |
1865654659587244032 |