Modelo de arquitetura para uso de banco de dados híbridos adaptável a ferramentas de Processamento de Linguagem Natural (PLN)

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Araújo, Francisca Luzia Nogueira
Orientador(a): Paillard, Gabriel Antoine Louis
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Área do conhecimento CNPq:
Link de acesso: http://repositorio.ufc.br/handle/riufc/77011
Resumo: Currently, databases have become omnipresent. Almost all IT applications are storing and retrieving information from databases. Storing data of different types is a significant challenge, and it may be necessary to use more than one type of database, making it more complex to obtain information about this data. In addition, the dynamics of modern organizations often deal with the need to reconcile opposing requirements provided by databases of different types, such as relational databases (or SQL) and non-relational databases (or NoSQL). Therefore, non-expert users who need to interact with heterogeneous data lack a means by which they can access databases transparently. On the other hand, Natural Language Processing or NLP enables communication between people and machines through techniques that allow the interpretation of natural language used by humans through a computational device. This paper presents an architecture model of a system adaptable to NLP tools capable of translating queries in natural language to formal database query language and, after translation, allowing the execution of queries on databases stored in hybrid, local, or distributed databases. Aimed at enabling adjustments to the proposed architecture, due to the evolution of the current state of the art, it was designed to enable additions of new databases, new algorithms, and/or new natural language translation tools to formal query language of databases, as well as allowing adaptations to recognize new languages in input queries. The strategy used was the creation of modules with well-defined and separated functionalities from others, where to add a new translation tool to the proposal, only one module needs to be modified, for example. To ensure the adaptability of the proposal, the source code was made available and tests were conducted on a cluster of computers, with the possibility of implementation also in a cloud computing services infrastructure; moreover, users can make adjustments to also support big data
id UFC-7_b91064cb7a4c69ce29c41e47f8bf7087
oai_identifier_str oai:repositorio.ufc.br:riufc/77011
network_acronym_str UFC-7
network_name_str Repositório Institucional da Universidade Federal do Ceará (UFC)
repository_id_str
spelling Araújo, Francisca Luzia NogueiraMoreira, Leonardo OliveiraPaillard, Gabriel Antoine Louis2024-06-07T17:33:43Z2024-06-07T17:33:43Z2024ARAÚJO, Francisca Luzia Nogueira. Modelo de arquitetura para uso de banco de dados híbridos adaptável a ferramentas de Processamento de Linguagem Natural (PLN). 2024. 66 f. Dissertação (mestrado) – Universidade Federal do Ceará, Campus de Quixadá, Programa de Pós-Graduação em Computação, Quixadá, 2024.http://repositorio.ufc.br/handle/riufc/77011Currently, databases have become omnipresent. Almost all IT applications are storing and retrieving information from databases. Storing data of different types is a significant challenge, and it may be necessary to use more than one type of database, making it more complex to obtain information about this data. In addition, the dynamics of modern organizations often deal with the need to reconcile opposing requirements provided by databases of different types, such as relational databases (or SQL) and non-relational databases (or NoSQL). Therefore, non-expert users who need to interact with heterogeneous data lack a means by which they can access databases transparently. On the other hand, Natural Language Processing or NLP enables communication between people and machines through techniques that allow the interpretation of natural language used by humans through a computational device. This paper presents an architecture model of a system adaptable to NLP tools capable of translating queries in natural language to formal database query language and, after translation, allowing the execution of queries on databases stored in hybrid, local, or distributed databases. Aimed at enabling adjustments to the proposed architecture, due to the evolution of the current state of the art, it was designed to enable additions of new databases, new algorithms, and/or new natural language translation tools to formal query language of databases, as well as allowing adaptations to recognize new languages in input queries. The strategy used was the creation of modules with well-defined and separated functionalities from others, where to add a new translation tool to the proposal, only one module needs to be modified, for example. To ensure the adaptability of the proposal, the source code was made available and tests were conducted on a cluster of computers, with the possibility of implementation also in a cloud computing services infrastructure; moreover, users can make adjustments to also support big dataAtualmente, os bancos de dados se tornaram onipresentes. Quase todos os aplicativos de Tecnologia da Informação (TI) estão armazenando e recuperando informações de Banco de Dados (BD). O armazenamento de dados de tipos diferentes é um grande desafio, podendo ser necessário utilizar mais de um tipo de banco de dados, tornando mais complexa a obtenção de informações sobre esses dados. Além disso, a dinâmica das organizações modernas frequentemente lida com a necessidade de conciliar requisitos opostos, fornecidos por bancos de dados de diferentes tipos, como, por exemplo, bancos de dados relacionais (ou SQL) e não-relacionais (ou NoSQL). Portanto, usuários não especialistas que necessitem interagir com dados heterogêneos carecem de um meio pelo qual possam acessar os bancos de dados de maneira transparente. Por outro lado, o Processamento de Linguagem Natural ou PLN permite a comunicação entre pessoas e máquinas através de técnicas que possibilitam a interpretação da linguagem natural empregada pelo homem por meio de um dispositivo computacional. Este trabalho apresenta um modelo de arquitetura de sistema adaptável a ferramentas de PLN capazes de traduzir consultas em linguagem natural para linguagem formal de bancos de dados, e após a tradução, permitir executar as consultas em bases de dados armazenados em bancos de dados híbridos, locais ou distribuídos. Visando permitir adequações a arquitetura aqui proposta, em decorrência da evolução do estado da arte atual, foi projetada para possibilitar adições de novos bancos de dados, novos algoritmos e/ou novas ferramentas de tradução de linguagem natural para linguagem formal de consulta de bancos de dados, além de permitir adaptações para reconhecer novos idiomas nas consultas de entrada. A estratégia utilizada foi a criação de módulos com funcionalidades bem definidas e separadas dos demais, onde para adicionar uma nova ferramenta de tradução à proposta, será necessário que apenas um módulo seja modificado, por exemplo. Para assegurar a adaptabilidade da proposta, o código-fonte foi disponibilizado e testes foram conduzidos em um cluster de computadores, com a possibilidade de implementação também em uma infraestrutura de serviços de computação em nuvem, além disso, os usuários podem realizar ajustes, para também suportar dados do tipo big data.Modelo de arquitetura para uso de banco de dados híbridos adaptável a ferramentas de Processamento de Linguagem Natural (PLN)info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisBanco de dadosArquitetura híbridaProcessamento de linguagem naturalCNPQ: CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃOinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da Universidade Federal do Ceará (UFC)instname:Universidade Federal do Ceará (UFC)instacron:UFChttp://lattes.cnpq.br/4427578264303416https://orcid.org/0000-0003-3276-8893http://lattes.cnpq.br/2880668102587861ORIGINAL2024_dis_flnaraujo.pdf2024_dis_flnaraujo.pdfapplication/pdf1065110http://repositorio.ufc.br/bitstream/riufc/77011/1/2024_dis_flnaraujo.pdf94d7c5055e579ee1631e7f1693e8d4c8MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://repositorio.ufc.br/bitstream/riufc/77011/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52riufc/770112024-06-07 14:33:44.348oai:repositorio.ufc.br:riufc/77011Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttp://www.repositorio.ufc.br/ri-oai/requestbu@ufc.br || repositorio@ufc.bropendoar:2024-06-07T17:33:44Repositório Institucional da Universidade Federal do Ceará (UFC) - Universidade Federal do Ceará (UFC)false
dc.title.pt_BR.fl_str_mv Modelo de arquitetura para uso de banco de dados híbridos adaptável a ferramentas de Processamento de Linguagem Natural (PLN)
title Modelo de arquitetura para uso de banco de dados híbridos adaptável a ferramentas de Processamento de Linguagem Natural (PLN)
spellingShingle Modelo de arquitetura para uso de banco de dados híbridos adaptável a ferramentas de Processamento de Linguagem Natural (PLN)
Araújo, Francisca Luzia Nogueira
CNPQ: CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
Banco de dados
Arquitetura híbrida
Processamento de linguagem natural
title_short Modelo de arquitetura para uso de banco de dados híbridos adaptável a ferramentas de Processamento de Linguagem Natural (PLN)
title_full Modelo de arquitetura para uso de banco de dados híbridos adaptável a ferramentas de Processamento de Linguagem Natural (PLN)
title_fullStr Modelo de arquitetura para uso de banco de dados híbridos adaptável a ferramentas de Processamento de Linguagem Natural (PLN)
title_full_unstemmed Modelo de arquitetura para uso de banco de dados híbridos adaptável a ferramentas de Processamento de Linguagem Natural (PLN)
title_sort Modelo de arquitetura para uso de banco de dados híbridos adaptável a ferramentas de Processamento de Linguagem Natural (PLN)
author Araújo, Francisca Luzia Nogueira
author_facet Araújo, Francisca Luzia Nogueira
author_role author
dc.contributor.co-advisor.none.fl_str_mv Moreira, Leonardo Oliveira
dc.contributor.author.fl_str_mv Araújo, Francisca Luzia Nogueira
dc.contributor.advisor1.fl_str_mv Paillard, Gabriel Antoine Louis
contributor_str_mv Paillard, Gabriel Antoine Louis
dc.subject.cnpq.fl_str_mv CNPQ: CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
topic CNPQ: CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO
Banco de dados
Arquitetura híbrida
Processamento de linguagem natural
dc.subject.ptbr.pt_BR.fl_str_mv Banco de dados
Arquitetura híbrida
Processamento de linguagem natural
description Currently, databases have become omnipresent. Almost all IT applications are storing and retrieving information from databases. Storing data of different types is a significant challenge, and it may be necessary to use more than one type of database, making it more complex to obtain information about this data. In addition, the dynamics of modern organizations often deal with the need to reconcile opposing requirements provided by databases of different types, such as relational databases (or SQL) and non-relational databases (or NoSQL). Therefore, non-expert users who need to interact with heterogeneous data lack a means by which they can access databases transparently. On the other hand, Natural Language Processing or NLP enables communication between people and machines through techniques that allow the interpretation of natural language used by humans through a computational device. This paper presents an architecture model of a system adaptable to NLP tools capable of translating queries in natural language to formal database query language and, after translation, allowing the execution of queries on databases stored in hybrid, local, or distributed databases. Aimed at enabling adjustments to the proposed architecture, due to the evolution of the current state of the art, it was designed to enable additions of new databases, new algorithms, and/or new natural language translation tools to formal query language of databases, as well as allowing adaptations to recognize new languages in input queries. The strategy used was the creation of modules with well-defined and separated functionalities from others, where to add a new translation tool to the proposal, only one module needs to be modified, for example. To ensure the adaptability of the proposal, the source code was made available and tests were conducted on a cluster of computers, with the possibility of implementation also in a cloud computing services infrastructure; moreover, users can make adjustments to also support big data
publishDate 2024
dc.date.accessioned.fl_str_mv 2024-06-07T17:33:43Z
dc.date.available.fl_str_mv 2024-06-07T17:33:43Z
dc.date.issued.fl_str_mv 2024
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv ARAÚJO, Francisca Luzia Nogueira. Modelo de arquitetura para uso de banco de dados híbridos adaptável a ferramentas de Processamento de Linguagem Natural (PLN). 2024. 66 f. Dissertação (mestrado) – Universidade Federal do Ceará, Campus de Quixadá, Programa de Pós-Graduação em Computação, Quixadá, 2024.
dc.identifier.uri.fl_str_mv http://repositorio.ufc.br/handle/riufc/77011
identifier_str_mv ARAÚJO, Francisca Luzia Nogueira. Modelo de arquitetura para uso de banco de dados híbridos adaptável a ferramentas de Processamento de Linguagem Natural (PLN). 2024. 66 f. Dissertação (mestrado) – Universidade Federal do Ceará, Campus de Quixadá, Programa de Pós-Graduação em Computação, Quixadá, 2024.
url http://repositorio.ufc.br/handle/riufc/77011
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal do Ceará (UFC)
instname:Universidade Federal do Ceará (UFC)
instacron:UFC
instname_str Universidade Federal do Ceará (UFC)
instacron_str UFC
institution UFC
reponame_str Repositório Institucional da Universidade Federal do Ceará (UFC)
collection Repositório Institucional da Universidade Federal do Ceará (UFC)
bitstream.url.fl_str_mv http://repositorio.ufc.br/bitstream/riufc/77011/1/2024_dis_flnaraujo.pdf
http://repositorio.ufc.br/bitstream/riufc/77011/2/license.txt
bitstream.checksum.fl_str_mv 94d7c5055e579ee1631e7f1693e8d4c8
8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da Universidade Federal do Ceará (UFC) - Universidade Federal do Ceará (UFC)
repository.mail.fl_str_mv bu@ufc.br || repositorio@ufc.br
_version_ 1847793349064392704