SIRA: arquitetura para recuperação de informação sem servidor

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: Rodrigues, Thiago Luiz
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Tecnológica Federal do Paraná
Curitiba
Brasil
Programa de Pós-Graduação em Computação Aplicada
UTFPR
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://repositorio.utfpr.edu.br/jspui/handle/1/33069
Resumo: The growing need for efficient and scalable information retrieval systems has driven the search for new approaches and architectures. This work proposes the Serverless Information Retrieval Architecture (SIRA) for information retrieval on the serverless computing platform, focusing on the stages of indexing, searching, and classification. The architecture is divided into two steps: document indexing, which includes processing, metric extraction, and the creation of inverted indexes; and document retrieval, which involves searching for relevant documents, classifying the documents through metrics, and presenting the results to the user. The performance of the SIRA architecture is compared to Elastic Search (ELS) on two test collections, Cranfield and TREC-COVID. In addition to having the advantage of consuming resources only on demand, the SIRA architecture demonstrated similar performance to ELS, indicating its effectiveness in retrieving relevant documents and its potential as a solution in the field of information retrieval.
id UTFPR-12_aefb811d9417941eaff7726bb4ff2238
oai_identifier_str oai:repositorio.utfpr.edu.br:1/33069
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling SIRA: arquitetura para recuperação de informação sem servidorSIRA: serverless information retrieval architectureSistemas operacionais distribuídos (Computadores)Recuperação da informaçãoIndexaçãoClassificaçãoAlgorítmos computacionaisComputação em nuvemProcessamento de linguagem natural (Computação)Distributed operating systems (Computers)Information retrievalIndexingClassificationComputer algorithmsCloud computingNatural language processing (Computer science)CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOCiência da ComputaçãoThe growing need for efficient and scalable information retrieval systems has driven the search for new approaches and architectures. This work proposes the Serverless Information Retrieval Architecture (SIRA) for information retrieval on the serverless computing platform, focusing on the stages of indexing, searching, and classification. The architecture is divided into two steps: document indexing, which includes processing, metric extraction, and the creation of inverted indexes; and document retrieval, which involves searching for relevant documents, classifying the documents through metrics, and presenting the results to the user. The performance of the SIRA architecture is compared to Elastic Search (ELS) on two test collections, Cranfield and TREC-COVID. In addition to having the advantage of consuming resources only on demand, the SIRA architecture demonstrated similar performance to ELS, indicating its effectiveness in retrieving relevant documents and its potential as a solution in the field of information retrieval.A crescente necessidade de sistemas de recuperação de informação eficientes e escaláveis impulsionou a busca por novas abordagens e arquiteturas. Este trabalho propõe a arquitetura SIRA (Serverless Information Retrieval Architecture) para a recuperação de informação sobre a plataforma de computação sem servidor, com foco nas etapas de indexação, busca e classificação. A arquitetura é dividida em duas etapas: a indexação de documentos, que inclui o processamento, extração de métricas e criação de índices invertidos; e a recuperação de documentos, a qual envolve a busca de documentos relevantes, classificação dos documentos através de métricas e a apresentação dos resultados ao usuário. O desempenho da arquitetura SIRA é comparado com o ELS (Elastic Search) em duas coleções de teste, Cranfield e TRECCOVID. Além de ter a vantagem de consumir recursos apenas sob demanda, a arquitetura SIRA demonstrou um desempenho similar ao ELS, indicando sua eficácia na recuperação de documentos relevantes e seu potencial como uma solução no campo da recuperação da informação.Universidade Tecnológica Federal do ParanáCuritibaBrasilPrograma de Pós-Graduação em Computação AplicadaUTFPRVendramin, Ana Cristina Barreiras Kochemhttps://orcid.org/0000-0002-1234-0884http://lattes.cnpq.br/3005557336605080Nacamura Júnior, Luizhttps://orcid.org/0000-0003-2847-5369http://lattes.cnpq.br/7319201804384288Vendramin, Ana Cristina Barreiras Kochemhttps://orcid.org/0000-0002-1234-0884http://lattes.cnpq.br/3005557336605080Bona, Luis Carlos Erpen dehttps://orcid.org/0000-0001-6339-499Xhttp://lattes.cnpq.br/9945289519054859Fonseca, Mauro Sergio Pereirahttp://orcid.org/0000-0003-1604-0915http://lattes.cnpq.br/6534637358360971Silva, Thiago Henriquehttps://orcid.org/0000-0001-6994-8076http://lattes.cnpq.br/9568338246493587Rodrigues, Thiago Luiz2023-12-13T21:55:41Z2023-12-13T21:55:41Z2023-11-24info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfRODRIGUES, Thiago Luiz. SIRA: arquitetura para recuperação de informação sem servidor. 2023. Dissertação (Mestrado em Computação Aplicada) - Universidade Tecnológica Federal do Paraná, Curitiba, 2023.http://repositorio.utfpr.edu.br/jspui/handle/1/33069porhttp://creativecommons.org/licenses/by/4.0/info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPR2024-03-03T06:07:38Zoai:repositorio.utfpr.edu.br:1/33069Repositório InstitucionalPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestriut@utfpr.edu.br || sibi@utfpr.edu.bropendoar:2024-03-03T06:07:38Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.none.fl_str_mv SIRA: arquitetura para recuperação de informação sem servidor
SIRA: serverless information retrieval architecture
title SIRA: arquitetura para recuperação de informação sem servidor
spellingShingle SIRA: arquitetura para recuperação de informação sem servidor
Rodrigues, Thiago Luiz
Sistemas operacionais distribuídos (Computadores)
Recuperação da informação
Indexação
Classificação
Algorítmos computacionais
Computação em nuvem
Processamento de linguagem natural (Computação)
Distributed operating systems (Computers)
Information retrieval
Indexing
Classification
Computer algorithms
Cloud computing
Natural language processing (Computer science)
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Ciência da Computação
title_short SIRA: arquitetura para recuperação de informação sem servidor
title_full SIRA: arquitetura para recuperação de informação sem servidor
title_fullStr SIRA: arquitetura para recuperação de informação sem servidor
title_full_unstemmed SIRA: arquitetura para recuperação de informação sem servidor
title_sort SIRA: arquitetura para recuperação de informação sem servidor
author Rodrigues, Thiago Luiz
author_facet Rodrigues, Thiago Luiz
author_role author
dc.contributor.none.fl_str_mv Vendramin, Ana Cristina Barreiras Kochem
https://orcid.org/0000-0002-1234-0884
http://lattes.cnpq.br/3005557336605080
Nacamura Júnior, Luiz
https://orcid.org/0000-0003-2847-5369
http://lattes.cnpq.br/7319201804384288
Vendramin, Ana Cristina Barreiras Kochem
https://orcid.org/0000-0002-1234-0884
http://lattes.cnpq.br/3005557336605080
Bona, Luis Carlos Erpen de
https://orcid.org/0000-0001-6339-499X
http://lattes.cnpq.br/9945289519054859
Fonseca, Mauro Sergio Pereira
http://orcid.org/0000-0003-1604-0915
http://lattes.cnpq.br/6534637358360971
Silva, Thiago Henrique
https://orcid.org/0000-0001-6994-8076
http://lattes.cnpq.br/9568338246493587
dc.contributor.author.fl_str_mv Rodrigues, Thiago Luiz
dc.subject.por.fl_str_mv Sistemas operacionais distribuídos (Computadores)
Recuperação da informação
Indexação
Classificação
Algorítmos computacionais
Computação em nuvem
Processamento de linguagem natural (Computação)
Distributed operating systems (Computers)
Information retrieval
Indexing
Classification
Computer algorithms
Cloud computing
Natural language processing (Computer science)
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Ciência da Computação
topic Sistemas operacionais distribuídos (Computadores)
Recuperação da informação
Indexação
Classificação
Algorítmos computacionais
Computação em nuvem
Processamento de linguagem natural (Computação)
Distributed operating systems (Computers)
Information retrieval
Indexing
Classification
Computer algorithms
Cloud computing
Natural language processing (Computer science)
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Ciência da Computação
description The growing need for efficient and scalable information retrieval systems has driven the search for new approaches and architectures. This work proposes the Serverless Information Retrieval Architecture (SIRA) for information retrieval on the serverless computing platform, focusing on the stages of indexing, searching, and classification. The architecture is divided into two steps: document indexing, which includes processing, metric extraction, and the creation of inverted indexes; and document retrieval, which involves searching for relevant documents, classifying the documents through metrics, and presenting the results to the user. The performance of the SIRA architecture is compared to Elastic Search (ELS) on two test collections, Cranfield and TREC-COVID. In addition to having the advantage of consuming resources only on demand, the SIRA architecture demonstrated similar performance to ELS, indicating its effectiveness in retrieving relevant documents and its potential as a solution in the field of information retrieval.
publishDate 2023
dc.date.none.fl_str_mv 2023-12-13T21:55:41Z
2023-12-13T21:55:41Z
2023-11-24
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv RODRIGUES, Thiago Luiz. SIRA: arquitetura para recuperação de informação sem servidor. 2023. Dissertação (Mestrado em Computação Aplicada) - Universidade Tecnológica Federal do Paraná, Curitiba, 2023.
http://repositorio.utfpr.edu.br/jspui/handle/1/33069
identifier_str_mv RODRIGUES, Thiago Luiz. SIRA: arquitetura para recuperação de informação sem servidor. 2023. Dissertação (Mestrado em Computação Aplicada) - Universidade Tecnológica Federal do Paraná, Curitiba, 2023.
url http://repositorio.utfpr.edu.br/jspui/handle/1/33069
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by/4.0/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by/4.0/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Curitiba
Brasil
Programa de Pós-Graduação em Computação Aplicada
UTFPR
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Curitiba
Brasil
Programa de Pós-Graduação em Computação Aplicada
UTFPR
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv riut@utfpr.edu.br || sibi@utfpr.edu.br
_version_ 1850498340909744128