SIRA: arquitetura para recuperação de informação sem servidor
| Ano de defesa: | 2023 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Tecnológica Federal do Paraná
Curitiba Brasil Programa de Pós-Graduação em Computação Aplicada UTFPR |
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | http://repositorio.utfpr.edu.br/jspui/handle/1/33069 |
Resumo: | The growing need for efficient and scalable information retrieval systems has driven the search for new approaches and architectures. This work proposes the Serverless Information Retrieval Architecture (SIRA) for information retrieval on the serverless computing platform, focusing on the stages of indexing, searching, and classification. The architecture is divided into two steps: document indexing, which includes processing, metric extraction, and the creation of inverted indexes; and document retrieval, which involves searching for relevant documents, classifying the documents through metrics, and presenting the results to the user. The performance of the SIRA architecture is compared to Elastic Search (ELS) on two test collections, Cranfield and TREC-COVID. In addition to having the advantage of consuming resources only on demand, the SIRA architecture demonstrated similar performance to ELS, indicating its effectiveness in retrieving relevant documents and its potential as a solution in the field of information retrieval. |
| id |
UTFPR-12_aefb811d9417941eaff7726bb4ff2238 |
|---|---|
| oai_identifier_str |
oai:repositorio.utfpr.edu.br:1/33069 |
| network_acronym_str |
UTFPR-12 |
| network_name_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
| repository_id_str |
|
| spelling |
SIRA: arquitetura para recuperação de informação sem servidorSIRA: serverless information retrieval architectureSistemas operacionais distribuídos (Computadores)Recuperação da informaçãoIndexaçãoClassificaçãoAlgorítmos computacionaisComputação em nuvemProcessamento de linguagem natural (Computação)Distributed operating systems (Computers)Information retrievalIndexingClassificationComputer algorithmsCloud computingNatural language processing (Computer science)CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOCiência da ComputaçãoThe growing need for efficient and scalable information retrieval systems has driven the search for new approaches and architectures. This work proposes the Serverless Information Retrieval Architecture (SIRA) for information retrieval on the serverless computing platform, focusing on the stages of indexing, searching, and classification. The architecture is divided into two steps: document indexing, which includes processing, metric extraction, and the creation of inverted indexes; and document retrieval, which involves searching for relevant documents, classifying the documents through metrics, and presenting the results to the user. The performance of the SIRA architecture is compared to Elastic Search (ELS) on two test collections, Cranfield and TREC-COVID. In addition to having the advantage of consuming resources only on demand, the SIRA architecture demonstrated similar performance to ELS, indicating its effectiveness in retrieving relevant documents and its potential as a solution in the field of information retrieval.A crescente necessidade de sistemas de recuperação de informação eficientes e escaláveis impulsionou a busca por novas abordagens e arquiteturas. Este trabalho propõe a arquitetura SIRA (Serverless Information Retrieval Architecture) para a recuperação de informação sobre a plataforma de computação sem servidor, com foco nas etapas de indexação, busca e classificação. A arquitetura é dividida em duas etapas: a indexação de documentos, que inclui o processamento, extração de métricas e criação de índices invertidos; e a recuperação de documentos, a qual envolve a busca de documentos relevantes, classificação dos documentos através de métricas e a apresentação dos resultados ao usuário. O desempenho da arquitetura SIRA é comparado com o ELS (Elastic Search) em duas coleções de teste, Cranfield e TRECCOVID. Além de ter a vantagem de consumir recursos apenas sob demanda, a arquitetura SIRA demonstrou um desempenho similar ao ELS, indicando sua eficácia na recuperação de documentos relevantes e seu potencial como uma solução no campo da recuperação da informação.Universidade Tecnológica Federal do ParanáCuritibaBrasilPrograma de Pós-Graduação em Computação AplicadaUTFPRVendramin, Ana Cristina Barreiras Kochemhttps://orcid.org/0000-0002-1234-0884http://lattes.cnpq.br/3005557336605080Nacamura Júnior, Luizhttps://orcid.org/0000-0003-2847-5369http://lattes.cnpq.br/7319201804384288Vendramin, Ana Cristina Barreiras Kochemhttps://orcid.org/0000-0002-1234-0884http://lattes.cnpq.br/3005557336605080Bona, Luis Carlos Erpen dehttps://orcid.org/0000-0001-6339-499Xhttp://lattes.cnpq.br/9945289519054859Fonseca, Mauro Sergio Pereirahttp://orcid.org/0000-0003-1604-0915http://lattes.cnpq.br/6534637358360971Silva, Thiago Henriquehttps://orcid.org/0000-0001-6994-8076http://lattes.cnpq.br/9568338246493587Rodrigues, Thiago Luiz2023-12-13T21:55:41Z2023-12-13T21:55:41Z2023-11-24info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfRODRIGUES, Thiago Luiz. SIRA: arquitetura para recuperação de informação sem servidor. 2023. Dissertação (Mestrado em Computação Aplicada) - Universidade Tecnológica Federal do Paraná, Curitiba, 2023.http://repositorio.utfpr.edu.br/jspui/handle/1/33069porhttp://creativecommons.org/licenses/by/4.0/info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPR2024-03-03T06:07:38Zoai:repositorio.utfpr.edu.br:1/33069Repositório InstitucionalPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestriut@utfpr.edu.br || sibi@utfpr.edu.bropendoar:2024-03-03T06:07:38Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false |
| dc.title.none.fl_str_mv |
SIRA: arquitetura para recuperação de informação sem servidor SIRA: serverless information retrieval architecture |
| title |
SIRA: arquitetura para recuperação de informação sem servidor |
| spellingShingle |
SIRA: arquitetura para recuperação de informação sem servidor Rodrigues, Thiago Luiz Sistemas operacionais distribuídos (Computadores) Recuperação da informação Indexação Classificação Algorítmos computacionais Computação em nuvem Processamento de linguagem natural (Computação) Distributed operating systems (Computers) Information retrieval Indexing Classification Computer algorithms Cloud computing Natural language processing (Computer science) CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Ciência da Computação |
| title_short |
SIRA: arquitetura para recuperação de informação sem servidor |
| title_full |
SIRA: arquitetura para recuperação de informação sem servidor |
| title_fullStr |
SIRA: arquitetura para recuperação de informação sem servidor |
| title_full_unstemmed |
SIRA: arquitetura para recuperação de informação sem servidor |
| title_sort |
SIRA: arquitetura para recuperação de informação sem servidor |
| author |
Rodrigues, Thiago Luiz |
| author_facet |
Rodrigues, Thiago Luiz |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Vendramin, Ana Cristina Barreiras Kochem https://orcid.org/0000-0002-1234-0884 http://lattes.cnpq.br/3005557336605080 Nacamura Júnior, Luiz https://orcid.org/0000-0003-2847-5369 http://lattes.cnpq.br/7319201804384288 Vendramin, Ana Cristina Barreiras Kochem https://orcid.org/0000-0002-1234-0884 http://lattes.cnpq.br/3005557336605080 Bona, Luis Carlos Erpen de https://orcid.org/0000-0001-6339-499X http://lattes.cnpq.br/9945289519054859 Fonseca, Mauro Sergio Pereira http://orcid.org/0000-0003-1604-0915 http://lattes.cnpq.br/6534637358360971 Silva, Thiago Henrique https://orcid.org/0000-0001-6994-8076 http://lattes.cnpq.br/9568338246493587 |
| dc.contributor.author.fl_str_mv |
Rodrigues, Thiago Luiz |
| dc.subject.por.fl_str_mv |
Sistemas operacionais distribuídos (Computadores) Recuperação da informação Indexação Classificação Algorítmos computacionais Computação em nuvem Processamento de linguagem natural (Computação) Distributed operating systems (Computers) Information retrieval Indexing Classification Computer algorithms Cloud computing Natural language processing (Computer science) CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Ciência da Computação |
| topic |
Sistemas operacionais distribuídos (Computadores) Recuperação da informação Indexação Classificação Algorítmos computacionais Computação em nuvem Processamento de linguagem natural (Computação) Distributed operating systems (Computers) Information retrieval Indexing Classification Computer algorithms Cloud computing Natural language processing (Computer science) CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Ciência da Computação |
| description |
The growing need for efficient and scalable information retrieval systems has driven the search for new approaches and architectures. This work proposes the Serverless Information Retrieval Architecture (SIRA) for information retrieval on the serverless computing platform, focusing on the stages of indexing, searching, and classification. The architecture is divided into two steps: document indexing, which includes processing, metric extraction, and the creation of inverted indexes; and document retrieval, which involves searching for relevant documents, classifying the documents through metrics, and presenting the results to the user. The performance of the SIRA architecture is compared to Elastic Search (ELS) on two test collections, Cranfield and TREC-COVID. In addition to having the advantage of consuming resources only on demand, the SIRA architecture demonstrated similar performance to ELS, indicating its effectiveness in retrieving relevant documents and its potential as a solution in the field of information retrieval. |
| publishDate |
2023 |
| dc.date.none.fl_str_mv |
2023-12-13T21:55:41Z 2023-12-13T21:55:41Z 2023-11-24 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
RODRIGUES, Thiago Luiz. SIRA: arquitetura para recuperação de informação sem servidor. 2023. Dissertação (Mestrado em Computação Aplicada) - Universidade Tecnológica Federal do Paraná, Curitiba, 2023. http://repositorio.utfpr.edu.br/jspui/handle/1/33069 |
| identifier_str_mv |
RODRIGUES, Thiago Luiz. SIRA: arquitetura para recuperação de informação sem servidor. 2023. Dissertação (Mestrado em Computação Aplicada) - Universidade Tecnológica Federal do Paraná, Curitiba, 2023. |
| url |
http://repositorio.utfpr.edu.br/jspui/handle/1/33069 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
http://creativecommons.org/licenses/by/4.0/ info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by/4.0/ |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Curitiba Brasil Programa de Pós-Graduação em Computação Aplicada UTFPR |
| publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Curitiba Brasil Programa de Pós-Graduação em Computação Aplicada UTFPR |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) instname:Universidade Tecnológica Federal do Paraná (UTFPR) instacron:UTFPR |
| instname_str |
Universidade Tecnológica Federal do Paraná (UTFPR) |
| instacron_str |
UTFPR |
| institution |
UTFPR |
| reponame_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
| collection |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
| repository.name.fl_str_mv |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR) |
| repository.mail.fl_str_mv |
riut@utfpr.edu.br || sibi@utfpr.edu.br |
| _version_ |
1850498340909744128 |