Uma técnica de zoneamento para indexação de documentos em sistemas de recuperação de informação

Detalhes bibliográficos
Ano de defesa: 2010
Autor(a) principal: Pereira, Alexandre Neiva
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Estadual do Ceará
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://siduece.uece.br/siduece/trabalhoAcademicoPublico.jsf?id=67646
Resumo: O advento da computação moderna e o surgimento da área de Recuperação de Informação trouxe problemas relacionados com a manipulação de informação. Com a criação da Web e a disponibilização de informações na internet, a tarefa de pesquisa na rede tornou-se de extrema relevância e os mecanismos de busca automáticos tornaram-se essenciais. Estes mecanismos, como o popular Google, assim como outros vários sistemas de RI disponíveis no mercado, deveriam retornar as consultas dos usuários com qualidade maior do que a apresentada na atualidade. A eficácia do resultado recuperado pelo sistema de RI revela-se, portanto, de extrema importância, e consequentemente, a performance de uma de suas principais fases, a indexação. A fase de indexação é composta por alguns passos. Este trabalho aborda o passo do Cálculo da Representatividade, que é realizado atualmente por funções como TF.IDF, BM25 e BM25F. Por meio do cálculo da representatividade é possível ordenar os termos do mais relevante ao menos relevante em cada documento. Neste trabalho são apresentadas novas técnicas que combinam o Cálculo de Representatividade ao conceito de zoneamento. O zoneamento consiste em particionar o texto em regiões com o objetivo de conceder maior representatividade a termos que aparecem em regiões específicas. Palavras-chave: Recuperação de informação. Indexação. Representatividade do termo.
id UECE-0_e39d45d84199ed6ee297e0bde2b6d1ec
oai_identifier_str oai:uece.br:67646
network_acronym_str UECE-0
network_name_str Repositório Institucional da UECE
repository_id_str
spelling Uma técnica de zoneamento para indexação de documentos em sistemas de recuperação de informaçãoComputação aplicada Indexacao Recuperacao de InformacaoO advento da computação moderna e o surgimento da área de Recuperação de Informação trouxe problemas relacionados com a manipulação de informação. Com a criação da Web e a disponibilização de informações na internet, a tarefa de pesquisa na rede tornou-se de extrema relevância e os mecanismos de busca automáticos tornaram-se essenciais. Estes mecanismos, como o popular Google, assim como outros vários sistemas de RI disponíveis no mercado, deveriam retornar as consultas dos usuários com qualidade maior do que a apresentada na atualidade. A eficácia do resultado recuperado pelo sistema de RI revela-se, portanto, de extrema importância, e consequentemente, a performance de uma de suas principais fases, a indexação. A fase de indexação é composta por alguns passos. Este trabalho aborda o passo do Cálculo da Representatividade, que é realizado atualmente por funções como TF.IDF, BM25 e BM25F. Por meio do cálculo da representatividade é possível ordenar os termos do mais relevante ao menos relevante em cada documento. Neste trabalho são apresentadas novas técnicas que combinam o Cálculo de Representatividade ao conceito de zoneamento. O zoneamento consiste em particionar o texto em regiões com o objetivo de conceder maior representatividade a termos que aparecem em regiões específicas. Palavras-chave: Recuperação de informação. Indexação. Representatividade do termo.Ver documento original.Universidade Estadual do CearáGustavo Augusto Lima de CamposPereira, Alexandre Neiva2011-04-13T00:00:00Z2010info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://siduece.uece.br/siduece/trabalhoAcademicoPublico.jsf?id=67646info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UECEinstname:Universidade Estadual do Cearáinstacron:UECE2011-04-13T00:00:00Zoai:uece.br:67646Repositório InstitucionalPUBhttps://siduece.uece.br/siduece/api/oai/requestopendoar:2011-04-13T00:00Repositório Institucional da UECE - Universidade Estadual do Cearáfalse
dc.title.none.fl_str_mv Uma técnica de zoneamento para indexação de documentos em sistemas de recuperação de informação
title Uma técnica de zoneamento para indexação de documentos em sistemas de recuperação de informação
spellingShingle Uma técnica de zoneamento para indexação de documentos em sistemas de recuperação de informação
Pereira, Alexandre Neiva
Computação aplicada
Indexacao
Recuperacao de Informacao
title_short Uma técnica de zoneamento para indexação de documentos em sistemas de recuperação de informação
title_full Uma técnica de zoneamento para indexação de documentos em sistemas de recuperação de informação
title_fullStr Uma técnica de zoneamento para indexação de documentos em sistemas de recuperação de informação
title_full_unstemmed Uma técnica de zoneamento para indexação de documentos em sistemas de recuperação de informação
title_sort Uma técnica de zoneamento para indexação de documentos em sistemas de recuperação de informação
author Pereira, Alexandre Neiva
author_facet Pereira, Alexandre Neiva
author_role author
dc.contributor.none.fl_str_mv Gustavo Augusto Lima de Campos
dc.contributor.author.fl_str_mv Pereira, Alexandre Neiva
dc.subject.por.fl_str_mv Computação aplicada
Indexacao
Recuperacao de Informacao
topic Computação aplicada
Indexacao
Recuperacao de Informacao
description O advento da computação moderna e o surgimento da área de Recuperação de Informação trouxe problemas relacionados com a manipulação de informação. Com a criação da Web e a disponibilização de informações na internet, a tarefa de pesquisa na rede tornou-se de extrema relevância e os mecanismos de busca automáticos tornaram-se essenciais. Estes mecanismos, como o popular Google, assim como outros vários sistemas de RI disponíveis no mercado, deveriam retornar as consultas dos usuários com qualidade maior do que a apresentada na atualidade. A eficácia do resultado recuperado pelo sistema de RI revela-se, portanto, de extrema importância, e consequentemente, a performance de uma de suas principais fases, a indexação. A fase de indexação é composta por alguns passos. Este trabalho aborda o passo do Cálculo da Representatividade, que é realizado atualmente por funções como TF.IDF, BM25 e BM25F. Por meio do cálculo da representatividade é possível ordenar os termos do mais relevante ao menos relevante em cada documento. Neste trabalho são apresentadas novas técnicas que combinam o Cálculo de Representatividade ao conceito de zoneamento. O zoneamento consiste em particionar o texto em regiões com o objetivo de conceder maior representatividade a termos que aparecem em regiões específicas. Palavras-chave: Recuperação de informação. Indexação. Representatividade do termo.
publishDate 2010
dc.date.none.fl_str_mv 2010
2011-04-13T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://siduece.uece.br/siduece/trabalhoAcademicoPublico.jsf?id=67646
url https://siduece.uece.br/siduece/trabalhoAcademicoPublico.jsf?id=67646
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual do Ceará
publisher.none.fl_str_mv Universidade Estadual do Ceará
dc.source.none.fl_str_mv reponame:Repositório Institucional da UECE
instname:Universidade Estadual do Ceará
instacron:UECE
instname_str Universidade Estadual do Ceará
instacron_str UECE
institution UECE
reponame_str Repositório Institucional da UECE
collection Repositório Institucional da UECE
repository.name.fl_str_mv Repositório Institucional da UECE - Universidade Estadual do Ceará
repository.mail.fl_str_mv
_version_ 1828296354832580608