Ranqueamento de informações por Floresta de Caminhos Ótimos

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Ascenção, Nathalia Queiroz [UNESP]
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Estadual Paulista (Unesp)
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://hdl.handle.net/11449/191888
Resumo: A tarefa de aprender a ranquear tem sido amplamente estudada pela comunidade científica de aprendizado de máquina principalmente devido a sua utilização na área de recuperação de informações, mineração de dados e processamento de linguagem natural. O ranqueamento de informações pode ser dividido em criação de ranqueamento e agregação desse. O presente trabalho aborda o ranqueamento de informações sob à ótica da criação desse, na qual tem-se inicialmente uma necessidade, comumente denominada query, e deseja-se gerar uma lista ranqueada dos itens oferecidos como resposta para dada query, estando os itens relevantes a essa localizados nas primeiras posições da lista. Até o presente momento, classificadores baseados em Floresta de Caminhos Ótimos não foram aplicados à tarefa de aprender a ranquear e este projeto de mestrado tem como principal contribuição a aplicação desses, na versão supervisionada com grafo completo e k-nn, ao ranqueamento de informações. Para aplicá-los a esse contexto a informação de custo das amostras do conjunto de treinamento foi utilizada para ranquear as r amostras mais relevantes para dada entrada na fase de teste dos classificadores. Experimentos foram realizados tendo como cenário a recuperação e ranqueamento de imagens utilizando características referentes ao conteúdo visual dessas. Os resultados experimentais obtidos com as abordagens baseadas em OPF foram comparados aos da técnica Ranking SVM e ao obtido ao ranquear as imagens utilizando a distância entre os vetores de características que representam a imagem de query e cada uma das candidatas a serem relevantes para tal. O classificador OPF com grafo completo forneceu resultados similares aos obtidos com a técnica Ranking SVM e ao lado do OPF k-nn apresentou os menores tempos de execução durante a criação do ranqueamento. Assim, ambas as abordagens propostas demonstraram ser uma solução promissora para problemas em que o ranqueamento de informações se faz necessário.
id UNSP_bbbeac1f04900473bcca7f66ced50d69
oai_identifier_str oai:repositorio.unesp.br:11449/191888
network_acronym_str UNSP
network_name_str Repositório Institucional da UNESP
repository_id_str
spelling Ranqueamento de informações por Floresta de Caminhos ÓtimosOptimum-Path Forest information rankingRecuperação de informaçõesRanqueamento de informaçõesFloresta de Caminhos ÓtimosInformation retrievalInformation rankingOptimum-Path ForestA tarefa de aprender a ranquear tem sido amplamente estudada pela comunidade científica de aprendizado de máquina principalmente devido a sua utilização na área de recuperação de informações, mineração de dados e processamento de linguagem natural. O ranqueamento de informações pode ser dividido em criação de ranqueamento e agregação desse. O presente trabalho aborda o ranqueamento de informações sob à ótica da criação desse, na qual tem-se inicialmente uma necessidade, comumente denominada query, e deseja-se gerar uma lista ranqueada dos itens oferecidos como resposta para dada query, estando os itens relevantes a essa localizados nas primeiras posições da lista. Até o presente momento, classificadores baseados em Floresta de Caminhos Ótimos não foram aplicados à tarefa de aprender a ranquear e este projeto de mestrado tem como principal contribuição a aplicação desses, na versão supervisionada com grafo completo e k-nn, ao ranqueamento de informações. Para aplicá-los a esse contexto a informação de custo das amostras do conjunto de treinamento foi utilizada para ranquear as r amostras mais relevantes para dada entrada na fase de teste dos classificadores. Experimentos foram realizados tendo como cenário a recuperação e ranqueamento de imagens utilizando características referentes ao conteúdo visual dessas. Os resultados experimentais obtidos com as abordagens baseadas em OPF foram comparados aos da técnica Ranking SVM e ao obtido ao ranquear as imagens utilizando a distância entre os vetores de características que representam a imagem de query e cada uma das candidatas a serem relevantes para tal. O classificador OPF com grafo completo forneceu resultados similares aos obtidos com a técnica Ranking SVM e ao lado do OPF k-nn apresentou os menores tempos de execução durante a criação do ranqueamento. Assim, ambas as abordagens propostas demonstraram ser uma solução promissora para problemas em que o ranqueamento de informações se faz necessário.The learning to rank task has been widely studied by the machine learning scientific community mainly due to its use in information retrieval, data mining and natural language processing. Information ranking can be divided into ranking creation and aggregation. This work addresses the information ranking from the perspective of its creation, where there is initially a need, commonly called query, and we aim to generate a ranked list of items offered in response to given query, with the relevant items to query located in the first positions from the list. To date, classifiers based on Optimum-Path Forest have not been applied to the learning to rank task and this master’s project has as its main contribution to apply these, in the supervised version with full graph and k-nn, to the information ranking. To apply them to this context, the cost information from training set samples was used to rank the r most relevant samples for input sample from the testing phase of the classifiers. Experiments were performed considering the image retrieval and ranking scenario using visual content features. The experimental results obtained with the OPF-based approaches were compared to those of the Ranking SVM technique and to those obtained by ranking the images using the distance between the feature vector representing the query image and those representing the candidates, that is, that may be relevant to it. The complete graph OPF classifier provided similar results to those obtained with the Ranking SVM technique and beside the k-nn OPF presented the shortest execution time during the ranking creation. Thus, both proposed approaches have proved to be a promising solution to problems where information ranking is required.OutraPetrobras: Convênio 5850.0102453.16.9 / SAP 4600530925.Universidade Estadual Paulista (Unesp)Papa, João Paulo [UNESP]Universidade Estadual Paulista (Unesp)Ascenção, Nathalia Queiroz [UNESP]2020-03-17T19:29:05Z2020-03-17T19:29:05Z2020-02-20info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/11449/19188800092969233004153073P2porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2025-06-02T17:00:27Zoai:repositorio.unesp.br:11449/191888Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestrepositoriounesp@unesp.bropendoar:29462025-06-02T17:00:27Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv Ranqueamento de informações por Floresta de Caminhos Ótimos
Optimum-Path Forest information ranking
title Ranqueamento de informações por Floresta de Caminhos Ótimos
spellingShingle Ranqueamento de informações por Floresta de Caminhos Ótimos
Ascenção, Nathalia Queiroz [UNESP]
Recuperação de informações
Ranqueamento de informações
Floresta de Caminhos Ótimos
Information retrieval
Information ranking
Optimum-Path Forest
title_short Ranqueamento de informações por Floresta de Caminhos Ótimos
title_full Ranqueamento de informações por Floresta de Caminhos Ótimos
title_fullStr Ranqueamento de informações por Floresta de Caminhos Ótimos
title_full_unstemmed Ranqueamento de informações por Floresta de Caminhos Ótimos
title_sort Ranqueamento de informações por Floresta de Caminhos Ótimos
author Ascenção, Nathalia Queiroz [UNESP]
author_facet Ascenção, Nathalia Queiroz [UNESP]
author_role author
dc.contributor.none.fl_str_mv Papa, João Paulo [UNESP]
Universidade Estadual Paulista (Unesp)
dc.contributor.author.fl_str_mv Ascenção, Nathalia Queiroz [UNESP]
dc.subject.por.fl_str_mv Recuperação de informações
Ranqueamento de informações
Floresta de Caminhos Ótimos
Information retrieval
Information ranking
Optimum-Path Forest
topic Recuperação de informações
Ranqueamento de informações
Floresta de Caminhos Ótimos
Information retrieval
Information ranking
Optimum-Path Forest
description A tarefa de aprender a ranquear tem sido amplamente estudada pela comunidade científica de aprendizado de máquina principalmente devido a sua utilização na área de recuperação de informações, mineração de dados e processamento de linguagem natural. O ranqueamento de informações pode ser dividido em criação de ranqueamento e agregação desse. O presente trabalho aborda o ranqueamento de informações sob à ótica da criação desse, na qual tem-se inicialmente uma necessidade, comumente denominada query, e deseja-se gerar uma lista ranqueada dos itens oferecidos como resposta para dada query, estando os itens relevantes a essa localizados nas primeiras posições da lista. Até o presente momento, classificadores baseados em Floresta de Caminhos Ótimos não foram aplicados à tarefa de aprender a ranquear e este projeto de mestrado tem como principal contribuição a aplicação desses, na versão supervisionada com grafo completo e k-nn, ao ranqueamento de informações. Para aplicá-los a esse contexto a informação de custo das amostras do conjunto de treinamento foi utilizada para ranquear as r amostras mais relevantes para dada entrada na fase de teste dos classificadores. Experimentos foram realizados tendo como cenário a recuperação e ranqueamento de imagens utilizando características referentes ao conteúdo visual dessas. Os resultados experimentais obtidos com as abordagens baseadas em OPF foram comparados aos da técnica Ranking SVM e ao obtido ao ranquear as imagens utilizando a distância entre os vetores de características que representam a imagem de query e cada uma das candidatas a serem relevantes para tal. O classificador OPF com grafo completo forneceu resultados similares aos obtidos com a técnica Ranking SVM e ao lado do OPF k-nn apresentou os menores tempos de execução durante a criação do ranqueamento. Assim, ambas as abordagens propostas demonstraram ser uma solução promissora para problemas em que o ranqueamento de informações se faz necessário.
publishDate 2020
dc.date.none.fl_str_mv 2020-03-17T19:29:05Z
2020-03-17T19:29:05Z
2020-02-20
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/11449/191888
000929692
33004153073P2
url http://hdl.handle.net/11449/191888
identifier_str_mv 000929692
33004153073P2
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNESP
instname:Universidade Estadual Paulista (UNESP)
instacron:UNESP
instname_str Universidade Estadual Paulista (UNESP)
instacron_str UNESP
institution UNESP
reponame_str Repositório Institucional da UNESP
collection Repositório Institucional da UNESP
repository.name.fl_str_mv Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv repositoriounesp@unesp.br
_version_ 1854954603739611136