Indução de filtros lingüisticamente motivados na recuperação de informação

Arcoverde, João Marcelo Azevedo

Indução de filtros lingüisticamente motivados na recuperação de informação

Detalhes bibliográficos
Ano de defesa:	2007
Autor(a) principal:	Arcoverde, João Marcelo Azevedo
Orientador(a):	Não Informado pela instituição
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Dissertação
Tipo de acesso:	Acesso aberto
Idioma:	por
Instituição de defesa:	Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação:	Não Informado pela instituição
Departamento:	Não Informado pela instituição
País:	Não Informado pela instituição
Palavras-chave em Português:	Aprendizado de máquina Categorização de textos Filtragem de informação Information filtering Information retrieval Machine learning Natural language processing Noun phrases Processamento de linguagem natural Recuperação de informação Sintagmas nominais Text categotization
Link de acesso:	http://www.teses.usp.br/teses/disponiveis/55/55134/tde-15062007-143252/
Resumo:	Apesar dos processos de recuperação e filtragem de informação sempre terem usado técnicas básicas de Processamento de Linguagem Natural (PLN) no suporte à estruturação de documentos, ainda são poucas as indicações sobre os avanços relacionados à utilização de técnicas mais sofisticadas de PLN que justifiquem o custo de sua utilização nestes processos, em comparação com as abordagens tradicionais. Este trabalho investiga algumas evidências que fundamentam a hipótese de que a aplicação de métodos que utilizam conhecimento linguístico é viável, demarcando importantes contribuições para o aumento de sua eficiência em adição aos métodos estatásticos tradicionais. É proposto um modelo de representação de texto fundamentado em sintagmas nominais, cuja representatividade de seus descritores é calculada utilizando-se o conceito de evidência, apoiado em métodos estatísticos. Filtros induzidos a partir desse modelo são utilizados para classificar os documentos recuperados analisando-se a relevância implícita no perfil do usuário. O aumento da precisão (e, portanto, da eficácia) em sistemas de Recuperação de Informação, conseqüência da pós-filtragem seletiva de informações, demonstra uma clara evidência de como o uso de técnicas de PLN pode auxiliar a categorização de textos, abrindo reais possibilidades para o aprimoramento do modelo apresentado

Metadados do item

id	USP_c388f8c7dae28e982ad93f2af13596e5
oai_identifier_str	oai:teses.usp.br:tde-15062007-143252
network_acronym_str	USP
network_name_str	Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling	Indução de filtros lingüisticamente motivados na recuperação de informaçãoLinguistically motivated filter induction in information retrievalAprendizado de máquinaCategorização de textosFiltragem de informaçãoInformation filteringInformation retrievalMachine learningNatural language processingNoun phrasesProcessamento de linguagem naturalRecuperação de informaçãoSintagmas nominaisText categotizationApesar dos processos de recuperação e filtragem de informação sempre terem usado técnicas básicas de Processamento de Linguagem Natural (PLN) no suporte à estruturação de documentos, ainda são poucas as indicações sobre os avanços relacionados à utilização de técnicas mais sofisticadas de PLN que justifiquem o custo de sua utilização nestes processos, em comparação com as abordagens tradicionais. Este trabalho investiga algumas evidências que fundamentam a hipótese de que a aplicação de métodos que utilizam conhecimento linguístico é viável, demarcando importantes contribuições para o aumento de sua eficiência em adição aos métodos estatásticos tradicionais. É proposto um modelo de representação de texto fundamentado em sintagmas nominais, cuja representatividade de seus descritores é calculada utilizando-se o conceito de evidência, apoiado em métodos estatísticos. Filtros induzidos a partir desse modelo são utilizados para classificar os documentos recuperados analisando-se a relevância implícita no perfil do usuário. O aumento da precisão (e, portanto, da eficácia) em sistemas de Recuperação de Informação, conseqüência da pós-filtragem seletiva de informações, demonstra uma clara evidência de como o uso de técnicas de PLN pode auxiliar a categorização de textos, abrindo reais possibilidades para o aprimoramento do modelo apresentadoAlthough Information Retrieval and Filtering tasks have always used basic Natural Language Processing (NLP) techniques for supporting document structuring, there is still space for more sophisticated NLP techniques which justify their cost when compared to the traditional approaches. This research aims to investigate some evidences that justify the hypothesis on which the use of linguistic-based methods is feasible and can bring on relevant contributions to this area. In this work noun phrases of a text are used as descriptors whose evidence is calculated by statistical methods. Filters are then induced to classify the retrieved documents by measuring their implicit relevance presupposed by an user profile. The increase of precision (efficacy) in IR systems as a consequence of the use of NLP techniques for text classification in the filtering task is an evidence of how this approach can be further exploredBiblioteca Digitais de Teses e Dissertações da USPNunes, Maria das Graças VolpeArcoverde, João Marcelo Azevedo2007-04-17info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://www.teses.usp.br/teses/disponiveis/55/55134/tde-15062007-143252/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2016-07-28T16:09:51Zoai:teses.usp.br:tde-15062007-143252Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.bropendoar:27212016-07-28T16:09:51Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv	Indução de filtros lingüisticamente motivados na recuperação de informação Linguistically motivated filter induction in information retrieval
title	Indução de filtros lingüisticamente motivados na recuperação de informação
spellingShingle	Indução de filtros lingüisticamente motivados na recuperação de informação Arcoverde, João Marcelo Azevedo Aprendizado de máquina Categorização de textos Filtragem de informação Information filtering Information retrieval Machine learning Natural language processing Noun phrases Processamento de linguagem natural Recuperação de informação Sintagmas nominais Text categotization
title_short	Indução de filtros lingüisticamente motivados na recuperação de informação
title_full	Indução de filtros lingüisticamente motivados na recuperação de informação
title_fullStr	Indução de filtros lingüisticamente motivados na recuperação de informação
title_full_unstemmed	Indução de filtros lingüisticamente motivados na recuperação de informação
title_sort	Indução de filtros lingüisticamente motivados na recuperação de informação
author	Arcoverde, João Marcelo Azevedo
author_facet	Arcoverde, João Marcelo Azevedo
author_role	author
dc.contributor.none.fl_str_mv	Nunes, Maria das Graças Volpe
dc.contributor.author.fl_str_mv	Arcoverde, João Marcelo Azevedo
dc.subject.por.fl_str_mv	Aprendizado de máquina Categorização de textos Filtragem de informação Information filtering Information retrieval Machine learning Natural language processing Noun phrases Processamento de linguagem natural Recuperação de informação Sintagmas nominais Text categotization
topic	Aprendizado de máquina Categorização de textos Filtragem de informação Information filtering Information retrieval Machine learning Natural language processing Noun phrases Processamento de linguagem natural Recuperação de informação Sintagmas nominais Text categotization
description	Apesar dos processos de recuperação e filtragem de informação sempre terem usado técnicas básicas de Processamento de Linguagem Natural (PLN) no suporte à estruturação de documentos, ainda são poucas as indicações sobre os avanços relacionados à utilização de técnicas mais sofisticadas de PLN que justifiquem o custo de sua utilização nestes processos, em comparação com as abordagens tradicionais. Este trabalho investiga algumas evidências que fundamentam a hipótese de que a aplicação de métodos que utilizam conhecimento linguístico é viável, demarcando importantes contribuições para o aumento de sua eficiência em adição aos métodos estatásticos tradicionais. É proposto um modelo de representação de texto fundamentado em sintagmas nominais, cuja representatividade de seus descritores é calculada utilizando-se o conceito de evidência, apoiado em métodos estatísticos. Filtros induzidos a partir desse modelo são utilizados para classificar os documentos recuperados analisando-se a relevância implícita no perfil do usuário. O aumento da precisão (e, portanto, da eficácia) em sistemas de Recuperação de Informação, conseqüência da pós-filtragem seletiva de informações, demonstra uma clara evidência de como o uso de técnicas de PLN pode auxiliar a categorização de textos, abrindo reais possibilidades para o aprimoramento do modelo apresentado
publishDate	2007
dc.date.none.fl_str_mv	2007-04-17
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://www.teses.usp.br/teses/disponiveis/55/55134/tde-15062007-143252/
url	http://www.teses.usp.br/teses/disponiveis/55/55134/tde-15062007-143252/
dc.language.iso.fl_str_mv	por
language	por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv	Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess
rights_invalid_str_mv	Liberar o conteúdo para acesso público.
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP
instname_str	Universidade de São Paulo (USP)
instacron_str	USP
institution	USP
reponame_str	Biblioteca Digital de Teses e Dissertações da USP
collection	Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv	virginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.br
_version_	1815258173899014144

Indução de filtros lingüisticamente motivados na recuperação de informação

Registros relacionados