Minerador WEB: um estudo sobre mecanismos de descoberta de informações na WEB.

Toscano, Wagner

Minerador WEB: um estudo sobre mecanismos de descoberta de informações na WEB.

Detalhes bibliográficos
Ano de defesa:	2003
Autor(a) principal:	Toscano, Wagner
Orientador(a):	Não Informado pela instituição
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Dissertação
Tipo de acesso:	Acesso aberto
Idioma:	por
Instituição de defesa:	Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação:	Não Informado pela instituição
Departamento:	Não Informado pela instituição
País:	Não Informado pela instituição
Palavras-chave em Português:	artificial intelligence computação e sistemas digitais descoberta do conhecimento discovery of the knowledge extração de informação extraction of information inteligência artificial ontologia ontology representação do conhecimento representation of the knowledge WEB mining web mining
Link de acesso:	http://www.teses.usp.br/teses/disponiveis/3/3141/tde-17122003-150851/
Resumo:	A Web (WWW - World Wide Web) possui uma grande quantidade e variedade de informações. Isso representa um grande atrativo para que as pessoas busquem alguma informação desejada na Web. Por outo lado, dessa grande quantidade de informações resulta o problema fundamental de como descobrir, de uma maneira eficaz, se a informação desejada está presente na Web e como chegar até ela. A existência de um conjunto de informações que não se permitem acessar com facilidade ou que o acesso é desprovido de ferramentas eficazes de busca da informção, inviabiliza sua utilização. Soma-se às dificuldades no processo de pesquisa, a falta de estrutura das informações da Web que dificulta a aplicação de processos na busca da informação. Neste trabalho é apresentado um estudo de técnicas alternativas de busca da informação, pela aplicação de diversos conceitos relacionados à recuperação da informação e à representação do conhecimento. Mais especificamente, os objetivos são analisar a eficiência resultante da utilização de técnicas complementares de busca da informação, em particular mecanismos de extração de informações a partir de trechos explícitos nos documentos HTML e o uso do método de Naive Bayes na classificação de sites, e analisar a eficácia de um processo de armazenamento de informações extraídas da Web numa base de conhecimento (descrita em lógica de primeira ordem) que, aliada a um conhecimento de fundo, permita respomder a consultas mais complexas que as possíveis por meio do uso de expressões baseadas em palavras-chave e conectivos lógicos.

Metadados do item

id	USP_474b2d65e7799bf324f4b631b62f3ce5
oai_identifier_str	oai:teses.usp.br:tde-17122003-150851
network_acronym_str	USP
network_name_str	Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling	Minerador WEB: um estudo sobre mecanismos de descoberta de informações na WEB. Minerador WEB: a study on mechanisms of discovery of information in the WEB. artificial intelligence computação e sistemas digitaisdescoberta do conhecimentodiscovery of the knowledgeextração de informaçãoextraction of informationinteligência artificialontologiaontologyrepresentação do conhecimentorepresentation of the knowledgeWEB miningweb miningA Web (WWW - World Wide Web) possui uma grande quantidade e variedade de informações. Isso representa um grande atrativo para que as pessoas busquem alguma informação desejada na Web. Por outo lado, dessa grande quantidade de informações resulta o problema fundamental de como descobrir, de uma maneira eficaz, se a informação desejada está presente na Web e como chegar até ela. A existência de um conjunto de informações que não se permitem acessar com facilidade ou que o acesso é desprovido de ferramentas eficazes de busca da informção, inviabiliza sua utilização. Soma-se às dificuldades no processo de pesquisa, a falta de estrutura das informações da Web que dificulta a aplicação de processos na busca da informação. Neste trabalho é apresentado um estudo de técnicas alternativas de busca da informação, pela aplicação de diversos conceitos relacionados à recuperação da informação e à representação do conhecimento. Mais especificamente, os objetivos são analisar a eficiência resultante da utilização de técnicas complementares de busca da informação, em particular mecanismos de extração de informações a partir de trechos explícitos nos documentos HTML e o uso do método de Naive Bayes na classificação de sites, e analisar a eficácia de um processo de armazenamento de informações extraídas da Web numa base de conhecimento (descrita em lógica de primeira ordem) que, aliada a um conhecimento de fundo, permita respomder a consultas mais complexas que as possíveis por meio do uso de expressões baseadas em palavras-chave e conectivos lógicos.The World Wide Web (Web) has a huge amount and a large diversity of informations. There is a big appeal to people navigate on the Web to search for a desired information. On the other hand, due to this huge amount of data, we are faced with the fundamental problems of how to discover and how to reach the desired information in a efficient way. If there is no efficient mechanisms to find informations, the use of the Web as a useful source of information becomes very restrictive. Another important problem to overcome is the lack of a regular structure of the information in the Web, making difficult the use of usual information search methods. In this work it is presented a study of alternative techniques for information search. Several concepts of information retrieval and knowledge representation are applied. A primary goal is to analyse the efficiency of information retrieval methods using analysis of extensional information and probabilistic methods like Naive Bayes to classify sites among a pre-defined classes of sites.Another goal is to design a logic based knowledhe base, in order to enable a user to apply more complex queries than queries based simply on expressions using keywouds and logical connectivesBiblioteca Digitais de Teses e Dissertações da USPGomi, Edson SatoshiToscano, Wagner2003-07-10info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://www.teses.usp.br/teses/disponiveis/3/3141/tde-17122003-150851/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2016-07-28T16:09:43Zoai:teses.usp.br:tde-17122003-150851Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.bropendoar:27212016-07-28T16:09:43Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv	Minerador WEB: um estudo sobre mecanismos de descoberta de informações na WEB. Minerador WEB: a study on mechanisms of discovery of information in the WEB.
title	Minerador WEB: um estudo sobre mecanismos de descoberta de informações na WEB.
spellingShingle	Minerador WEB: um estudo sobre mecanismos de descoberta de informações na WEB. Toscano, Wagner artificial intelligence computação e sistemas digitais descoberta do conhecimento discovery of the knowledge extração de informação extraction of information inteligência artificial ontologia ontology representação do conhecimento representation of the knowledge WEB mining web mining
title_short	Minerador WEB: um estudo sobre mecanismos de descoberta de informações na WEB.
title_full	Minerador WEB: um estudo sobre mecanismos de descoberta de informações na WEB.
title_fullStr	Minerador WEB: um estudo sobre mecanismos de descoberta de informações na WEB.
title_full_unstemmed	Minerador WEB: um estudo sobre mecanismos de descoberta de informações na WEB.
title_sort	Minerador WEB: um estudo sobre mecanismos de descoberta de informações na WEB.
author	Toscano, Wagner
author_facet	Toscano, Wagner
author_role	author
dc.contributor.none.fl_str_mv	Gomi, Edson Satoshi
dc.contributor.author.fl_str_mv	Toscano, Wagner
dc.subject.por.fl_str_mv	artificial intelligence computação e sistemas digitais descoberta do conhecimento discovery of the knowledge extração de informação extraction of information inteligência artificial ontologia ontology representação do conhecimento representation of the knowledge WEB mining web mining
topic	artificial intelligence computação e sistemas digitais descoberta do conhecimento discovery of the knowledge extração de informação extraction of information inteligência artificial ontologia ontology representação do conhecimento representation of the knowledge WEB mining web mining
description	A Web (WWW - World Wide Web) possui uma grande quantidade e variedade de informações. Isso representa um grande atrativo para que as pessoas busquem alguma informação desejada na Web. Por outo lado, dessa grande quantidade de informações resulta o problema fundamental de como descobrir, de uma maneira eficaz, se a informação desejada está presente na Web e como chegar até ela. A existência de um conjunto de informações que não se permitem acessar com facilidade ou que o acesso é desprovido de ferramentas eficazes de busca da informção, inviabiliza sua utilização. Soma-se às dificuldades no processo de pesquisa, a falta de estrutura das informações da Web que dificulta a aplicação de processos na busca da informação. Neste trabalho é apresentado um estudo de técnicas alternativas de busca da informação, pela aplicação de diversos conceitos relacionados à recuperação da informação e à representação do conhecimento. Mais especificamente, os objetivos são analisar a eficiência resultante da utilização de técnicas complementares de busca da informação, em particular mecanismos de extração de informações a partir de trechos explícitos nos documentos HTML e o uso do método de Naive Bayes na classificação de sites, e analisar a eficácia de um processo de armazenamento de informações extraídas da Web numa base de conhecimento (descrita em lógica de primeira ordem) que, aliada a um conhecimento de fundo, permita respomder a consultas mais complexas que as possíveis por meio do uso de expressões baseadas em palavras-chave e conectivos lógicos.
publishDate	2003
dc.date.none.fl_str_mv	2003-07-10
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://www.teses.usp.br/teses/disponiveis/3/3141/tde-17122003-150851/
url	http://www.teses.usp.br/teses/disponiveis/3/3141/tde-17122003-150851/
dc.language.iso.fl_str_mv	por
language	por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv	Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess
rights_invalid_str_mv	Liberar o conteúdo para acesso público.
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP
instname_str	Universidade de São Paulo (USP)
instacron_str	USP
institution	USP
reponame_str	Biblioteca Digital de Teses e Dissertações da USP
collection	Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv	virginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.br
_version_	1815258202678231040

Minerador WEB: um estudo sobre mecanismos de descoberta de informações na WEB.

Registros relacionados