Um estudo sobre agrupamento de documentos textuais em processamento de informações não estruturadas usando técnicas de "clustering"

Wives, Leandro Krug

Um estudo sobre agrupamento de documentos textuais em processamento de informações não estruturadas usando técnicas de "clustering"

Detalhes bibliográficos
Ano de defesa:	1999
Autor(a) principal:	Wives, Leandro Krug
Orientador(a):	Oliveira, Jose Palazzo Moreira de, Castilho, Jose Mauro Volkmer de
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Dissertação
Tipo de acesso:	Acesso aberto
Idioma:	por
Instituição de defesa:	Não Informado pela instituição
Programa de Pós-Graduação:	Não Informado pela instituição
Departamento:	Não Informado pela instituição
País:	Não Informado pela instituição
Palavras-chave em Português:	Armazenamento : Dados Recuperacao : Informacao Descoberta : Conhecimento Agrupamento : Informacao textual
Palavras-chave em Inglês:	Clustering Knowledge discovery from texts Information retrieval
Link de acesso:	http://hdl.handle.net/10183/25933
Resumo:	Atualmente, técnicas de recuperação e análise de informações, principalmente textuais, são de extrema importância. Após o grande BOOM da Internet, muitos problemas que já eram conhecidos em contextos fechados passaram a preocupar também toda a comunidade científica. No âmbito deste trabalho os problemas relacionados à sobrecarga de informações, que ocorre devido ao grande volume de dados a disposição de uma pessoa, são os mais importantes. Visando minimizar estes problemas, este trabalho apresenta um estudo sobre métodos de agrupamento de objetos textuais (documentos no formato ASCII), onde os objetos são organizados automaticamente em grupos de objetos similares, facilitando sua localização, manipulação e análise. Decorrente deste estudo, apresenta-se uma metodologia de aplicação do agrupamento descrevendo-se suas diversas etapas. Estas etapas foram desenvolvidas de maneira que após uma ter sido realizada ela não precisa ser refeita, permitindo que a etapa seguinte seja aplicada diversas vezes sobre os mesmos dados (com diferentes parâmetros) de forma independente. Além da metodologia, realiza-se um estudo comparativo entre alguns algoritmos de agrupamento, inclusive apresentando-se um novo algoritmo mais eficiente. Este fato é comprovado em experimentos realizados nos diversos estudos de caso propostos. Outras contribuições deste trabalho incluem a implementação de uma ferramenta de agrupamento de textos que utiliza a metodologia elaborada e os algoritmos estudados; além da utilização de uma fórmula não convencional de cálculo de similaridades entre objetos (de abordagem fuzzy), aplicada a informações textuais, obtendo resultados satisfatórios.

Metadados do item

id	URGS_eb48bb074409cd2945148a0ce301dbbf
oai_identifier_str	oai:www.lume.ufrgs.br:10183/25933
network_acronym_str	URGS
network_name_str	Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str
spelling	Wives, Leandro KrugOliveira, Jose Palazzo Moreira deCastilho, Jose Mauro Volkmer de2010-09-23T04:18:49Z1999http://hdl.handle.net/10183/25933000102235Atualmente, técnicas de recuperação e análise de informações, principalmente textuais, são de extrema importância. Após o grande BOOM da Internet, muitos problemas que já eram conhecidos em contextos fechados passaram a preocupar também toda a comunidade científica. No âmbito deste trabalho os problemas relacionados à sobrecarga de informações, que ocorre devido ao grande volume de dados a disposição de uma pessoa, são os mais importantes. Visando minimizar estes problemas, este trabalho apresenta um estudo sobre métodos de agrupamento de objetos textuais (documentos no formato ASCII), onde os objetos são organizados automaticamente em grupos de objetos similares, facilitando sua localização, manipulação e análise. Decorrente deste estudo, apresenta-se uma metodologia de aplicação do agrupamento descrevendo-se suas diversas etapas. Estas etapas foram desenvolvidas de maneira que após uma ter sido realizada ela não precisa ser refeita, permitindo que a etapa seguinte seja aplicada diversas vezes sobre os mesmos dados (com diferentes parâmetros) de forma independente. Além da metodologia, realiza-se um estudo comparativo entre alguns algoritmos de agrupamento, inclusive apresentando-se um novo algoritmo mais eficiente. Este fato é comprovado em experimentos realizados nos diversos estudos de caso propostos. Outras contribuições deste trabalho incluem a implementação de uma ferramenta de agrupamento de textos que utiliza a metodologia elaborada e os algoritmos estudados; além da utilização de uma fórmula não convencional de cálculo de similaridades entre objetos (de abordagem fuzzy), aplicada a informações textuais, obtendo resultados satisfatórios.The Internet is the vital media of today and, as being a mass media, problems known before to specific fields of Science arise. One of these problems, capable of annoying many people, is the information overload problem caused by the excessive amount of information returned in response to the user’s query. Due to the information overload problem, advanced techniques for information retrieval and analysis are needed. This study presents some aids in these fields, presenting a methodology to help users to apply the clustering process in textual data. The technique investigated is capable of grouping documents of several subjects in clusters of documents of the same subject. The groups identified can be used to simplify the process of information analysis and retrieval. This study also presents a tool that was created using the methodology and the algorithms analyzed. The tool was implemented to facilitate the process of investigation and demonstration of the study. The results of the application of a fuzzy formula, used to calculate the similarity among documents, are also presented.application/pdfporArmazenamento : DadosRecuperacao : InformacaoDescoberta : ConhecimentoAgrupamento : Informacao textualClusteringKnowledge discovery from textsInformation retrievalUm estudo sobre agrupamento de documentos textuais em processamento de informações não estruturadas usando técnicas de "clustering"A study about arrangement of textual documents applied to unstructured information processing using clustering techniques info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de InformáticaPrograma de Pós-Graduação em ComputaçãoPorto Alegre, BR-RS1999mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSORIGINAL000102235.pdf000102235.pdfTexto completoapplication/pdf458771http://www.lume.ufrgs.br/bitstream/10183/25933/1/000102235.pdfc60ecd2ad60a587f631bc450ed794443MD51TEXT000102235.pdf.txt000102235.pdf.txtExtracted Texttext/plain203780http://www.lume.ufrgs.br/bitstream/10183/25933/2/000102235.pdf.txt29f1b14805eaf2a6006eacc0c559beb9MD52THUMBNAIL000102235.pdf.jpg000102235.pdf.jpgGenerated Thumbnailimage/jpeg1113http://www.lume.ufrgs.br/bitstream/10183/25933/3/000102235.pdf.jpg387b64919dd84703ae00dac6364bf7aaMD5310183/259332018-10-09 08:25:27.809oai:www.lume.ufrgs.br:10183/25933Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br\|\|lume@ufrgs.bropendoar:18532018-10-09T11:25:27Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv	Um estudo sobre agrupamento de documentos textuais em processamento de informações não estruturadas usando técnicas de "clustering"
dc.title.alternative.en.fl_str_mv	A study about arrangement of textual documents applied to unstructured information processing using clustering techniques
title	Um estudo sobre agrupamento de documentos textuais em processamento de informações não estruturadas usando técnicas de "clustering"
spellingShingle	Um estudo sobre agrupamento de documentos textuais em processamento de informações não estruturadas usando técnicas de "clustering" Wives, Leandro Krug Armazenamento : Dados Recuperacao : Informacao Descoberta : Conhecimento Agrupamento : Informacao textual Clustering Knowledge discovery from texts Information retrieval
title_short	Um estudo sobre agrupamento de documentos textuais em processamento de informações não estruturadas usando técnicas de "clustering"
title_full	Um estudo sobre agrupamento de documentos textuais em processamento de informações não estruturadas usando técnicas de "clustering"
title_fullStr	Um estudo sobre agrupamento de documentos textuais em processamento de informações não estruturadas usando técnicas de "clustering"
title_full_unstemmed	Um estudo sobre agrupamento de documentos textuais em processamento de informações não estruturadas usando técnicas de "clustering"
title_sort	Um estudo sobre agrupamento de documentos textuais em processamento de informações não estruturadas usando técnicas de "clustering"
author	Wives, Leandro Krug
author_facet	Wives, Leandro Krug
author_role	author
dc.contributor.author.fl_str_mv	Wives, Leandro Krug
dc.contributor.advisor1.fl_str_mv	Oliveira, Jose Palazzo Moreira de Castilho, Jose Mauro Volkmer de
contributor_str_mv	Oliveira, Jose Palazzo Moreira de Castilho, Jose Mauro Volkmer de
dc.subject.por.fl_str_mv	Armazenamento : Dados Recuperacao : Informacao Descoberta : Conhecimento Agrupamento : Informacao textual
topic	Armazenamento : Dados Recuperacao : Informacao Descoberta : Conhecimento Agrupamento : Informacao textual Clustering Knowledge discovery from texts Information retrieval
dc.subject.eng.fl_str_mv	Clustering Knowledge discovery from texts Information retrieval
description	Atualmente, técnicas de recuperação e análise de informações, principalmente textuais, são de extrema importância. Após o grande BOOM da Internet, muitos problemas que já eram conhecidos em contextos fechados passaram a preocupar também toda a comunidade científica. No âmbito deste trabalho os problemas relacionados à sobrecarga de informações, que ocorre devido ao grande volume de dados a disposição de uma pessoa, são os mais importantes. Visando minimizar estes problemas, este trabalho apresenta um estudo sobre métodos de agrupamento de objetos textuais (documentos no formato ASCII), onde os objetos são organizados automaticamente em grupos de objetos similares, facilitando sua localização, manipulação e análise. Decorrente deste estudo, apresenta-se uma metodologia de aplicação do agrupamento descrevendo-se suas diversas etapas. Estas etapas foram desenvolvidas de maneira que após uma ter sido realizada ela não precisa ser refeita, permitindo que a etapa seguinte seja aplicada diversas vezes sobre os mesmos dados (com diferentes parâmetros) de forma independente. Além da metodologia, realiza-se um estudo comparativo entre alguns algoritmos de agrupamento, inclusive apresentando-se um novo algoritmo mais eficiente. Este fato é comprovado em experimentos realizados nos diversos estudos de caso propostos. Outras contribuições deste trabalho incluem a implementação de uma ferramenta de agrupamento de textos que utiliza a metodologia elaborada e os algoritmos estudados; além da utilização de uma fórmula não convencional de cálculo de similaridades entre objetos (de abordagem fuzzy), aplicada a informações textuais, obtendo resultados satisfatórios.
publishDate	1999
dc.date.issued.fl_str_mv	1999
dc.date.accessioned.fl_str_mv	2010-09-23T04:18:49Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://hdl.handle.net/10183/25933
dc.identifier.nrb.pt_BR.fl_str_mv	000102235
url	http://hdl.handle.net/10183/25933
identifier_str_mv	000102235
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS
instname_str	Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str	UFRGS
institution	UFRGS
reponame_str	Biblioteca Digital de Teses e Dissertações da UFRGS
collection	Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv	http://www.lume.ufrgs.br/bitstream/10183/25933/1/000102235.pdf http://www.lume.ufrgs.br/bitstream/10183/25933/2/000102235.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/25933/3/000102235.pdf.jpg
bitstream.checksum.fl_str_mv	c60ecd2ad60a587f631bc450ed794443 29f1b14805eaf2a6006eacc0c559beb9 387b64919dd84703ae00dac6364bf7aa
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5 MD5
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv	lume@ufrgs.br\|\|lume@ufrgs.br
_version_	1831315882280747008

Um estudo sobre agrupamento de documentos textuais em processamento de informações não estruturadas usando técnicas de "clustering"

Registros relacionados