Agrupamento automático baseado em autoridade e conteúdo

Detalhes bibliográficos
Ano de defesa: 2005
Autor(a) principal: Prado, Ana Carolina do
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Uberlândia
Brasil
Programa de Pós-graduação em Ciência da Computação
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
AAL
Link de acesso: https://repositorio.ufu.br/handle/123456789/19558
Resumo: This dissertation introduces a technique of clustering analysis that combines concepts of document similarities by contents with link information. The Classic Vector Model is used to carry out the calculation of the similarities between the documents and a link analysis algorithm that is used to get the value of the authority of each document. Calculating the values of the local authorities from the documents belonging to each one of the groups and employing the biggest local authority as the reassign the cluster, we have redistribution of the documents to the clusters. This combination provides clusters represented by the best authority in that subject. This algorithm, called Local Authority Clustering, was proposed, introduced and the quality of its results was evaluated through comparison with the traditional K-means. The AAL has the link structures of the Web as definite from the characteristics that will be used to clustering the documents with several applications in this environment, as the identification of the clusters in a large collection of pages to minimize the search or even to gather together the result of the search generating different clusters of documents.
id UFU_43e7d9cf4b9d7ea6bc784392fb826eb7
oai_identifier_str oai:repositorio.ufu.br:123456789/19558
network_acronym_str UFU
network_name_str Repositório Institucional da UFU
repository_id_str
spelling Agrupamento automático baseado em autoridade e conteúdoAgrupamento não supervisionadoAgrupamento por autoridade localGrupoRecuperação de informaçãoAALLocal authority clusteringClusteringClusterInformation fetrievalLink analysisCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOThis dissertation introduces a technique of clustering analysis that combines concepts of document similarities by contents with link information. The Classic Vector Model is used to carry out the calculation of the similarities between the documents and a link analysis algorithm that is used to get the value of the authority of each document. Calculating the values of the local authorities from the documents belonging to each one of the groups and employing the biggest local authority as the reassign the cluster, we have redistribution of the documents to the clusters. This combination provides clusters represented by the best authority in that subject. This algorithm, called Local Authority Clustering, was proposed, introduced and the quality of its results was evaluated through comparison with the traditional K-means. The AAL has the link structures of the Web as definite from the characteristics that will be used to clustering the documents with several applications in this environment, as the identification of the clusters in a large collection of pages to minimize the search or even to gather together the result of the search generating different clusters of documents.Dissertação (Mestrado)Esta dissertação apresenta uma técnica de análise de agrupamentos que combina conceitos de similaridade de documentos por conteúdo com informações de ligacoes. O Modelo Vetorial Clássico e utilizado para efetuar o cálculo de similaridades entre os documentos e um algoritmo de analise de ligacoes e utilizado para obter o valor de autoridade de cada documento. Calculam-se os valores das autoridades locais dos documentos pertencentes a cada um dos grupos e, nomeando a maior autoridade local como representante do grupo, temos uma redistribuicão dos documentos nos grupos. Essa combinaçao possibilita a obtençao de grupos onde, quem melhor o representa e a maior autoridade daquele assunto. Esse algoritmo, chamado de Agrupamento por Autoridade Local (AAL), foi proposto, implementado e a qualidade do agrupamento resultante foi avaliada atraves de comparaçcãao com o metodo de agrupamento tradicional k-medias. O AAL possui a estrutura de ligaçoes da Web como definidora das características que serao utilizadas para agrupar os documentos, trazendo consigo inuámeras aplicaçcãoes nesse ambiente, como identificacao de grupos em uma grande colecão de paginas com o intuito de minimizar o escopo da busca, ou ate mesmo agrupar o resultado de pesquisa realizada, gerando grupos distintos de documentos.Universidade Federal de UberlândiaBrasilPrograma de Pós-graduação em Ciência da ComputaçãoSouza, João Nunes dehttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4781313D9Silva, Ilmério Reis dahttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4760865T7Meira Júnior, Wagnerhttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4798498T5Lopes, Carlos Robertohttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788535Z4Prado, Ana Carolina do2017-08-22T13:27:00Z2017-08-22T13:27:00Z2005-08-09info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfPRADO, Ana Carolina do. Agrupamento automático baseado em autoridade e conteúdo. 2005. 87 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2005.https://repositorio.ufu.br/handle/123456789/19558porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFUinstname:Universidade Federal de Uberlândia (UFU)instacron:UFU2022-10-07T06:00:32Zoai:repositorio.ufu.br:123456789/19558Repositório InstitucionalONGhttp://repositorio.ufu.br/oai/requestdiinf@dirbi.ufu.bropendoar:2022-10-07T06:00:32Repositório Institucional da UFU - Universidade Federal de Uberlândia (UFU)false
dc.title.none.fl_str_mv Agrupamento automático baseado em autoridade e conteúdo
title Agrupamento automático baseado em autoridade e conteúdo
spellingShingle Agrupamento automático baseado em autoridade e conteúdo
Prado, Ana Carolina do
Agrupamento não supervisionado
Agrupamento por autoridade local
Grupo
Recuperação de informação
AAL
Local authority clustering
Clustering
Cluster
Information fetrieval
Link analysis
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Agrupamento automático baseado em autoridade e conteúdo
title_full Agrupamento automático baseado em autoridade e conteúdo
title_fullStr Agrupamento automático baseado em autoridade e conteúdo
title_full_unstemmed Agrupamento automático baseado em autoridade e conteúdo
title_sort Agrupamento automático baseado em autoridade e conteúdo
author Prado, Ana Carolina do
author_facet Prado, Ana Carolina do
author_role author
dc.contributor.none.fl_str_mv Souza, João Nunes de
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4781313D9
Silva, Ilmério Reis da
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4760865T7
Meira Júnior, Wagner
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4798498T5
Lopes, Carlos Roberto
http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788535Z4
dc.contributor.author.fl_str_mv Prado, Ana Carolina do
dc.subject.por.fl_str_mv Agrupamento não supervisionado
Agrupamento por autoridade local
Grupo
Recuperação de informação
AAL
Local authority clustering
Clustering
Cluster
Information fetrieval
Link analysis
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic Agrupamento não supervisionado
Agrupamento por autoridade local
Grupo
Recuperação de informação
AAL
Local authority clustering
Clustering
Cluster
Information fetrieval
Link analysis
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description This dissertation introduces a technique of clustering analysis that combines concepts of document similarities by contents with link information. The Classic Vector Model is used to carry out the calculation of the similarities between the documents and a link analysis algorithm that is used to get the value of the authority of each document. Calculating the values of the local authorities from the documents belonging to each one of the groups and employing the biggest local authority as the reassign the cluster, we have redistribution of the documents to the clusters. This combination provides clusters represented by the best authority in that subject. This algorithm, called Local Authority Clustering, was proposed, introduced and the quality of its results was evaluated through comparison with the traditional K-means. The AAL has the link structures of the Web as definite from the characteristics that will be used to clustering the documents with several applications in this environment, as the identification of the clusters in a large collection of pages to minimize the search or even to gather together the result of the search generating different clusters of documents.
publishDate 2005
dc.date.none.fl_str_mv 2005-08-09
2017-08-22T13:27:00Z
2017-08-22T13:27:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv PRADO, Ana Carolina do. Agrupamento automático baseado em autoridade e conteúdo. 2005. 87 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2005.
https://repositorio.ufu.br/handle/123456789/19558
identifier_str_mv PRADO, Ana Carolina do. Agrupamento automático baseado em autoridade e conteúdo. 2005. 87 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Uberlândia, Uberlândia, 2005.
url https://repositorio.ufu.br/handle/123456789/19558
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Uberlândia
Brasil
Programa de Pós-graduação em Ciência da Computação
publisher.none.fl_str_mv Universidade Federal de Uberlândia
Brasil
Programa de Pós-graduação em Ciência da Computação
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFU
instname:Universidade Federal de Uberlândia (UFU)
instacron:UFU
instname_str Universidade Federal de Uberlândia (UFU)
instacron_str UFU
institution UFU
reponame_str Repositório Institucional da UFU
collection Repositório Institucional da UFU
repository.name.fl_str_mv Repositório Institucional da UFU - Universidade Federal de Uberlândia (UFU)
repository.mail.fl_str_mv diinf@dirbi.ufu.br
_version_ 1827843523366354944