An algorithm for network community structure detection by Surprise

Pellizzaro, José Antônio

An algorithm for network community structure detection by Surprise

Detalhes bibliográficos
Ano de defesa:	2019
Autor(a) principal:	Pellizzaro, José Antônio
Orientador(a):	Gamermann, Daniel
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Dissertação
Tipo de acesso:	Acesso aberto
Idioma:	eng
Instituição de defesa:	Não Informado pela instituição
Programa de Pós-Graduação:	Não Informado pela instituição
Departamento:	Não Informado pela instituição
País:	Não Informado pela instituição
Palavras-chave em Português:	Grafos Redes Algorítmo
Palavras-chave em Inglês:	Graphs Networks Community Detection Benchmarks Surprise
Link de acesso:	http://hdl.handle.net/10183/206682
Resumo:	O sucesso da teoria dos grafos para descrever sistemas complexos, bem como a onipresença destes, deu muito destaque a elaboração de métodos eficientes para sua analise. No entanto, varias questões continuam em aberto. Uma delas, a qual nos dedicamos neste trabalho, é a obtenção das comunidades presentes nessas redes. Muito embora não exista um consenso formal sobre sua definição, a presença de comunidades vem da ideia intuitiva de que nós formam subgrupos dentro da rede. Neste sentido, muitos algoritmos diferentes foram propostos para identificar tais grupos. Aqui nós atacamos este problema em duas frentes: primeiro, desenvolvemos um novo algoritmo baseado na função Surprise e segundo, criamos um novo benchmark, um conjunto de redes artificiais com comunidades préestabelecidas, para comparar a performance de diferentes algoritmos. O nosso algoritmo, chamado Surpriser, foi testado contra sete outros métodos da literatura em três benchmarks diferentes. Nós mostramos que métodos baseados na Surprise são os mais consistentes nos diferentes benchmarks e que o nosso Surpriser leva uma vantagem sobre os últimos. Finalmente, mostramos que o nosso benchmark é o mais difícil dos três, pois poucos algoritmos conseguem resolve-lo.

Metadados do item

id	URGS_39ab690d14fac5368d1b212bc31b9deb
oai_identifier_str	oai:www.lume.ufrgs.br:10183/206682
network_acronym_str	URGS
network_name_str	Biblioteca Digital de Teses e Dissertações da UFRGS
repository_id_str
spelling	Pellizzaro, José AntônioGamermann, Daniel2020-03-12T04:13:32Z2019http://hdl.handle.net/10183/206682001111404O sucesso da teoria dos grafos para descrever sistemas complexos, bem como a onipresença destes, deu muito destaque a elaboração de métodos eficientes para sua analise. No entanto, varias questões continuam em aberto. Uma delas, a qual nos dedicamos neste trabalho, é a obtenção das comunidades presentes nessas redes. Muito embora não exista um consenso formal sobre sua definição, a presença de comunidades vem da ideia intuitiva de que nós formam subgrupos dentro da rede. Neste sentido, muitos algoritmos diferentes foram propostos para identificar tais grupos. Aqui nós atacamos este problema em duas frentes: primeiro, desenvolvemos um novo algoritmo baseado na função Surprise e segundo, criamos um novo benchmark, um conjunto de redes artificiais com comunidades préestabelecidas, para comparar a performance de diferentes algoritmos. O nosso algoritmo, chamado Surpriser, foi testado contra sete outros métodos da literatura em três benchmarks diferentes. Nós mostramos que métodos baseados na Surprise são os mais consistentes nos diferentes benchmarks e que o nosso Surpriser leva uma vantagem sobre os últimos. Finalmente, mostramos que o nosso benchmark é o mais difícil dos três, pois poucos algoritmos conseguem resolve-lo.The success of network science to describe many complex systems and their ubiquitous presence has brought the development of new, more efficient, methods of analysis to the spotlight. However, some problems still remain open. One of which, the focus of our work, is the determination of a network’s community structure. Even though there’s no consensual formal definition, communities come from the intuitive idea that nodes form subgroups in the larger networks. In this regard, many different algorithms have been proposed in order to identify such groups. Here we tackle this problem in two different fronts: first, we developed a new algorithm based on the Surprise function and secondly, we created a novel benchmark, a set of artificial networks with a seeded community structure, to compare the performance of competing algorithms. Our own Surpriser algorithm was tested against seven other methods from the literature in three different benchmarks. We show that the Surprise based methods are the most consistent among different benchmarks, with Surpriser having an edge over the competition. Finally, we show that our benchmark is the hardest of the three as very few algorithms are able to solve it.application/pdfengGrafosRedesAlgorítmoGraphsNetworksCommunity DetectionBenchmarksSurpriseAn algorithm for network community structure detection by Surpriseinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisUniversidade Federal do Rio Grande do SulInstituto de FísicaPrograma de Pós-Graduação em FísicaPorto Alegre, BR-RS2019mestradoinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT001111404.pdf.txt001111404.pdf.txtExtracted Texttext/plain171375http://www.lume.ufrgs.br/bitstream/10183/206682/2/001111404.pdf.txtec1411583721d843568016f1fe2ef787MD52ORIGINAL001111404.pdfTexto completo (inglês)application/pdf12213290http://www.lume.ufrgs.br/bitstream/10183/206682/1/001111404.pdf79ff2ad217cae9ff99c87586c3968c10MD5110183/2066822022-04-28 04:41:48.201736oai:www.lume.ufrgs.br:10183/206682Biblioteca Digital de Teses e Dissertaçõeshttps://lume.ufrgs.br/handle/10183/2PUBhttps://lume.ufrgs.br/oai/requestlume@ufrgs.br\|\|lume@ufrgs.bropendoar:18532022-04-28T07:41:48Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv	An algorithm for network community structure detection by Surprise
title	An algorithm for network community structure detection by Surprise
spellingShingle	An algorithm for network community structure detection by Surprise Pellizzaro, José Antônio Grafos Redes Algorítmo Graphs Networks Community Detection Benchmarks Surprise
title_short	An algorithm for network community structure detection by Surprise
title_full	An algorithm for network community structure detection by Surprise
title_fullStr	An algorithm for network community structure detection by Surprise
title_full_unstemmed	An algorithm for network community structure detection by Surprise
title_sort	An algorithm for network community structure detection by Surprise
author	Pellizzaro, José Antônio
author_facet	Pellizzaro, José Antônio
author_role	author
dc.contributor.author.fl_str_mv	Pellizzaro, José Antônio
dc.contributor.advisor1.fl_str_mv	Gamermann, Daniel
contributor_str_mv	Gamermann, Daniel
dc.subject.por.fl_str_mv	Grafos Redes Algorítmo
topic	Grafos Redes Algorítmo Graphs Networks Community Detection Benchmarks Surprise
dc.subject.eng.fl_str_mv	Graphs Networks Community Detection Benchmarks Surprise
description	O sucesso da teoria dos grafos para descrever sistemas complexos, bem como a onipresença destes, deu muito destaque a elaboração de métodos eficientes para sua analise. No entanto, varias questões continuam em aberto. Uma delas, a qual nos dedicamos neste trabalho, é a obtenção das comunidades presentes nessas redes. Muito embora não exista um consenso formal sobre sua definição, a presença de comunidades vem da ideia intuitiva de que nós formam subgrupos dentro da rede. Neste sentido, muitos algoritmos diferentes foram propostos para identificar tais grupos. Aqui nós atacamos este problema em duas frentes: primeiro, desenvolvemos um novo algoritmo baseado na função Surprise e segundo, criamos um novo benchmark, um conjunto de redes artificiais com comunidades préestabelecidas, para comparar a performance de diferentes algoritmos. O nosso algoritmo, chamado Surpriser, foi testado contra sete outros métodos da literatura em três benchmarks diferentes. Nós mostramos que métodos baseados na Surprise são os mais consistentes nos diferentes benchmarks e que o nosso Surpriser leva uma vantagem sobre os últimos. Finalmente, mostramos que o nosso benchmark é o mais difícil dos três, pois poucos algoritmos conseguem resolve-lo.
publishDate	2019
dc.date.issued.fl_str_mv	2019
dc.date.accessioned.fl_str_mv	2020-03-12T04:13:32Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://hdl.handle.net/10183/206682
dc.identifier.nrb.pt_BR.fl_str_mv	001111404
url	http://hdl.handle.net/10183/206682
identifier_str_mv	001111404
dc.language.iso.fl_str_mv	eng
language	eng
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS
instname_str	Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str	UFRGS
institution	UFRGS
reponame_str	Biblioteca Digital de Teses e Dissertações da UFRGS
collection	Biblioteca Digital de Teses e Dissertações da UFRGS
bitstream.url.fl_str_mv	http://www.lume.ufrgs.br/bitstream/10183/206682/2/001111404.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/206682/1/001111404.pdf
bitstream.checksum.fl_str_mv	ec1411583721d843568016f1fe2ef787 79ff2ad217cae9ff99c87586c3968c10
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv	lume@ufrgs.br\|\|lume@ufrgs.br
_version_	1831316091676131328

An algorithm for network community structure detection by Surprise

Registros relacionados