Caracterização de grupos baseada em informações relacionais

Detalhes bibliográficos
Ano de defesa: 2018
Autor(a) principal: GOMES, João Emanoel Ambrósio
Orientador(a): PRUDÊNCIO, Ricardo Bastos Cavalcante
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
Programa de Pós-Graduação: Programa de Pos Graduacao em Ciencia da Computacao
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/33641
Resumo: Com o crescimento das redes sociais, diversas pesquisas vêm sendo realizadas para entendimento de suas estruturas. A análise e a extração de conhecimento das redes são largamente empregadas, dentre as investigações a compreensão do comportamento e das tendências das comunidades é uma atividade estratégica. Grande parte desse esforço está direcionado à detecção dos agrupamentos implícitos nas redes, detecção de comunidades; entretanto igualmente relevante é a atividade de rotulagem dos grupos, denominada caracterização de comunidades. Essa visa à descrição das comunidades a partir dos atributos individuais dos usuários. Entre as principais características dos métodos atuais de caracterização grupos, temos: (1) caracterização baseada apenas nos atributos dos usuários, (2) níveis de relevâncias equivalentes a todos os usuários e (3) consideração de todos os usuários da comunidade na caracterização. Todavia, em ambientes nos quais haja conexões entre seus usuários, como as redes sociais, uma nova dimensão de informação se apresenta, através da análise dos relacionamentos e afinidades entre os usuários (informação relacional). Presumivelmente, todas as comunidades têm os seus usuários influentes. Esses são os líderes de opinião, e podem desempenhar um papel mais importante para refletir as peculiaridades de uma comunidade. Tratar a escalabilidade das redes tende a ser um dos principais desafios das abordagens de caracterização de grupos, pois essa propriedade reflete diretamente na complexidade de descrição e robustez. Buscando o desenvolvimento de uma abordagem escalável e a incorporação dos benefícios supracitados com o uso das informações relacionais, propomos uma abordagem para caracterização de comunidades sociais baseada em informações relacionais. Assim, foi proposta a adição de uma nova etapa ao processo de caracterização de grupos, essa é responsável por filtrar os principais nós das comunidades a partir das informações relacionais (centralidade), ou seja, selecionar os nós que serão considerados no processo de caracterização dos grupos. O propósito é selecionar os nós, que representem/generalizem as comunidades, produzindo os melhores perfis possíveis, sem perdas de informações relevantes. Definiu-se como estudo de caso para esta tese as redes de coautoria, mais precisamente utilizou-se a biblioteca arXiv. Descrever comunidades acadêmicas é algo fundamental, proporcionando entendimento e acompanhamento das pesquisas, bem como a verificação das mudanças de temas nas comunidades. Os resultados, obtidos em três experimentos, demonstraram a capacidade da abordagem proposta na produção de perfis descritivos para os grupos observados, tanto fazendo uso de métodos de caracterização de grupos como de rotulagem de agrupamentos em documentos, com um custo computacional consideravelmente menor.
id UFPE_d85fb5c45c8537aa14a66ddac249a57f
oai_identifier_str oai:repositorio.ufpe.br:123456789/33641
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str
spelling GOMES, João Emanoel Ambrósiohttp://lattes.cnpq.br/4494150663121260http://lattes.cnpq.br/2984888073123287PRUDÊNCIO, Ricardo Bastos Cavalcante2019-09-25T20:15:14Z2019-09-25T20:15:14Z2018-12-13https://repositorio.ufpe.br/handle/123456789/33641Com o crescimento das redes sociais, diversas pesquisas vêm sendo realizadas para entendimento de suas estruturas. A análise e a extração de conhecimento das redes são largamente empregadas, dentre as investigações a compreensão do comportamento e das tendências das comunidades é uma atividade estratégica. Grande parte desse esforço está direcionado à detecção dos agrupamentos implícitos nas redes, detecção de comunidades; entretanto igualmente relevante é a atividade de rotulagem dos grupos, denominada caracterização de comunidades. Essa visa à descrição das comunidades a partir dos atributos individuais dos usuários. Entre as principais características dos métodos atuais de caracterização grupos, temos: (1) caracterização baseada apenas nos atributos dos usuários, (2) níveis de relevâncias equivalentes a todos os usuários e (3) consideração de todos os usuários da comunidade na caracterização. Todavia, em ambientes nos quais haja conexões entre seus usuários, como as redes sociais, uma nova dimensão de informação se apresenta, através da análise dos relacionamentos e afinidades entre os usuários (informação relacional). Presumivelmente, todas as comunidades têm os seus usuários influentes. Esses são os líderes de opinião, e podem desempenhar um papel mais importante para refletir as peculiaridades de uma comunidade. Tratar a escalabilidade das redes tende a ser um dos principais desafios das abordagens de caracterização de grupos, pois essa propriedade reflete diretamente na complexidade de descrição e robustez. Buscando o desenvolvimento de uma abordagem escalável e a incorporação dos benefícios supracitados com o uso das informações relacionais, propomos uma abordagem para caracterização de comunidades sociais baseada em informações relacionais. Assim, foi proposta a adição de uma nova etapa ao processo de caracterização de grupos, essa é responsável por filtrar os principais nós das comunidades a partir das informações relacionais (centralidade), ou seja, selecionar os nós que serão considerados no processo de caracterização dos grupos. O propósito é selecionar os nós, que representem/generalizem as comunidades, produzindo os melhores perfis possíveis, sem perdas de informações relevantes. Definiu-se como estudo de caso para esta tese as redes de coautoria, mais precisamente utilizou-se a biblioteca arXiv. Descrever comunidades acadêmicas é algo fundamental, proporcionando entendimento e acompanhamento das pesquisas, bem como a verificação das mudanças de temas nas comunidades. Os resultados, obtidos em três experimentos, demonstraram a capacidade da abordagem proposta na produção de perfis descritivos para os grupos observados, tanto fazendo uso de métodos de caracterização de grupos como de rotulagem de agrupamentos em documentos, com um custo computacional consideravelmente menor.CNPqWith the growth of social networks, several types of research have been carried out to understand their structures. Knowledge analysis and extraction of networks are widely used, among investigations understanding the behavior and trends of communities is a strategic activity. Much of this effort is directed to the detection of implicit groupings in networks, community detection; however, equally relevant is the communities labeling task, called group profiling. It aims at describing communities from the individual attributes of users. Among the main characteristics of the current group profiling methods, we have (1) characterization based only on the attributes of the users, (2) levels of relevancy equivalent to all users and (3) consideration of all users of the community in the characterization. However, in environments where there are connections between users, such as social networks, a new dimension of information is presented, through the analysis of relationships and affinities between users (relational information). Presumably, all communities have their influential users. These are opinion leaders, and they can play a more important role in reflecting the peculiarities of a community. Treating network scalability tends to be one of the main challenges of group profiling approaches, as this property directly reflects the complexity of description and robustness. Looking for the development of a scalable approach and incorporating the benefits mentioned above with the use of relational information, we propose an approach for group profiling based on the relational information. Thus, it was proposed to add a new stage to the group profiling process, which is responsible for filtering the main nodes of the communities from the relational information (centrality), that is, to select the nodes that will be considered in the group profiling process. The purpose is to select the nodes, which represent/generalize the communities, producing the best possible profiles, without loss of relevant information. The co-authoring networks were defined as a case study for this thesis, more precisely the arXiv library was used. Describing academic communities is fundamental, providing understanding and monitoring of research, as well as verifying the changes of themes in the communities. The results, obtained in three experiments, demonstrated the ability of the proposed approach to producing descriptive profiles for the observed groups, using group profiling methods and cluster labeling, with a considerably lower computational cost.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em Ciencia da ComputacaoUFPEBrasilAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessInteligência artificialInformações relacionaisCaracterização de grupos baseada em informações relacionaisinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisdoutoradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPETHUMBNAILTESE João Emanoel Ambrósio Gomes.pdf.jpgTESE João Emanoel Ambrósio Gomes.pdf.jpgGenerated Thumbnailimage/jpeg1218https://repositorio.ufpe.br/bitstream/123456789/33641/5/TESE%20Jo%c3%a3o%20Emanoel%20Ambr%c3%b3sio%20Gomes.pdf.jpg9f3651364cd1fdc7bb06a1817b6feeb6MD55ORIGINALTESE João Emanoel Ambrósio Gomes.pdfTESE João Emanoel Ambrósio Gomes.pdfapplication/pdf3590018https://repositorio.ufpe.br/bitstream/123456789/33641/1/TESE%20Jo%c3%a3o%20Emanoel%20Ambr%c3%b3sio%20Gomes.pdfe35b07674c2622109783754f81732e3fMD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufpe.br/bitstream/123456789/33641/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82310https://repositorio.ufpe.br/bitstream/123456789/33641/3/license.txtbd573a5ca8288eb7272482765f819534MD53TEXTTESE João Emanoel Ambrósio Gomes.pdf.txtTESE João Emanoel Ambrósio Gomes.pdf.txtExtracted texttext/plain308927https://repositorio.ufpe.br/bitstream/123456789/33641/4/TESE%20Jo%c3%a3o%20Emanoel%20Ambr%c3%b3sio%20Gomes.pdf.txt20a8fa33502d77e1dd3fece47df16316MD54123456789/336412019-10-25 06:51:00.529oai:repositorio.ufpe.br:123456789/33641TGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKClRvZG8gZGVwb3NpdGFudGUgZGUgbWF0ZXJpYWwgbm8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgKFJJKSBkZXZlIGNvbmNlZGVyLCDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIChVRlBFKSwgdW1hIExpY2Vuw6dhIGRlIERpc3RyaWJ1acOnw6NvIE7Do28gRXhjbHVzaXZhIHBhcmEgbWFudGVyIGUgdG9ybmFyIGFjZXNzw612ZWlzIG9zIHNldXMgZG9jdW1lbnRvcywgZW0gZm9ybWF0byBkaWdpdGFsLCBuZXN0ZSByZXBvc2l0w7NyaW8uCgpDb20gYSBjb25jZXNzw6NvIGRlc3RhIGxpY2Vuw6dhIG7Do28gZXhjbHVzaXZhLCBvIGRlcG9zaXRhbnRlIG1hbnTDqW0gdG9kb3Mgb3MgZGlyZWl0b3MgZGUgYXV0b3IuCl9fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fXwoKTGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKCkFvIGNvbmNvcmRhciBjb20gZXN0YSBsaWNlbsOnYSBlIGFjZWl0w6EtbGEsIHZvY8OqIChhdXRvciBvdSBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMpOgoKYSkgRGVjbGFyYSBxdWUgY29uaGVjZSBhIHBvbMOtdGljYSBkZSBjb3B5cmlnaHQgZGEgZWRpdG9yYSBkbyBzZXUgZG9jdW1lbnRvOwpiKSBEZWNsYXJhIHF1ZSBjb25oZWNlIGUgYWNlaXRhIGFzIERpcmV0cml6ZXMgcGFyYSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGUEU7CmMpIENvbmNlZGUgw6AgVUZQRSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZGUgYXJxdWl2YXIsIHJlcHJvZHV6aXIsIGNvbnZlcnRlciAoY29tbyBkZWZpbmlkbyBhIHNlZ3VpciksIGNvbXVuaWNhciBlL291IGRpc3RyaWJ1aXIsIG5vIFJJLCBvIGRvY3VtZW50byBlbnRyZWd1ZSAoaW5jbHVpbmRvIG8gcmVzdW1vL2Fic3RyYWN0KSBlbSBmb3JtYXRvIGRpZ2l0YWwgb3UgcG9yIG91dHJvIG1laW87CmQpIERlY2xhcmEgcXVlIGF1dG9yaXphIGEgVUZQRSBhIGFycXVpdmFyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXN0ZSBkb2N1bWVudG8gZSBjb252ZXJ0w6otbG8sIHNlbSBhbHRlcmFyIG8gc2V1IGNvbnRlw7pkbywgcGFyYSBxdWFscXVlciBmb3JtYXRvIGRlIGZpY2hlaXJvLCBtZWlvIG91IHN1cG9ydGUsIHBhcmEgZWZlaXRvcyBkZSBzZWd1cmFuw6dhLCBwcmVzZXJ2YcOnw6NvIChiYWNrdXApIGUgYWNlc3NvOwplKSBEZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBzdWJtZXRpZG8gw6kgbyBzZXUgdHJhYmFsaG8gb3JpZ2luYWwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBhIHRlcmNlaXJvcyBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2Ugb3MgZGlyZWl0b3MgZGUgb3V0cmEgcGVzc29hIG91IGVudGlkYWRlOwpmKSBEZWNsYXJhIHF1ZSwgbm8gY2FzbyBkbyBkb2N1bWVudG8gc3VibWV0aWRvIGNvbnRlciBtYXRlcmlhbCBkbyBxdWFsIG7Do28gZGV0w6ltIG9zIGRpcmVpdG9zIGRlCmF1dG9yLCBvYnRldmUgYSBhdXRvcml6YcOnw6NvIGlycmVzdHJpdGEgZG8gcmVzcGVjdGl2byBkZXRlbnRvciBkZXNzZXMgZGlyZWl0b3MgcGFyYSBjZWRlciDDoApVRlBFIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgTGljZW7Dp2EgZSBhdXRvcml6YXIgYSB1bml2ZXJzaWRhZGUgYSB1dGlsaXrDoS1sb3MgbGVnYWxtZW50ZS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBlc3NlIG1hdGVyaWFsIGN1am9zIGRpcmVpdG9zIHPDo28gZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvIGRvIGRvY3VtZW50byBlbnRyZWd1ZTsKZykgU2UgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgYmFzZWFkbyBlbSB0cmFiYWxobyBmaW5hbmNpYWRvIG91IGFwb2lhZG8gcG9yIG91dHJhIGluc3RpdHVpw6fDo28gcXVlIG7Do28gYSBVRlBFLCBkZWNsYXJhIHF1ZSBjdW1wcml1IHF1YWlzcXVlciBvYnJpZ2HDp8O1ZXMgZXhpZ2lkYXMgcGVsbyByZXNwZWN0aXZvIGNvbnRyYXRvIG91IGFjb3Jkby4KCkEgVUZQRSBpZGVudGlmaWNhcsOhIGNsYXJhbWVudGUgbyhzKSBub21lKHMpIGRvKHMpIGF1dG9yIChlcykgZG9zIGRpcmVpdG9zIGRvIGRvY3VtZW50byBlbnRyZWd1ZSBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIHBhcmEgYWzDqW0gZG8gcHJldmlzdG8gbmEgYWzDrW5lYSBjKS4KRepositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212019-10-25T09:51Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.pt_BR.fl_str_mv Caracterização de grupos baseada em informações relacionais
title Caracterização de grupos baseada em informações relacionais
spellingShingle Caracterização de grupos baseada em informações relacionais
GOMES, João Emanoel Ambrósio
Inteligência artificial
Informações relacionais
title_short Caracterização de grupos baseada em informações relacionais
title_full Caracterização de grupos baseada em informações relacionais
title_fullStr Caracterização de grupos baseada em informações relacionais
title_full_unstemmed Caracterização de grupos baseada em informações relacionais
title_sort Caracterização de grupos baseada em informações relacionais
author GOMES, João Emanoel Ambrósio
author_facet GOMES, João Emanoel Ambrósio
author_role author
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/4494150663121260
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/2984888073123287
dc.contributor.author.fl_str_mv GOMES, João Emanoel Ambrósio
dc.contributor.advisor1.fl_str_mv PRUDÊNCIO, Ricardo Bastos Cavalcante
contributor_str_mv PRUDÊNCIO, Ricardo Bastos Cavalcante
dc.subject.por.fl_str_mv Inteligência artificial
Informações relacionais
topic Inteligência artificial
Informações relacionais
description Com o crescimento das redes sociais, diversas pesquisas vêm sendo realizadas para entendimento de suas estruturas. A análise e a extração de conhecimento das redes são largamente empregadas, dentre as investigações a compreensão do comportamento e das tendências das comunidades é uma atividade estratégica. Grande parte desse esforço está direcionado à detecção dos agrupamentos implícitos nas redes, detecção de comunidades; entretanto igualmente relevante é a atividade de rotulagem dos grupos, denominada caracterização de comunidades. Essa visa à descrição das comunidades a partir dos atributos individuais dos usuários. Entre as principais características dos métodos atuais de caracterização grupos, temos: (1) caracterização baseada apenas nos atributos dos usuários, (2) níveis de relevâncias equivalentes a todos os usuários e (3) consideração de todos os usuários da comunidade na caracterização. Todavia, em ambientes nos quais haja conexões entre seus usuários, como as redes sociais, uma nova dimensão de informação se apresenta, através da análise dos relacionamentos e afinidades entre os usuários (informação relacional). Presumivelmente, todas as comunidades têm os seus usuários influentes. Esses são os líderes de opinião, e podem desempenhar um papel mais importante para refletir as peculiaridades de uma comunidade. Tratar a escalabilidade das redes tende a ser um dos principais desafios das abordagens de caracterização de grupos, pois essa propriedade reflete diretamente na complexidade de descrição e robustez. Buscando o desenvolvimento de uma abordagem escalável e a incorporação dos benefícios supracitados com o uso das informações relacionais, propomos uma abordagem para caracterização de comunidades sociais baseada em informações relacionais. Assim, foi proposta a adição de uma nova etapa ao processo de caracterização de grupos, essa é responsável por filtrar os principais nós das comunidades a partir das informações relacionais (centralidade), ou seja, selecionar os nós que serão considerados no processo de caracterização dos grupos. O propósito é selecionar os nós, que representem/generalizem as comunidades, produzindo os melhores perfis possíveis, sem perdas de informações relevantes. Definiu-se como estudo de caso para esta tese as redes de coautoria, mais precisamente utilizou-se a biblioteca arXiv. Descrever comunidades acadêmicas é algo fundamental, proporcionando entendimento e acompanhamento das pesquisas, bem como a verificação das mudanças de temas nas comunidades. Os resultados, obtidos em três experimentos, demonstraram a capacidade da abordagem proposta na produção de perfis descritivos para os grupos observados, tanto fazendo uso de métodos de caracterização de grupos como de rotulagem de agrupamentos em documentos, com um custo computacional consideravelmente menor.
publishDate 2018
dc.date.issued.fl_str_mv 2018-12-13
dc.date.accessioned.fl_str_mv 2019-09-25T20:15:14Z
dc.date.available.fl_str_mv 2019-09-25T20:15:14Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufpe.br/handle/123456789/33641
url https://repositorio.ufpe.br/handle/123456789/33641
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.publisher.program.fl_str_mv Programa de Pos Graduacao em Ciencia da Computacao
dc.publisher.initials.fl_str_mv UFPE
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
bitstream.url.fl_str_mv https://repositorio.ufpe.br/bitstream/123456789/33641/5/TESE%20Jo%c3%a3o%20Emanoel%20Ambr%c3%b3sio%20Gomes.pdf.jpg
https://repositorio.ufpe.br/bitstream/123456789/33641/1/TESE%20Jo%c3%a3o%20Emanoel%20Ambr%c3%b3sio%20Gomes.pdf
https://repositorio.ufpe.br/bitstream/123456789/33641/2/license_rdf
https://repositorio.ufpe.br/bitstream/123456789/33641/3/license.txt
https://repositorio.ufpe.br/bitstream/123456789/33641/4/TESE%20Jo%c3%a3o%20Emanoel%20Ambr%c3%b3sio%20Gomes.pdf.txt
bitstream.checksum.fl_str_mv 9f3651364cd1fdc7bb06a1817b6feeb6
e35b07674c2622109783754f81732e3f
e39d27027a6cc9cb039ad269a5db8e34
bd573a5ca8288eb7272482765f819534
20a8fa33502d77e1dd3fece47df16316
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1797782253533659136