Manutenção de clusters semânticos em sistemas de integração de dados em ambientes P2P

Detalhes bibliográficos
Ano de defesa: 2014
Autor(a) principal: Silva, Edemberg Rocha da
Orientador(a): Salgado, Ana Carolina
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/12088
Resumo: O aumento do número de fontes de dados distribuídas, autônomas e heterogêneas (por exemplo, documentos XML, banco de dados relacionais, páginas HTML, entre outros) na Web tem motivado a necessidade de sistemas de integração, que permitam aos usuários consultar essas fontes de forma transparente. Sistemas de integração de dados baseados em arquiteturas P2P (Peer-to-Peer) têm surgido para melhorar o compartilhamento de dados sobre essas fontes de dados. Por convenção, chamamos essas fontes de pontos. Esses sistemas são os Peer-to-PeerData Management Systems (PDMS). Para reduzir o espaço de busca para consultas, assim como reduzir o tempo de resposta de uma consulta e diminuir o tráfego de mensagens na rede, alguns PDMS agrupam seus pontos em clusters. O agrupamento pode ser realizado considerando a similaridade semântica entre os esquemas dos pontos que compõem o sistema. Para isso, esses PDMS utilizam ontologias para representar os esquemas exportados por cada ponto que deseja compartilhar seus dados. Os pontos têm comportamento dinâmico, ou seja, a qualquer momento eles podem modificar seus esquemas e entrar ou sair do PDMS. Esse dinamismo pode modificar o esquema que representa o cluster e, consequentemente, causar um problema o qual chamamos de desbalanceamento semântico dos clusters. Além disso, como os agrupamentos são baseados em similaridade semântica, pode ocorrer a formação de um cluster com um grande número de pontos, sobrecarregando o ponto responsável por gerenciar esse cluster. No entanto, as soluções para o balanceamento de carga em ambientes P2P podem provocar desbalanceamento semântico nos clusters. Em alguns PDMS, os clusters se conectam entre si, se houver similaridade semântica entre eles. Com as modificações dos esquemas dos clusters, novas conexões entre clusters poderão surgir. Neste sentido, faz-se necessário um processo que permita aos clusters encontrarem essas novas conexões. Chamamos esse processo de religação semântica. Dentro desse escopo, o objetivo deste trabalho é apresentar soluções para uma manutenção automática desses clusters. A manutenção ocorre sem a intervenção humana e realiza o balanceamento de carga, o balanceamento semântico dos clusters e a religação semântica, quando necessário.
id UFPE_f262f30592ac0c5d6836c6affcdd717f
oai_identifier_str oai:repositorio.ufpe.br:123456789/12088
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str
spelling Silva, Edemberg Rocha daSalgado, Ana Carolina 2015-03-11T19:38:37Z2015-03-11T19:38:37Z2014-01-31SILVA, Edemberg Rocha da. Manutenção de clusters semânticos em sistemas de integração de dados em ambientes P2P. Recife, 2014. 166 f. Tese (doutorado) - UFPE, Centro de Informática, Programa de Pós-graduação em Ciência da Computação, 2014https://repositorio.ufpe.br/handle/123456789/12088O aumento do número de fontes de dados distribuídas, autônomas e heterogêneas (por exemplo, documentos XML, banco de dados relacionais, páginas HTML, entre outros) na Web tem motivado a necessidade de sistemas de integração, que permitam aos usuários consultar essas fontes de forma transparente. Sistemas de integração de dados baseados em arquiteturas P2P (Peer-to-Peer) têm surgido para melhorar o compartilhamento de dados sobre essas fontes de dados. Por convenção, chamamos essas fontes de pontos. Esses sistemas são os Peer-to-PeerData Management Systems (PDMS). Para reduzir o espaço de busca para consultas, assim como reduzir o tempo de resposta de uma consulta e diminuir o tráfego de mensagens na rede, alguns PDMS agrupam seus pontos em clusters. O agrupamento pode ser realizado considerando a similaridade semântica entre os esquemas dos pontos que compõem o sistema. Para isso, esses PDMS utilizam ontologias para representar os esquemas exportados por cada ponto que deseja compartilhar seus dados. Os pontos têm comportamento dinâmico, ou seja, a qualquer momento eles podem modificar seus esquemas e entrar ou sair do PDMS. Esse dinamismo pode modificar o esquema que representa o cluster e, consequentemente, causar um problema o qual chamamos de desbalanceamento semântico dos clusters. Além disso, como os agrupamentos são baseados em similaridade semântica, pode ocorrer a formação de um cluster com um grande número de pontos, sobrecarregando o ponto responsável por gerenciar esse cluster. No entanto, as soluções para o balanceamento de carga em ambientes P2P podem provocar desbalanceamento semântico nos clusters. Em alguns PDMS, os clusters se conectam entre si, se houver similaridade semântica entre eles. Com as modificações dos esquemas dos clusters, novas conexões entre clusters poderão surgir. Neste sentido, faz-se necessário um processo que permita aos clusters encontrarem essas novas conexões. Chamamos esse processo de religação semântica. Dentro desse escopo, o objetivo deste trabalho é apresentar soluções para uma manutenção automática desses clusters. A manutenção ocorre sem a intervenção humana e realiza o balanceamento de carga, o balanceamento semântico dos clusters e a religação semântica, quando necessário.porUniversidade Federal de PernambucoAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessClusters SemânticosPDMSBalanceamento de CargaBalanceamento SemânticoReligação SemânticaManutenção de ClustersManutenção de clusters semânticos em sistemas de integração de dados em ambientes P2Pinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPETHUMBNAILTESE Edemberg Rocha Da Silva.pdf.jpgTESE Edemberg Rocha Da Silva.pdf.jpgGenerated Thumbnailimage/jpeg1314https://repositorio.ufpe.br/bitstream/123456789/12088/5/TESE%20Edemberg%20Rocha%20Da%20Silva.pdf.jpg734619d299d6c26c63ecfa428a9547feMD55ORIGINALTESE Edemberg Rocha Da Silva.pdfTESE Edemberg Rocha Da Silva.pdfapplication/pdf3549172https://repositorio.ufpe.br/bitstream/123456789/12088/1/TESE%20Edemberg%20Rocha%20Da%20Silva.pdf265bdba827fa427b0cf01929855ba95aMD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81232https://repositorio.ufpe.br/bitstream/123456789/12088/2/license_rdf66e71c371cc565284e70f40736c94386MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82311https://repositorio.ufpe.br/bitstream/123456789/12088/3/license.txt4b8a02c7f2818eaf00dcf2260dd5eb08MD53TEXTTESE Edemberg Rocha Da Silva.pdf.txtTESE Edemberg Rocha Da Silva.pdf.txtExtracted texttext/plain279722https://repositorio.ufpe.br/bitstream/123456789/12088/4/TESE%20Edemberg%20Rocha%20Da%20Silva.pdf.txtc47b251ff00fc2b66632f3d03a1e9365MD54123456789/120882019-10-25 17:14:09.061oai:repositorio.ufpe.br:123456789/12088TGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKClRvZG8gZGVwb3NpdGFudGUgZGUgbWF0ZXJpYWwgbm8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgKFJJKSBkZXZlIGNvbmNlZGVyLCDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIChVRlBFKSwgdW1hIExpY2Vuw6dhIGRlIERpc3RyaWJ1acOnw6NvIE7Do28gRXhjbHVzaXZhIHBhcmEgbWFudGVyIGUgdG9ybmFyIGFjZXNzw612ZWlzIG9zIHNldXMgZG9jdW1lbnRvcywgZW0gZm9ybWF0byBkaWdpdGFsLCBuZXN0ZSByZXBvc2l0w7NyaW8uCgpDb20gYSBjb25jZXNzw6NvIGRlc3RhIGxpY2Vuw6dhIG7Do28gZXhjbHVzaXZhLCBvIGRlcG9zaXRhbnRlIG1hbnTDqW0gdG9kb3Mgb3MgZGlyZWl0b3MgZGUgYXV0b3IuCl9fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fXwoKTGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKCkFvIGNvbmNvcmRhciBjb20gZXN0YSBsaWNlbsOnYSBlIGFjZWl0w6EtbGEsIHZvY8OqIChhdXRvciBvdSBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMpOgoKYSkgRGVjbGFyYSBxdWUgY29uaGVjZSBhIHBvbMOtdGljYSBkZSBjb3B5cmlnaHQgZGEgZWRpdG9yYSBkbyBzZXUgZG9jdW1lbnRvOwpiKSBEZWNsYXJhIHF1ZSBjb25oZWNlIGUgYWNlaXRhIGFzIERpcmV0cml6ZXMgcGFyYSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGUEU7CmMpIENvbmNlZGUgw6AgVUZQRSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZGUgYXJxdWl2YXIsIHJlcHJvZHV6aXIsIGNvbnZlcnRlciAoY29tbyBkZWZpbmlkbyBhIHNlZ3VpciksIGNvbXVuaWNhciBlL291IGRpc3RyaWJ1aXIsIG5vIFJJLCBvIGRvY3VtZW50byBlbnRyZWd1ZSAoaW5jbHVpbmRvIG8gcmVzdW1vL2Fic3RyYWN0KSBlbSBmb3JtYXRvIGRpZ2l0YWwgb3UgcG9yIG91dHJvIG1laW87CmQpIERlY2xhcmEgcXVlIGF1dG9yaXphIGEgVUZQRSBhIGFycXVpdmFyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXN0ZSBkb2N1bWVudG8gZSBjb252ZXJ0w6otbG8sIHNlbSBhbHRlcmFyIG8gc2V1IGNvbnRlw7pkbywgcGFyYSBxdWFscXVlciBmb3JtYXRvIGRlIGZpY2hlaXJvLCBtZWlvIG91IHN1cG9ydGUsIHBhcmEgZWZlaXRvcyBkZSBzZWd1cmFuw6dhLCBwcmVzZXJ2YcOnw6NvIChiYWNrdXApIGUgYWNlc3NvOwplKSBEZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBzdWJtZXRpZG8gw6kgbyBzZXUgdHJhYmFsaG8gb3JpZ2luYWwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBhIHRlcmNlaXJvcyBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2Ugb3MgZGlyZWl0b3MgZGUgb3V0cmEgcGVzc29hIG91IGVudGlkYWRlOwpmKSBEZWNsYXJhIHF1ZSwgbm8gY2FzbyBkbyBkb2N1bWVudG8gc3VibWV0aWRvIGNvbnRlciBtYXRlcmlhbCBkbyBxdWFsIG7Do28gZGV0w6ltIG9zIGRpcmVpdG9zIGRlCmF1dG9yLCBvYnRldmUgYSBhdXRvcml6YcOnw6NvIGlycmVzdHJpdGEgZG8gcmVzcGVjdGl2byBkZXRlbnRvciBkZXNzZXMgZGlyZWl0b3MgcGFyYSBjZWRlciDDoApVRlBFIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgTGljZW7Dp2EgZSBhdXRvcml6YXIgYSB1bml2ZXJzaWRhZGUgYSB1dGlsaXrDoS1sb3MgbGVnYWxtZW50ZS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBlc3NlIG1hdGVyaWFsIGN1am9zIGRpcmVpdG9zIHPDo28gZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvIGRvIGRvY3VtZW50byBlbnRyZWd1ZTsKZykgU2UgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgYmFzZWFkbyBlbSB0cmFiYWxobyBmaW5hbmNpYWRvIG91IGFwb2lhZG8gcG9yIG91dHJhIGluc3RpdHVpw6fDo28gcXVlIG7Do28gYSBVRlBFLMKgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIgb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gcmVzcGVjdGl2byBjb250cmF0byBvdSBhY29yZG8uCgpBIFVGUEUgaWRlbnRpZmljYXLDoSBjbGFyYW1lbnRlIG8ocykgbm9tZShzKSBkbyhzKSBhdXRvciAoZXMpIGRvcyBkaXJlaXRvcyBkbyBkb2N1bWVudG8gZW50cmVndWUgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBwYXJhIGFsw6ltIGRvIHByZXZpc3RvIG5hIGFsw61uZWEgYykuCg==Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212019-10-25T20:14:09Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.pt_BR.fl_str_mv Manutenção de clusters semânticos em sistemas de integração de dados em ambientes P2P
title Manutenção de clusters semânticos em sistemas de integração de dados em ambientes P2P
spellingShingle Manutenção de clusters semânticos em sistemas de integração de dados em ambientes P2P
Silva, Edemberg Rocha da
Clusters Semânticos
PDMS
Balanceamento de Carga
Balanceamento Semântico
Religação Semântica
Manutenção de Clusters
title_short Manutenção de clusters semânticos em sistemas de integração de dados em ambientes P2P
title_full Manutenção de clusters semânticos em sistemas de integração de dados em ambientes P2P
title_fullStr Manutenção de clusters semânticos em sistemas de integração de dados em ambientes P2P
title_full_unstemmed Manutenção de clusters semânticos em sistemas de integração de dados em ambientes P2P
title_sort Manutenção de clusters semânticos em sistemas de integração de dados em ambientes P2P
author Silva, Edemberg Rocha da
author_facet Silva, Edemberg Rocha da
author_role author
dc.contributor.author.fl_str_mv Silva, Edemberg Rocha da
dc.contributor.advisor1.fl_str_mv Salgado, Ana Carolina
contributor_str_mv Salgado, Ana Carolina
dc.subject.por.fl_str_mv Clusters Semânticos
PDMS
Balanceamento de Carga
Balanceamento Semântico
Religação Semântica
Manutenção de Clusters
topic Clusters Semânticos
PDMS
Balanceamento de Carga
Balanceamento Semântico
Religação Semântica
Manutenção de Clusters
description O aumento do número de fontes de dados distribuídas, autônomas e heterogêneas (por exemplo, documentos XML, banco de dados relacionais, páginas HTML, entre outros) na Web tem motivado a necessidade de sistemas de integração, que permitam aos usuários consultar essas fontes de forma transparente. Sistemas de integração de dados baseados em arquiteturas P2P (Peer-to-Peer) têm surgido para melhorar o compartilhamento de dados sobre essas fontes de dados. Por convenção, chamamos essas fontes de pontos. Esses sistemas são os Peer-to-PeerData Management Systems (PDMS). Para reduzir o espaço de busca para consultas, assim como reduzir o tempo de resposta de uma consulta e diminuir o tráfego de mensagens na rede, alguns PDMS agrupam seus pontos em clusters. O agrupamento pode ser realizado considerando a similaridade semântica entre os esquemas dos pontos que compõem o sistema. Para isso, esses PDMS utilizam ontologias para representar os esquemas exportados por cada ponto que deseja compartilhar seus dados. Os pontos têm comportamento dinâmico, ou seja, a qualquer momento eles podem modificar seus esquemas e entrar ou sair do PDMS. Esse dinamismo pode modificar o esquema que representa o cluster e, consequentemente, causar um problema o qual chamamos de desbalanceamento semântico dos clusters. Além disso, como os agrupamentos são baseados em similaridade semântica, pode ocorrer a formação de um cluster com um grande número de pontos, sobrecarregando o ponto responsável por gerenciar esse cluster. No entanto, as soluções para o balanceamento de carga em ambientes P2P podem provocar desbalanceamento semântico nos clusters. Em alguns PDMS, os clusters se conectam entre si, se houver similaridade semântica entre eles. Com as modificações dos esquemas dos clusters, novas conexões entre clusters poderão surgir. Neste sentido, faz-se necessário um processo que permita aos clusters encontrarem essas novas conexões. Chamamos esse processo de religação semântica. Dentro desse escopo, o objetivo deste trabalho é apresentar soluções para uma manutenção automática desses clusters. A manutenção ocorre sem a intervenção humana e realiza o balanceamento de carga, o balanceamento semântico dos clusters e a religação semântica, quando necessário.
publishDate 2014
dc.date.issued.fl_str_mv 2014-01-31
dc.date.accessioned.fl_str_mv 2015-03-11T19:38:37Z
dc.date.available.fl_str_mv 2015-03-11T19:38:37Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SILVA, Edemberg Rocha da. Manutenção de clusters semânticos em sistemas de integração de dados em ambientes P2P. Recife, 2014. 166 f. Tese (doutorado) - UFPE, Centro de Informática, Programa de Pós-graduação em Ciência da Computação, 2014
dc.identifier.uri.fl_str_mv https://repositorio.ufpe.br/handle/123456789/12088
identifier_str_mv SILVA, Edemberg Rocha da. Manutenção de clusters semânticos em sistemas de integração de dados em ambientes P2P. Recife, 2014. 166 f. Tese (doutorado) - UFPE, Centro de Informática, Programa de Pós-graduação em Ciência da Computação, 2014
url https://repositorio.ufpe.br/handle/123456789/12088
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
bitstream.url.fl_str_mv https://repositorio.ufpe.br/bitstream/123456789/12088/5/TESE%20Edemberg%20Rocha%20Da%20Silva.pdf.jpg
https://repositorio.ufpe.br/bitstream/123456789/12088/1/TESE%20Edemberg%20Rocha%20Da%20Silva.pdf
https://repositorio.ufpe.br/bitstream/123456789/12088/2/license_rdf
https://repositorio.ufpe.br/bitstream/123456789/12088/3/license.txt
https://repositorio.ufpe.br/bitstream/123456789/12088/4/TESE%20Edemberg%20Rocha%20Da%20Silva.pdf.txt
bitstream.checksum.fl_str_mv 734619d299d6c26c63ecfa428a9547fe
265bdba827fa427b0cf01929855ba95a
66e71c371cc565284e70f40736c94386
4b8a02c7f2818eaf00dcf2260dd5eb08
c47b251ff00fc2b66632f3d03a1e9365
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1862741591526998016