Manutenção de clusters semânticos em sistemas de integração de dados em ambientes P2P
| Ano de defesa: | 2014 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de Pernambuco
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://repositorio.ufpe.br/handle/123456789/12088 |
Resumo: | O aumento do número de fontes de dados distribuídas, autônomas e heterogêneas (por exemplo, documentos XML, banco de dados relacionais, páginas HTML, entre outros) na Web tem motivado a necessidade de sistemas de integração, que permitam aos usuários consultar essas fontes de forma transparente. Sistemas de integração de dados baseados em arquiteturas P2P (Peer-to-Peer) têm surgido para melhorar o compartilhamento de dados sobre essas fontes de dados. Por convenção, chamamos essas fontes de pontos. Esses sistemas são os Peer-to-PeerData Management Systems (PDMS). Para reduzir o espaço de busca para consultas, assim como reduzir o tempo de resposta de uma consulta e diminuir o tráfego de mensagens na rede, alguns PDMS agrupam seus pontos em clusters. O agrupamento pode ser realizado considerando a similaridade semântica entre os esquemas dos pontos que compõem o sistema. Para isso, esses PDMS utilizam ontologias para representar os esquemas exportados por cada ponto que deseja compartilhar seus dados. Os pontos têm comportamento dinâmico, ou seja, a qualquer momento eles podem modificar seus esquemas e entrar ou sair do PDMS. Esse dinamismo pode modificar o esquema que representa o cluster e, consequentemente, causar um problema o qual chamamos de desbalanceamento semântico dos clusters. Além disso, como os agrupamentos são baseados em similaridade semântica, pode ocorrer a formação de um cluster com um grande número de pontos, sobrecarregando o ponto responsável por gerenciar esse cluster. No entanto, as soluções para o balanceamento de carga em ambientes P2P podem provocar desbalanceamento semântico nos clusters. Em alguns PDMS, os clusters se conectam entre si, se houver similaridade semântica entre eles. Com as modificações dos esquemas dos clusters, novas conexões entre clusters poderão surgir. Neste sentido, faz-se necessário um processo que permita aos clusters encontrarem essas novas conexões. Chamamos esse processo de religação semântica. Dentro desse escopo, o objetivo deste trabalho é apresentar soluções para uma manutenção automática desses clusters. A manutenção ocorre sem a intervenção humana e realiza o balanceamento de carga, o balanceamento semântico dos clusters e a religação semântica, quando necessário. |
| id |
UFPE_f262f30592ac0c5d6836c6affcdd717f |
|---|---|
| oai_identifier_str |
oai:repositorio.ufpe.br:123456789/12088 |
| network_acronym_str |
UFPE |
| network_name_str |
Repositório Institucional da UFPE |
| repository_id_str |
|
| spelling |
Silva, Edemberg Rocha daSalgado, Ana Carolina 2015-03-11T19:38:37Z2015-03-11T19:38:37Z2014-01-31SILVA, Edemberg Rocha da. Manutenção de clusters semânticos em sistemas de integração de dados em ambientes P2P. Recife, 2014. 166 f. Tese (doutorado) - UFPE, Centro de Informática, Programa de Pós-graduação em Ciência da Computação, 2014https://repositorio.ufpe.br/handle/123456789/12088O aumento do número de fontes de dados distribuídas, autônomas e heterogêneas (por exemplo, documentos XML, banco de dados relacionais, páginas HTML, entre outros) na Web tem motivado a necessidade de sistemas de integração, que permitam aos usuários consultar essas fontes de forma transparente. Sistemas de integração de dados baseados em arquiteturas P2P (Peer-to-Peer) têm surgido para melhorar o compartilhamento de dados sobre essas fontes de dados. Por convenção, chamamos essas fontes de pontos. Esses sistemas são os Peer-to-PeerData Management Systems (PDMS). Para reduzir o espaço de busca para consultas, assim como reduzir o tempo de resposta de uma consulta e diminuir o tráfego de mensagens na rede, alguns PDMS agrupam seus pontos em clusters. O agrupamento pode ser realizado considerando a similaridade semântica entre os esquemas dos pontos que compõem o sistema. Para isso, esses PDMS utilizam ontologias para representar os esquemas exportados por cada ponto que deseja compartilhar seus dados. Os pontos têm comportamento dinâmico, ou seja, a qualquer momento eles podem modificar seus esquemas e entrar ou sair do PDMS. Esse dinamismo pode modificar o esquema que representa o cluster e, consequentemente, causar um problema o qual chamamos de desbalanceamento semântico dos clusters. Além disso, como os agrupamentos são baseados em similaridade semântica, pode ocorrer a formação de um cluster com um grande número de pontos, sobrecarregando o ponto responsável por gerenciar esse cluster. No entanto, as soluções para o balanceamento de carga em ambientes P2P podem provocar desbalanceamento semântico nos clusters. Em alguns PDMS, os clusters se conectam entre si, se houver similaridade semântica entre eles. Com as modificações dos esquemas dos clusters, novas conexões entre clusters poderão surgir. Neste sentido, faz-se necessário um processo que permita aos clusters encontrarem essas novas conexões. Chamamos esse processo de religação semântica. Dentro desse escopo, o objetivo deste trabalho é apresentar soluções para uma manutenção automática desses clusters. A manutenção ocorre sem a intervenção humana e realiza o balanceamento de carga, o balanceamento semântico dos clusters e a religação semântica, quando necessário.porUniversidade Federal de PernambucoAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessClusters SemânticosPDMSBalanceamento de CargaBalanceamento SemânticoReligação SemânticaManutenção de ClustersManutenção de clusters semânticos em sistemas de integração de dados em ambientes P2Pinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPETHUMBNAILTESE Edemberg Rocha Da Silva.pdf.jpgTESE Edemberg Rocha Da Silva.pdf.jpgGenerated Thumbnailimage/jpeg1314https://repositorio.ufpe.br/bitstream/123456789/12088/5/TESE%20Edemberg%20Rocha%20Da%20Silva.pdf.jpg734619d299d6c26c63ecfa428a9547feMD55ORIGINALTESE Edemberg Rocha Da Silva.pdfTESE Edemberg Rocha Da Silva.pdfapplication/pdf3549172https://repositorio.ufpe.br/bitstream/123456789/12088/1/TESE%20Edemberg%20Rocha%20Da%20Silva.pdf265bdba827fa427b0cf01929855ba95aMD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81232https://repositorio.ufpe.br/bitstream/123456789/12088/2/license_rdf66e71c371cc565284e70f40736c94386MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82311https://repositorio.ufpe.br/bitstream/123456789/12088/3/license.txt4b8a02c7f2818eaf00dcf2260dd5eb08MD53TEXTTESE Edemberg Rocha Da Silva.pdf.txtTESE Edemberg Rocha Da Silva.pdf.txtExtracted texttext/plain279722https://repositorio.ufpe.br/bitstream/123456789/12088/4/TESE%20Edemberg%20Rocha%20Da%20Silva.pdf.txtc47b251ff00fc2b66632f3d03a1e9365MD54123456789/120882019-10-25 17:14:09.061oai:repositorio.ufpe.br:123456789/12088TGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKClRvZG8gZGVwb3NpdGFudGUgZGUgbWF0ZXJpYWwgbm8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgKFJJKSBkZXZlIGNvbmNlZGVyLCDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIChVRlBFKSwgdW1hIExpY2Vuw6dhIGRlIERpc3RyaWJ1acOnw6NvIE7Do28gRXhjbHVzaXZhIHBhcmEgbWFudGVyIGUgdG9ybmFyIGFjZXNzw612ZWlzIG9zIHNldXMgZG9jdW1lbnRvcywgZW0gZm9ybWF0byBkaWdpdGFsLCBuZXN0ZSByZXBvc2l0w7NyaW8uCgpDb20gYSBjb25jZXNzw6NvIGRlc3RhIGxpY2Vuw6dhIG7Do28gZXhjbHVzaXZhLCBvIGRlcG9zaXRhbnRlIG1hbnTDqW0gdG9kb3Mgb3MgZGlyZWl0b3MgZGUgYXV0b3IuCl9fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fXwoKTGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKCkFvIGNvbmNvcmRhciBjb20gZXN0YSBsaWNlbsOnYSBlIGFjZWl0w6EtbGEsIHZvY8OqIChhdXRvciBvdSBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMpOgoKYSkgRGVjbGFyYSBxdWUgY29uaGVjZSBhIHBvbMOtdGljYSBkZSBjb3B5cmlnaHQgZGEgZWRpdG9yYSBkbyBzZXUgZG9jdW1lbnRvOwpiKSBEZWNsYXJhIHF1ZSBjb25oZWNlIGUgYWNlaXRhIGFzIERpcmV0cml6ZXMgcGFyYSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGUEU7CmMpIENvbmNlZGUgw6AgVUZQRSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZGUgYXJxdWl2YXIsIHJlcHJvZHV6aXIsIGNvbnZlcnRlciAoY29tbyBkZWZpbmlkbyBhIHNlZ3VpciksIGNvbXVuaWNhciBlL291IGRpc3RyaWJ1aXIsIG5vIFJJLCBvIGRvY3VtZW50byBlbnRyZWd1ZSAoaW5jbHVpbmRvIG8gcmVzdW1vL2Fic3RyYWN0KSBlbSBmb3JtYXRvIGRpZ2l0YWwgb3UgcG9yIG91dHJvIG1laW87CmQpIERlY2xhcmEgcXVlIGF1dG9yaXphIGEgVUZQRSBhIGFycXVpdmFyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXN0ZSBkb2N1bWVudG8gZSBjb252ZXJ0w6otbG8sIHNlbSBhbHRlcmFyIG8gc2V1IGNvbnRlw7pkbywgcGFyYSBxdWFscXVlciBmb3JtYXRvIGRlIGZpY2hlaXJvLCBtZWlvIG91IHN1cG9ydGUsIHBhcmEgZWZlaXRvcyBkZSBzZWd1cmFuw6dhLCBwcmVzZXJ2YcOnw6NvIChiYWNrdXApIGUgYWNlc3NvOwplKSBEZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBzdWJtZXRpZG8gw6kgbyBzZXUgdHJhYmFsaG8gb3JpZ2luYWwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBhIHRlcmNlaXJvcyBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2Ugb3MgZGlyZWl0b3MgZGUgb3V0cmEgcGVzc29hIG91IGVudGlkYWRlOwpmKSBEZWNsYXJhIHF1ZSwgbm8gY2FzbyBkbyBkb2N1bWVudG8gc3VibWV0aWRvIGNvbnRlciBtYXRlcmlhbCBkbyBxdWFsIG7Do28gZGV0w6ltIG9zIGRpcmVpdG9zIGRlCmF1dG9yLCBvYnRldmUgYSBhdXRvcml6YcOnw6NvIGlycmVzdHJpdGEgZG8gcmVzcGVjdGl2byBkZXRlbnRvciBkZXNzZXMgZGlyZWl0b3MgcGFyYSBjZWRlciDDoApVRlBFIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgTGljZW7Dp2EgZSBhdXRvcml6YXIgYSB1bml2ZXJzaWRhZGUgYSB1dGlsaXrDoS1sb3MgbGVnYWxtZW50ZS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBlc3NlIG1hdGVyaWFsIGN1am9zIGRpcmVpdG9zIHPDo28gZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvIGRvIGRvY3VtZW50byBlbnRyZWd1ZTsKZykgU2UgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgYmFzZWFkbyBlbSB0cmFiYWxobyBmaW5hbmNpYWRvIG91IGFwb2lhZG8gcG9yIG91dHJhIGluc3RpdHVpw6fDo28gcXVlIG7Do28gYSBVRlBFLMKgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIgb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gcmVzcGVjdGl2byBjb250cmF0byBvdSBhY29yZG8uCgpBIFVGUEUgaWRlbnRpZmljYXLDoSBjbGFyYW1lbnRlIG8ocykgbm9tZShzKSBkbyhzKSBhdXRvciAoZXMpIGRvcyBkaXJlaXRvcyBkbyBkb2N1bWVudG8gZW50cmVndWUgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBwYXJhIGFsw6ltIGRvIHByZXZpc3RvIG5hIGFsw61uZWEgYykuCg==Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212019-10-25T20:14:09Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false |
| dc.title.pt_BR.fl_str_mv |
Manutenção de clusters semânticos em sistemas de integração de dados em ambientes P2P |
| title |
Manutenção de clusters semânticos em sistemas de integração de dados em ambientes P2P |
| spellingShingle |
Manutenção de clusters semânticos em sistemas de integração de dados em ambientes P2P Silva, Edemberg Rocha da Clusters Semânticos PDMS Balanceamento de Carga Balanceamento Semântico Religação Semântica Manutenção de Clusters |
| title_short |
Manutenção de clusters semânticos em sistemas de integração de dados em ambientes P2P |
| title_full |
Manutenção de clusters semânticos em sistemas de integração de dados em ambientes P2P |
| title_fullStr |
Manutenção de clusters semânticos em sistemas de integração de dados em ambientes P2P |
| title_full_unstemmed |
Manutenção de clusters semânticos em sistemas de integração de dados em ambientes P2P |
| title_sort |
Manutenção de clusters semânticos em sistemas de integração de dados em ambientes P2P |
| author |
Silva, Edemberg Rocha da |
| author_facet |
Silva, Edemberg Rocha da |
| author_role |
author |
| dc.contributor.author.fl_str_mv |
Silva, Edemberg Rocha da |
| dc.contributor.advisor1.fl_str_mv |
Salgado, Ana Carolina |
| contributor_str_mv |
Salgado, Ana Carolina |
| dc.subject.por.fl_str_mv |
Clusters Semânticos PDMS Balanceamento de Carga Balanceamento Semântico Religação Semântica Manutenção de Clusters |
| topic |
Clusters Semânticos PDMS Balanceamento de Carga Balanceamento Semântico Religação Semântica Manutenção de Clusters |
| description |
O aumento do número de fontes de dados distribuídas, autônomas e heterogêneas (por exemplo, documentos XML, banco de dados relacionais, páginas HTML, entre outros) na Web tem motivado a necessidade de sistemas de integração, que permitam aos usuários consultar essas fontes de forma transparente. Sistemas de integração de dados baseados em arquiteturas P2P (Peer-to-Peer) têm surgido para melhorar o compartilhamento de dados sobre essas fontes de dados. Por convenção, chamamos essas fontes de pontos. Esses sistemas são os Peer-to-PeerData Management Systems (PDMS). Para reduzir o espaço de busca para consultas, assim como reduzir o tempo de resposta de uma consulta e diminuir o tráfego de mensagens na rede, alguns PDMS agrupam seus pontos em clusters. O agrupamento pode ser realizado considerando a similaridade semântica entre os esquemas dos pontos que compõem o sistema. Para isso, esses PDMS utilizam ontologias para representar os esquemas exportados por cada ponto que deseja compartilhar seus dados. Os pontos têm comportamento dinâmico, ou seja, a qualquer momento eles podem modificar seus esquemas e entrar ou sair do PDMS. Esse dinamismo pode modificar o esquema que representa o cluster e, consequentemente, causar um problema o qual chamamos de desbalanceamento semântico dos clusters. Além disso, como os agrupamentos são baseados em similaridade semântica, pode ocorrer a formação de um cluster com um grande número de pontos, sobrecarregando o ponto responsável por gerenciar esse cluster. No entanto, as soluções para o balanceamento de carga em ambientes P2P podem provocar desbalanceamento semântico nos clusters. Em alguns PDMS, os clusters se conectam entre si, se houver similaridade semântica entre eles. Com as modificações dos esquemas dos clusters, novas conexões entre clusters poderão surgir. Neste sentido, faz-se necessário um processo que permita aos clusters encontrarem essas novas conexões. Chamamos esse processo de religação semântica. Dentro desse escopo, o objetivo deste trabalho é apresentar soluções para uma manutenção automática desses clusters. A manutenção ocorre sem a intervenção humana e realiza o balanceamento de carga, o balanceamento semântico dos clusters e a religação semântica, quando necessário. |
| publishDate |
2014 |
| dc.date.issued.fl_str_mv |
2014-01-31 |
| dc.date.accessioned.fl_str_mv |
2015-03-11T19:38:37Z |
| dc.date.available.fl_str_mv |
2015-03-11T19:38:37Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
SILVA, Edemberg Rocha da. Manutenção de clusters semânticos em sistemas de integração de dados em ambientes P2P. Recife, 2014. 166 f. Tese (doutorado) - UFPE, Centro de Informática, Programa de Pós-graduação em Ciência da Computação, 2014 |
| dc.identifier.uri.fl_str_mv |
https://repositorio.ufpe.br/handle/123456789/12088 |
| identifier_str_mv |
SILVA, Edemberg Rocha da. Manutenção de clusters semânticos em sistemas de integração de dados em ambientes P2P. Recife, 2014. 166 f. Tese (doutorado) - UFPE, Centro de Informática, Programa de Pós-graduação em Ciência da Computação, 2014 |
| url |
https://repositorio.ufpe.br/handle/123456789/12088 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
| publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco (UFPE) instacron:UFPE |
| instname_str |
Universidade Federal de Pernambuco (UFPE) |
| instacron_str |
UFPE |
| institution |
UFPE |
| reponame_str |
Repositório Institucional da UFPE |
| collection |
Repositório Institucional da UFPE |
| bitstream.url.fl_str_mv |
https://repositorio.ufpe.br/bitstream/123456789/12088/5/TESE%20Edemberg%20Rocha%20Da%20Silva.pdf.jpg https://repositorio.ufpe.br/bitstream/123456789/12088/1/TESE%20Edemberg%20Rocha%20Da%20Silva.pdf https://repositorio.ufpe.br/bitstream/123456789/12088/2/license_rdf https://repositorio.ufpe.br/bitstream/123456789/12088/3/license.txt https://repositorio.ufpe.br/bitstream/123456789/12088/4/TESE%20Edemberg%20Rocha%20Da%20Silva.pdf.txt |
| bitstream.checksum.fl_str_mv |
734619d299d6c26c63ecfa428a9547fe 265bdba827fa427b0cf01929855ba95a 66e71c371cc565284e70f40736c94386 4b8a02c7f2818eaf00dcf2260dd5eb08 c47b251ff00fc2b66632f3d03a1e9365 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE) |
| repository.mail.fl_str_mv |
attena@ufpe.br |
| _version_ |
1862741591526998016 |