Representação e computação de cubos de dados completos ou parciais em clusters de computadores de baixo custo.
| Ano de defesa: | 2012 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| dARK ID: | ark:/61566/0013000004d9t |
| Idioma: | por |
| Instituição de defesa: |
Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | http://www.repositorio.ufop.br/handle/123456789/3448 |
Resumo: | A abordagem PnP (Pipe ’n Prune) é considerada uma das abordagens mais promissoras da literatura para computação de cubos em arquiteturas de computadores com memória distribuída. Infelizmente, a abordagem PnP gera uma enorme quantidade de dados redundantes. No geral, a PnP não considera a uniformidade nos dados, denominada skew. Não considerar o skew no particionamento da carga de trabalho impõe máxima redundância de dados, mesmo com dados uniformes. Diante deste cenário, foi desenvolvida a abordagem P2CDM (acrônimo de Parallel Cube Computation with Distributed Memory), que possui comunicação minimizada e gera redundância de dados sob demanda, dependendo do grau de uniformidade dos dados. Neste sentido, a abordagem P2CDM permite a computação de cubos completos a partir de um certo grau de uniformidade nos dados e cubos parciais quando o grau de uniformidade nos dados ultrapassar um limite predefinido. Os experimentos demonstram que as abordagens PnP e P2CDM possuem acelerações similares, porém a abordagem P2CDM ´e 20-25% mais rápida e consome 30-40% menos memória em cada nó do cluster, quando comparada com a abordagem PnP. |
| id |
UFOP_5dea6ed27af533dcc4ad5e63c3fa87a2 |
|---|---|
| oai_identifier_str |
oai:repositorio.ufop.br:123456789/3448 |
| network_acronym_str |
UFOP |
| network_name_str |
Repositório Institucional da UFOP |
| repository_id_str |
|
| spelling |
Representação e computação de cubos de dados completos ou parciais em clusters de computadores de baixo custo.Computação de alto desempenhoBanco de dados - armazém de dados - cubo de dadosProcessamento analítico online - OLAPA abordagem PnP (Pipe ’n Prune) é considerada uma das abordagens mais promissoras da literatura para computação de cubos em arquiteturas de computadores com memória distribuída. Infelizmente, a abordagem PnP gera uma enorme quantidade de dados redundantes. No geral, a PnP não considera a uniformidade nos dados, denominada skew. Não considerar o skew no particionamento da carga de trabalho impõe máxima redundância de dados, mesmo com dados uniformes. Diante deste cenário, foi desenvolvida a abordagem P2CDM (acrônimo de Parallel Cube Computation with Distributed Memory), que possui comunicação minimizada e gera redundância de dados sob demanda, dependendo do grau de uniformidade dos dados. Neste sentido, a abordagem P2CDM permite a computação de cubos completos a partir de um certo grau de uniformidade nos dados e cubos parciais quando o grau de uniformidade nos dados ultrapassar um limite predefinido. Os experimentos demonstram que as abordagens PnP e P2CDM possuem acelerações similares, porém a abordagem P2CDM ´e 20-25% mais rápida e consome 30-40% menos memória em cada nó do cluster, quando comparada com a abordagem PnP.The PnP (Pipe ’n Prune) approach is considered one of the most promising approaches for cube computation over distributed memory computer architectures. Unfortunately, it generates a huge amount of redundant data. In general, PnP does not consider data uniformity, named skew, when partitioning its workload and, thus, it imposes a maximum data redundancy even with uniform data. Due to this scenario, we implement P2CDM (acronym for Parallel Cube Computation with Distributed Memory) approach which has minimized communication and low data redundancy, depending on the data skew. In this sense, P2CDM approach enables full cube computation from a input data with low skew and partial cube computation from high skew input data. Our experiments demonstrated that both approaches have similar speedup, but P2CDM approach is 20-25% faster and consumes 30-40% less memory at each host of the cluster, when compared to the PnP approach.Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.Lima, Joubert de CastroMoreira, Angélica Aparecida2014-02-06T11:03:00Z2014-02-06T11:03:00Z2012info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfMOREIRA, A. A. Representação e computação de cubos de dados completos ou parciais em clusters de computadores de baixo custo. 2012. 43 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Ouro Preto, Ouro Preto, 2012.http://www.repositorio.ufop.br/handle/123456789/3448ark:/61566/0013000004d9tAutorização concedida ao Repositório Institucional da UFOP pelo autor(a), 19/02/2013, com as seguintes condições: disponível sob Licença Creative Commons 3.0, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFOPinstname:Universidade Federal de Ouro Preto (UFOP)instacron:UFOP2024-11-10T15:51:16Zoai:repositorio.ufop.br:123456789/3448Repositório InstitucionalPUBhttp://www.repositorio.ufop.br/oai/requestrepositorio@ufop.edu.bropendoar:32332024-11-10T15:51:16Repositório Institucional da UFOP - Universidade Federal de Ouro Preto (UFOP)false |
| dc.title.none.fl_str_mv |
Representação e computação de cubos de dados completos ou parciais em clusters de computadores de baixo custo. |
| title |
Representação e computação de cubos de dados completos ou parciais em clusters de computadores de baixo custo. |
| spellingShingle |
Representação e computação de cubos de dados completos ou parciais em clusters de computadores de baixo custo. Moreira, Angélica Aparecida Computação de alto desempenho Banco de dados - armazém de dados - cubo de dados Processamento analítico online - OLAP |
| title_short |
Representação e computação de cubos de dados completos ou parciais em clusters de computadores de baixo custo. |
| title_full |
Representação e computação de cubos de dados completos ou parciais em clusters de computadores de baixo custo. |
| title_fullStr |
Representação e computação de cubos de dados completos ou parciais em clusters de computadores de baixo custo. |
| title_full_unstemmed |
Representação e computação de cubos de dados completos ou parciais em clusters de computadores de baixo custo. |
| title_sort |
Representação e computação de cubos de dados completos ou parciais em clusters de computadores de baixo custo. |
| author |
Moreira, Angélica Aparecida |
| author_facet |
Moreira, Angélica Aparecida |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Lima, Joubert de Castro |
| dc.contributor.author.fl_str_mv |
Moreira, Angélica Aparecida |
| dc.subject.por.fl_str_mv |
Computação de alto desempenho Banco de dados - armazém de dados - cubo de dados Processamento analítico online - OLAP |
| topic |
Computação de alto desempenho Banco de dados - armazém de dados - cubo de dados Processamento analítico online - OLAP |
| description |
A abordagem PnP (Pipe ’n Prune) é considerada uma das abordagens mais promissoras da literatura para computação de cubos em arquiteturas de computadores com memória distribuída. Infelizmente, a abordagem PnP gera uma enorme quantidade de dados redundantes. No geral, a PnP não considera a uniformidade nos dados, denominada skew. Não considerar o skew no particionamento da carga de trabalho impõe máxima redundância de dados, mesmo com dados uniformes. Diante deste cenário, foi desenvolvida a abordagem P2CDM (acrônimo de Parallel Cube Computation with Distributed Memory), que possui comunicação minimizada e gera redundância de dados sob demanda, dependendo do grau de uniformidade dos dados. Neste sentido, a abordagem P2CDM permite a computação de cubos completos a partir de um certo grau de uniformidade nos dados e cubos parciais quando o grau de uniformidade nos dados ultrapassar um limite predefinido. Os experimentos demonstram que as abordagens PnP e P2CDM possuem acelerações similares, porém a abordagem P2CDM ´e 20-25% mais rápida e consome 30-40% menos memória em cada nó do cluster, quando comparada com a abordagem PnP. |
| publishDate |
2012 |
| dc.date.none.fl_str_mv |
2012 2014-02-06T11:03:00Z 2014-02-06T11:03:00Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
MOREIRA, A. A. Representação e computação de cubos de dados completos ou parciais em clusters de computadores de baixo custo. 2012. 43 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Ouro Preto, Ouro Preto, 2012. http://www.repositorio.ufop.br/handle/123456789/3448 |
| dc.identifier.dark.fl_str_mv |
ark:/61566/0013000004d9t |
| identifier_str_mv |
MOREIRA, A. A. Representação e computação de cubos de dados completos ou parciais em clusters de computadores de baixo custo. 2012. 43 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Ouro Preto, Ouro Preto, 2012. ark:/61566/0013000004d9t |
| url |
http://www.repositorio.ufop.br/handle/123456789/3448 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto. |
| publisher.none.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto. |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFOP instname:Universidade Federal de Ouro Preto (UFOP) instacron:UFOP |
| instname_str |
Universidade Federal de Ouro Preto (UFOP) |
| instacron_str |
UFOP |
| institution |
UFOP |
| reponame_str |
Repositório Institucional da UFOP |
| collection |
Repositório Institucional da UFOP |
| repository.name.fl_str_mv |
Repositório Institucional da UFOP - Universidade Federal de Ouro Preto (UFOP) |
| repository.mail.fl_str_mv |
repositorio@ufop.edu.br |
| _version_ |
1856654661001412608 |