Intra-node and Inter-node load balancing and other scalable approaches for high-performance seismic processing

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Assis, Italo Augusto Souza de
Orientador(a): Souza, Samuel Xavier de
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.ufrn.br/jspui/handle/123456789/28353
Resumo: A modelagem sísmica, a migração reversa no tempo (RTM) e inversão de forma de onda multiescala (MFWI) são três das técnicas mais importantes no levantamento sísmico. A modelagem sísmica simula a propagação de ondas, a RTM gera uma imagem da subsuperfície e a MFWI produz um modelo de velocidades de propagação de ondas. Esses métodos possuem um alto custo computacional devido à grande quantidade de dados que eles processam e à complexidade de seus algoritmos. Por isso, na prática, eles são implementados apenas para sistemas paralelos. Embora existam implementações paralelas eficientes de modelagem, RTM e MFWI na literatura, melhorias podem ser feitas para melhor explorar o paralelismo nesses métodos e as características dos sistemas paralelos atuais. Esta pesquisa propõe a inversão de forma de onda multiescala acoplada (CMFWI), um método alternativo à MFWI, que melhora a escalabilidade paralela ao reduzir a dependência paralela entre o processamento de diferentes conteúdos de frequência dos dados. É apresentada uma implementação do CMFWI usando o método de minimizadores locais acoplados (CLM). Os resultados utilizando a norma L2 mostraram que a CMFWI teve desempenho inferior quando comparado ao MFWI. Esses testes indicam que mais pesquisa é necessária para implementar a CMFWI, pois ela compara dados com diferentes conteúdos de frequência. Este trabalho também apresenta uma estratégia de ajuste automático para escolher adequadamente o tamanho ideal dos blocos de carga de trabalho que reduz o tempo de execução de uma RTM 3D em sistemas de memória compartilhada. O método Coupled Simulated Annealing (CSA) é empregado para ajustar o tamanho dos blocos de carga de trabalho que os laços paralelos atribuem dinamicamente às threads. Testes mostram que o método proposto é consistentemente melhor do que dois agendamentos de laços padrão do OpenMP, sendo até 44% mais rápido. Esta tese também introduz o roubo de trabalho cíclico baseado em token (CTWS) para sistemas de memória distribuída. A nova abordagem de token cíclico reduz o número de falhas de roubo, reduz o overhead de comunicação e simplifica a seleção de vítimas e a estratégia de finalização. Os resultados obtidos com a aplicação da técnica proposta para equilibrar a carga de trabalho de uma RTM 3D apresentam um fator de 14,1% de aceleração e redução do desequilíbrio de carga de 78,4% quando comparadas à distribuição estática convencional. Por fim, é apresentada uma implementação de uma modelagem visco-acústica 2D.
id UFRN_55004b8ba33e1ea4f262ed123770418a
oai_identifier_str oai:https://repositorio.ufrn.br:123456789/28353
network_acronym_str UFRN
network_name_str Repositório Institucional da UFRN
repository_id_str
spelling Assis, Italo Augusto Souza deAraújo, João Medeiros deMelo, Jorge Dantas deSilveira, Luiz Felipe de QueirozPestana, Reynam da CruzSouza, Samuel Xavier de2020-01-23T17:19:29Z2020-01-23T17:19:29Z2019-10-14ASSIS, Ítalo Augusto Souza de. Intra-node and Inter-node load balancing and other scalable approaches for high-performance seismic processing. 2019. 108f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2019.https://repositorio.ufrn.br/jspui/handle/123456789/28353A modelagem sísmica, a migração reversa no tempo (RTM) e inversão de forma de onda multiescala (MFWI) são três das técnicas mais importantes no levantamento sísmico. A modelagem sísmica simula a propagação de ondas, a RTM gera uma imagem da subsuperfície e a MFWI produz um modelo de velocidades de propagação de ondas. Esses métodos possuem um alto custo computacional devido à grande quantidade de dados que eles processam e à complexidade de seus algoritmos. Por isso, na prática, eles são implementados apenas para sistemas paralelos. Embora existam implementações paralelas eficientes de modelagem, RTM e MFWI na literatura, melhorias podem ser feitas para melhor explorar o paralelismo nesses métodos e as características dos sistemas paralelos atuais. Esta pesquisa propõe a inversão de forma de onda multiescala acoplada (CMFWI), um método alternativo à MFWI, que melhora a escalabilidade paralela ao reduzir a dependência paralela entre o processamento de diferentes conteúdos de frequência dos dados. É apresentada uma implementação do CMFWI usando o método de minimizadores locais acoplados (CLM). Os resultados utilizando a norma L2 mostraram que a CMFWI teve desempenho inferior quando comparado ao MFWI. Esses testes indicam que mais pesquisa é necessária para implementar a CMFWI, pois ela compara dados com diferentes conteúdos de frequência. Este trabalho também apresenta uma estratégia de ajuste automático para escolher adequadamente o tamanho ideal dos blocos de carga de trabalho que reduz o tempo de execução de uma RTM 3D em sistemas de memória compartilhada. O método Coupled Simulated Annealing (CSA) é empregado para ajustar o tamanho dos blocos de carga de trabalho que os laços paralelos atribuem dinamicamente às threads. Testes mostram que o método proposto é consistentemente melhor do que dois agendamentos de laços padrão do OpenMP, sendo até 44% mais rápido. Esta tese também introduz o roubo de trabalho cíclico baseado em token (CTWS) para sistemas de memória distribuída. A nova abordagem de token cíclico reduz o número de falhas de roubo, reduz o overhead de comunicação e simplifica a seleção de vítimas e a estratégia de finalização. Os resultados obtidos com a aplicação da técnica proposta para equilibrar a carga de trabalho de uma RTM 3D apresentam um fator de 14,1% de aceleração e redução do desequilíbrio de carga de 78,4% quando comparadas à distribuição estática convencional. Por fim, é apresentada uma implementação de uma modelagem visco-acústica 2D.Seismic modeling, reverse time migration (RTM), and multi-scale waveform inversion (MFWI) are three of the most important techniques in seismic surveying. Seismic modeling simulates the wave propagation, RTM generates an image of the subsurface, and MFWI produces a wave propagation velocity model. These methods demand intensive computational cost due to a large amount of data they process and the complexity of their algorithms. Because of that, they are only implemented for parallel systems in practical. Although there are efficient parallel implementations of modeling, RTM, and MFWI in the literature, further improvement can be achieved by better exploring the parallelism in these methods and the characteristics of the current parallel systems. This research proposes coupled multi-scale waveform inversion (CMFWI), an alternative method to MFWI, which improves parallel scalability by reducing the parallel dependency between the processing of different frequency content of the data. An implementation of CMFWI using the coupled local minimizers method (CLM) is presented. L2-norm results showed that CMFWI had an inferior performance when compared to MFWI. These experiments indicate that further research is necessary to implement CMFWI as it compares data with different frequency contents. This work also introduces an auto-tuning strategy for properly choosing the optimal chunk size that reduces the runtime of a 3D RTM algorithm in shared memory systems. A coupled simulated annealing method (CSA) is employed to adjust the chunk size of work that parallel loops assign dynamically to worker threads. Experiments show that the proposed method is consistently better than two default OpenMP loop schedulers being up to 44% faster. This thesis also introduces the cyclic token-based work-stealing (CTWS) for distributed memory systems. The novel cyclic token approach reduces the number of failed steals, avoids communication overhead, and simplifies the victim selection and the termination strategy. Results obtained by applying the proposed technique to balance the workload of a 3D RTM present a factor of 14.1% speedup and reductions of the load imbalance of 78.4% when compared to the conventional static distribution. Finally, an implementation of a 2D visco-acoustic modeling is presented.CNPQ::ENGENHARIAS::ENGENHARIA ELETRICAInversão da Forma de Onda Multiescala (MFWI)Minimizadores Locais Acoplados (CLM)EficiênciaEscalabilidadeAjuste automáticoCoupled Simulated Annealing (CSA)Migração Reversa no Tempo (RTM)Balanceamento de cargaRoubo de Trabalho Cíclico Baseado em Token (CTWS)Comunicação unilateralMemória distribuídaMemória compartilhadaModelagem visco-acústicaIntra-node and Inter-node load balancing and other scalable approaches for high-performance seismic processinginfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisPROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃOUFRNBrasilinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRNTEXTIntranodeinternode_Assis_2019.pdf.txtIntranodeinternode_Assis_2019.pdf.txtExtracted texttext/plain155558https://repositorio.ufrn.br/bitstream/123456789/28353/2/Intranodeinternode_Assis_2019.pdf.txta5317c6d6c172be0693ec33cb53fed8dMD52THUMBNAILIntranodeinternode_Assis_2019.pdf.jpgIntranodeinternode_Assis_2019.pdf.jpgGenerated Thumbnailimage/jpeg1529https://repositorio.ufrn.br/bitstream/123456789/28353/3/Intranodeinternode_Assis_2019.pdf.jpgb99df5e152758b263ca685698c703507MD53ORIGINALIntranodeinternode_Assis_2019.pdfapplication/pdf1157671https://repositorio.ufrn.br/bitstream/123456789/28353/1/Intranodeinternode_Assis_2019.pdf4fb5d802e27578eb78a17623bae63f38MD51123456789/283532020-01-26 04:32:01.701oai:https://repositorio.ufrn.br:123456789/28353Repositório de PublicaçõesPUBhttp://repositorio.ufrn.br/oai/opendoar:2020-01-26T07:32:01Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false
dc.title.pt_BR.fl_str_mv Intra-node and Inter-node load balancing and other scalable approaches for high-performance seismic processing
title Intra-node and Inter-node load balancing and other scalable approaches for high-performance seismic processing
spellingShingle Intra-node and Inter-node load balancing and other scalable approaches for high-performance seismic processing
Assis, Italo Augusto Souza de
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
Inversão da Forma de Onda Multiescala (MFWI)
Minimizadores Locais Acoplados (CLM)
Eficiência
Escalabilidade
Ajuste automático
Coupled Simulated Annealing (CSA)
Migração Reversa no Tempo (RTM)
Balanceamento de carga
Roubo de Trabalho Cíclico Baseado em Token (CTWS)
Comunicação unilateral
Memória distribuída
Memória compartilhada
Modelagem visco-acústica
title_short Intra-node and Inter-node load balancing and other scalable approaches for high-performance seismic processing
title_full Intra-node and Inter-node load balancing and other scalable approaches for high-performance seismic processing
title_fullStr Intra-node and Inter-node load balancing and other scalable approaches for high-performance seismic processing
title_full_unstemmed Intra-node and Inter-node load balancing and other scalable approaches for high-performance seismic processing
title_sort Intra-node and Inter-node load balancing and other scalable approaches for high-performance seismic processing
author Assis, Italo Augusto Souza de
author_facet Assis, Italo Augusto Souza de
author_role author
dc.contributor.authorID.pt_BR.fl_str_mv
dc.contributor.advisorID.pt_BR.fl_str_mv
dc.contributor.referees1.none.fl_str_mv Araújo, João Medeiros de
dc.contributor.referees1ID.pt_BR.fl_str_mv
dc.contributor.referees2.none.fl_str_mv Melo, Jorge Dantas de
dc.contributor.referees2ID.pt_BR.fl_str_mv
dc.contributor.referees3.none.fl_str_mv Silveira, Luiz Felipe de Queiroz
dc.contributor.referees3ID.pt_BR.fl_str_mv
dc.contributor.referees4.none.fl_str_mv Pestana, Reynam da Cruz
dc.contributor.referees4ID.pt_BR.fl_str_mv
dc.contributor.author.fl_str_mv Assis, Italo Augusto Souza de
dc.contributor.advisor1.fl_str_mv Souza, Samuel Xavier de
contributor_str_mv Souza, Samuel Xavier de
dc.subject.cnpq.fl_str_mv CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
topic CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
Inversão da Forma de Onda Multiescala (MFWI)
Minimizadores Locais Acoplados (CLM)
Eficiência
Escalabilidade
Ajuste automático
Coupled Simulated Annealing (CSA)
Migração Reversa no Tempo (RTM)
Balanceamento de carga
Roubo de Trabalho Cíclico Baseado em Token (CTWS)
Comunicação unilateral
Memória distribuída
Memória compartilhada
Modelagem visco-acústica
dc.subject.por.fl_str_mv Inversão da Forma de Onda Multiescala (MFWI)
Minimizadores Locais Acoplados (CLM)
Eficiência
Escalabilidade
Ajuste automático
Coupled Simulated Annealing (CSA)
Migração Reversa no Tempo (RTM)
Balanceamento de carga
Roubo de Trabalho Cíclico Baseado em Token (CTWS)
Comunicação unilateral
Memória distribuída
Memória compartilhada
Modelagem visco-acústica
description A modelagem sísmica, a migração reversa no tempo (RTM) e inversão de forma de onda multiescala (MFWI) são três das técnicas mais importantes no levantamento sísmico. A modelagem sísmica simula a propagação de ondas, a RTM gera uma imagem da subsuperfície e a MFWI produz um modelo de velocidades de propagação de ondas. Esses métodos possuem um alto custo computacional devido à grande quantidade de dados que eles processam e à complexidade de seus algoritmos. Por isso, na prática, eles são implementados apenas para sistemas paralelos. Embora existam implementações paralelas eficientes de modelagem, RTM e MFWI na literatura, melhorias podem ser feitas para melhor explorar o paralelismo nesses métodos e as características dos sistemas paralelos atuais. Esta pesquisa propõe a inversão de forma de onda multiescala acoplada (CMFWI), um método alternativo à MFWI, que melhora a escalabilidade paralela ao reduzir a dependência paralela entre o processamento de diferentes conteúdos de frequência dos dados. É apresentada uma implementação do CMFWI usando o método de minimizadores locais acoplados (CLM). Os resultados utilizando a norma L2 mostraram que a CMFWI teve desempenho inferior quando comparado ao MFWI. Esses testes indicam que mais pesquisa é necessária para implementar a CMFWI, pois ela compara dados com diferentes conteúdos de frequência. Este trabalho também apresenta uma estratégia de ajuste automático para escolher adequadamente o tamanho ideal dos blocos de carga de trabalho que reduz o tempo de execução de uma RTM 3D em sistemas de memória compartilhada. O método Coupled Simulated Annealing (CSA) é empregado para ajustar o tamanho dos blocos de carga de trabalho que os laços paralelos atribuem dinamicamente às threads. Testes mostram que o método proposto é consistentemente melhor do que dois agendamentos de laços padrão do OpenMP, sendo até 44% mais rápido. Esta tese também introduz o roubo de trabalho cíclico baseado em token (CTWS) para sistemas de memória distribuída. A nova abordagem de token cíclico reduz o número de falhas de roubo, reduz o overhead de comunicação e simplifica a seleção de vítimas e a estratégia de finalização. Os resultados obtidos com a aplicação da técnica proposta para equilibrar a carga de trabalho de uma RTM 3D apresentam um fator de 14,1% de aceleração e redução do desequilíbrio de carga de 78,4% quando comparadas à distribuição estática convencional. Por fim, é apresentada uma implementação de uma modelagem visco-acústica 2D.
publishDate 2019
dc.date.issued.fl_str_mv 2019-10-14
dc.date.accessioned.fl_str_mv 2020-01-23T17:19:29Z
dc.date.available.fl_str_mv 2020-01-23T17:19:29Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv ASSIS, Ítalo Augusto Souza de. Intra-node and Inter-node load balancing and other scalable approaches for high-performance seismic processing. 2019. 108f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2019.
dc.identifier.uri.fl_str_mv https://repositorio.ufrn.br/jspui/handle/123456789/28353
identifier_str_mv ASSIS, Ítalo Augusto Souza de. Intra-node and Inter-node load balancing and other scalable approaches for high-performance seismic processing. 2019. 108f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2019.
url https://repositorio.ufrn.br/jspui/handle/123456789/28353
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.program.fl_str_mv PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO
dc.publisher.initials.fl_str_mv UFRN
dc.publisher.country.fl_str_mv Brasil
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRN
instname:Universidade Federal do Rio Grande do Norte (UFRN)
instacron:UFRN
instname_str Universidade Federal do Rio Grande do Norte (UFRN)
instacron_str UFRN
institution UFRN
reponame_str Repositório Institucional da UFRN
collection Repositório Institucional da UFRN
bitstream.url.fl_str_mv https://repositorio.ufrn.br/bitstream/123456789/28353/2/Intranodeinternode_Assis_2019.pdf.txt
https://repositorio.ufrn.br/bitstream/123456789/28353/3/Intranodeinternode_Assis_2019.pdf.jpg
https://repositorio.ufrn.br/bitstream/123456789/28353/1/Intranodeinternode_Assis_2019.pdf
bitstream.checksum.fl_str_mv a5317c6d6c172be0693ec33cb53fed8d
b99df5e152758b263ca685698c703507
4fb5d802e27578eb78a17623bae63f38
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)
repository.mail.fl_str_mv
_version_ 1797777807378481152