Solução de sistemas lineares de grande porte e computação de alto desempenho

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Ariza Ariza, Cristian David lattes
Orientador(a): Porsani, Milton José lattes
Banca de defesa: Porsani, Milton José lattes, Bassrei, Amin lattes, Santos, Peterson Nogueira lattes, Oliveira, Saulo Pomponet lattes, Oliveira, Sérgio Adriano Moura lattes
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal da Bahia
Programa de Pós-Graduação: Pós-Graduação em Geofísica (PGEOF) 
Departamento: Instituto de Geociências
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.ufba.br/handle/ri/39304
Resumo: Este trabalho descreve um método de solução de sistemas lineares densos de grande porte, positivo definido e bloco-estruturado, com múltiplos lados direitos, que utiliza computação paralela de alto desempenho. A solução do sistema é obtida através da recursão de Levinson generalizada que utiliza a combinação linear de soluções menores, direta e reversa, associadas aos subsistemas de menor ordem. A nova implementação é descrita para computação paralela e baseada em um algoritmo de matriz particionada. O algoritmo foi separado em duas sub-rotinas, a primeira que calcula a solução reversa e a matriz da energia dos erros para as ordens menores, e a segunda que calcula a solução recursivamente. O algoritmo foi implementado para três tipos de sistemas: sistemas de memória compartilhada, memória distribuída e para sistemas com GPU. Em cada caso os sistemas de menor ordem foram calculados usando bibliotecas apropriadas. No primeiro, foi utilizada a biblioteca OpenBLAS ou MKL, no segundo SCALAPACK e finalmente para sistemas com GPU implementamos um algoritmo OUT-OF-CORE, no qual os sistemas de menor ordem foram calculados utilizando MAGMA. Nos três casos, a solução final é comparada com a solução completa do sistema utilizando LAPACK, SCALAPACK e MAGMA, respectivamente. Nos três casos, a primeira parte do algoritmo mostrou-se mais dispendiosa computacionalmente, comparada à decomposição de Cholesky. Porém a segunda parte que calcula a solução, mostrou-se mais eficiente que a solução sucessiva de dois sistemas triangulares, quando o lado direito do sistema possui um tamanho significativo, geralmente algumas vezes o valor de N. O erro no modelo estimado não apresenta variações significativas comparado com a solução de referência. Finalmente, apresentamos a utilização do algoritmo na modelagem de ondas sísmicas no domínio da frequência, que envolve a solução de grandes sistemas lineares esparsos. Estes resultados mostram uma desvantagem do algoritmo em sistemas esparsos não Toeplitz, já que aumenta o custo computacional e o consumo de memória.
id UFBA-2_b3fcc8894bcb800b0bb6108d40c59a51
oai_identifier_str oai:repositorio.ufba.br:ri/39304
network_acronym_str UFBA-2
network_name_str Repositório Institucional da UFBA
repository_id_str
spelling 2024-04-24T19:09:50Z2024-04-242024-04-24T19:09:50Z2024-01-15ARIZA ARIZA, Cristian David. Solução de sistemas lineares de grande porte e computação de alto desempenho. 2024. 164 f. Tese (Doutorado em Geofísica) Instituto de Geociências, Universidade Federal da Bahia, Salvador, Ba, 2024.https://repositorio.ufba.br/handle/ri/39304Este trabalho descreve um método de solução de sistemas lineares densos de grande porte, positivo definido e bloco-estruturado, com múltiplos lados direitos, que utiliza computação paralela de alto desempenho. A solução do sistema é obtida através da recursão de Levinson generalizada que utiliza a combinação linear de soluções menores, direta e reversa, associadas aos subsistemas de menor ordem. A nova implementação é descrita para computação paralela e baseada em um algoritmo de matriz particionada. O algoritmo foi separado em duas sub-rotinas, a primeira que calcula a solução reversa e a matriz da energia dos erros para as ordens menores, e a segunda que calcula a solução recursivamente. O algoritmo foi implementado para três tipos de sistemas: sistemas de memória compartilhada, memória distribuída e para sistemas com GPU. Em cada caso os sistemas de menor ordem foram calculados usando bibliotecas apropriadas. No primeiro, foi utilizada a biblioteca OpenBLAS ou MKL, no segundo SCALAPACK e finalmente para sistemas com GPU implementamos um algoritmo OUT-OF-CORE, no qual os sistemas de menor ordem foram calculados utilizando MAGMA. Nos três casos, a solução final é comparada com a solução completa do sistema utilizando LAPACK, SCALAPACK e MAGMA, respectivamente. Nos três casos, a primeira parte do algoritmo mostrou-se mais dispendiosa computacionalmente, comparada à decomposição de Cholesky. Porém a segunda parte que calcula a solução, mostrou-se mais eficiente que a solução sucessiva de dois sistemas triangulares, quando o lado direito do sistema possui um tamanho significativo, geralmente algumas vezes o valor de N. O erro no modelo estimado não apresenta variações significativas comparado com a solução de referência. Finalmente, apresentamos a utilização do algoritmo na modelagem de ondas sísmicas no domínio da frequência, que envolve a solução de grandes sistemas lineares esparsos. Estes resultados mostram uma desvantagem do algoritmo em sistemas esparsos não Toeplitz, já que aumenta o custo computacional e o consumo de memória.This work describes a method for solving large, positive-defined, block-structured, dense linear systems with multiple right-hand sides that uses high-performance parallel computing. The system solution is obtained through a generalized Levinson recursion that uses the linear combination of smaller forward and backward solutions associated with lower order subsystems. The new implementation is described for parallel computing and is based on a partitioned matrix algorithm. The algorithm was separated into two subroutines, the first that computes the backward solution and the error energy matrix for smaller orders, and the second that computes the solution recursively. The algorithm was implemented for three types of systems: shared memory systems, distributed memory systems, and GPU systems. In each case, the lowest order systems were calculated using appropriate libraries. In the first, the OpenBLAS or MKL library was used; in the second, SCALAPACK; and finally, for systems with GPUs, we implemented an OUT-OF-CORE algorithm, in which the lowest order systems were calculated using MAGMA. In all three cases, the final solution is compared with the complete system solution using LAPACK, SCALAPACK, and MAGMA, respectively. In all three cases, the first part of the algorithm proved to be more computationally expensive compared to the Cholesky decomposition. However, the second part that computes the solution proved to be more efficient than the successive solution of two triangular systems when the right side of the system has a significant size, generally a few times the value of N. The error in the estimated model does not present significant variations compared to the reference solution. Finally, we present the use of the algorithm in frequency-domain seismic wave modeling, which involves the solution of large, sparse linear systems. These results show a disadvantage of the algorithm in sparse non-Toeplitz systems, as it increases the computational cost and memory consumption.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)porUniversidade Federal da BahiaPós-Graduação em Geofísica (PGEOF) UFBABrasilInstituto de GeociênciasLinear systemComputingModelingHigh performance computingParallel processing (Computers)CNPQ::CIENCIAS EXATAS E DA TERRACNPQ::CIENCIAS EXATAS E DA TERRA::GEOCIENCIASCNPQ::CIENCIAS EXATAS E DA TERRA::GEOCIENCIAS::GEOFISICACNPQ::CIENCIAS EXATAS E DA TERRA::GEOCIENCIAS::GEOFISICA::GEOFISICA APLICADASistemas linearesComputaçãoModelagemComputação de alto desempenhoProcessamento paralelo (Computadores)Solução de sistemas lineares de grande porte e computação de alto desempenhoSolution for large linear systems and high performance computingDoutoradoinfo:eu-repo/semantics/doctoralThesisinfo:eu-repo/semantics/publishedVersionPorsani, Milton José0000-0003-4668-8579http://lattes.cnpq.br/1428637808064409Porsani, Milton José0000-0003-4668-8579http://lattes.cnpq.br/1428637808064409Bassrei, Amin0000-0002-4653-2016http://lattes.cnpq.br/0254085595142341Santos, Peterson Nogueira0000-0002-7728-7463http://lattes.cnpq.br/0893868643154618Oliveira, Saulo Pomponet0000-0001-8227-8230http://lattes.cnpq.br/3048153332110327Oliveira, Sérgio Adriano Moura0000-0002-2988-8272http://lattes.cnpq.br/8240686670167148http://lattes.cnpq.br/7464905313739223Ariza Ariza, Cristian Davidinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFBAinstname:Universidade Federal da Bahia (UFBA)instacron:UFBAORIGINALCristian David Ariza Ariza_Tese doutorado.pdfCristian David Ariza Ariza_Tese doutorado.pdfTese doutoradoapplication/pdf3556560https://repositorio.ufba.br/bitstream/ri/39304/1/Cristian%20David%20Ariza%20Ariza_Tese%20doutorado.pdfd89fa057bd605231a35076f1af5a32a7MD51open accessLICENSElicense.txtlicense.txttext/plain1720https://repositorio.ufba.br/bitstream/ri/39304/2/license.txtd9b7566281c22d808dbf8f29ff0425c8MD52open accessri/393042024-04-24 16:09:50.502open accessoai:repositorio.ufba.br:ri/39304TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCBvIGF1dG9yIG91IHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGNvbmNlZGUgYW8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgbyBkaXJlaXRvIG7Do28tZXhjbHVzaXZvIGRlIHJlcHJvZHV6aXIsIHRyYWR1emlyIChjb25mb3JtZSBkZWZpbmlkbyBhYmFpeG8pIGUvb3UgZGlzdHJpYnVpciBhIHN1YSBwdWJsaWNhw6fDo28gKGluY2x1aW5kbyBvIHJlc3Vtbykgbm8gZm9ybWF0byBpbXByZXNzbyBlL291IGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIGZvcm1hdG9zIMOhdWRpbyBlL291IHbDrWRlby4KCk8gYXV0b3Igb3UgdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IgY29uY29yZGEgcXVlIG8gUmVwb3NpdMOzcmlvIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSBwdWJsaWNhw6fDo28gcGFyYSBxdWFscXVlciBtZWlvIGUvb3UgZm9ybWF0byBwYXJhIGZpbnMgZGUgcHJlc2VydmHDp8OjbywgcG9kZW5kbyBtYW50ZXIgbWFpcyBkZSB1bWEgY8OzcGlhIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrdXAgZSBwcmVzZXJ2YcOnw6NvLiAKCk8gYXV0b3Igb3UgdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IgZGVjbGFyYSBxdWUgYSBzdWEgcHVibGljYcOnw6NvIMOpIG9yaWdpbmFsIGUgcXVlIG7Do28sIHF1ZSBzZWphIGRlIHNldSBjb25oZWNpbWVudG8sIGluZnJpbmdlIGRpcmVpdG9zIGF1dG9yYWlzIGRlIG5pbmd1w6ltLgoKQ2FzbyBhIHN1YSBwdWJsaWNhw6fDo28gY29udGVuaGEgbWF0ZXJpYWwgcXVlIG7Do28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jw6ogZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBwYXJhIGNvbmNlZGVyIGFvIFJlcG9zaXTDs3JpbyBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EgZSBxdWUgZXNzZSBtYXRlcmlhbCBkZSBwcm9wcmllZGFkZSBkZSB0ZXJjZWlyb3MgZXN0w6EgY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdSBubyBjb250ZcO6ZG8gZGEgcHVibGljYcOnw6NvIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFBVQkxJQ0HDh8ODTyBPUkEgREVQT1NJVEFEQSBSRVNVTFRFIERFIFVNIFBBVFJPQ8ONTklPIE9VIEFQT0lPIERFIFVNQSBBR8OKTkNJQSBERSBGT01FTlRPIE9VIE9VVFJPIE9SR0FOSVNNTywgVk9Dw4ogREVDTEFSQSBRVUUgUkVTUEVJVE9VIFRPRE9TIEUgUVVBSVNRVUVSIERJUkVJVE9TIERFIFJFVklTw4NPLCBDT01PIFRBTULDiU0gQVMgREVNQUlTIE9CUklHQcOHw5VFUyBFWElHSURBUyBQT1IgQ09OVFJBVE8gT1UgQUNPUkRPLgoKTyBSZXBvc2l0w7NyaW8gc2UgY29tcHJvbWV0ZSBhIGlkZW50aWZpY2FyLCBjbGFyYW1lbnRlLCBvIChzKSBzZXUocykgbm9tZSAocykgb3UgbyAocykgbm9tZSAocykgZG8gKHMpIGRldGVudG9yIChlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRhIHB1YmxpY2HDp8OjbyBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzIGNvbmNlZGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EuCg==Repositório InstitucionalPUBhttp://192.188.11.11:8080/oai/requestopendoar:19322024-04-24T19:09:50Repositório Institucional da UFBA - Universidade Federal da Bahia (UFBA)false
dc.title.pt_BR.fl_str_mv Solução de sistemas lineares de grande porte e computação de alto desempenho
dc.title.alternative.pt_BR.fl_str_mv Solution for large linear systems and high performance computing
title Solução de sistemas lineares de grande porte e computação de alto desempenho
spellingShingle Solução de sistemas lineares de grande porte e computação de alto desempenho
Ariza Ariza, Cristian David
CNPQ::CIENCIAS EXATAS E DA TERRA
CNPQ::CIENCIAS EXATAS E DA TERRA::GEOCIENCIAS
CNPQ::CIENCIAS EXATAS E DA TERRA::GEOCIENCIAS::GEOFISICA
CNPQ::CIENCIAS EXATAS E DA TERRA::GEOCIENCIAS::GEOFISICA::GEOFISICA APLICADA
Sistemas lineares
Computação
Modelagem
Computação de alto desempenho
Processamento paralelo (Computadores)
Linear system
Computing
Modeling
High performance computing
Parallel processing (Computers)
title_short Solução de sistemas lineares de grande porte e computação de alto desempenho
title_full Solução de sistemas lineares de grande porte e computação de alto desempenho
title_fullStr Solução de sistemas lineares de grande porte e computação de alto desempenho
title_full_unstemmed Solução de sistemas lineares de grande porte e computação de alto desempenho
title_sort Solução de sistemas lineares de grande porte e computação de alto desempenho
author Ariza Ariza, Cristian David
author_facet Ariza Ariza, Cristian David
author_role author
dc.contributor.advisor1.fl_str_mv Porsani, Milton José
dc.contributor.advisor1ID.fl_str_mv 0000-0003-4668-8579
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/1428637808064409
dc.contributor.referee1.fl_str_mv Porsani, Milton José
dc.contributor.referee1ID.fl_str_mv 0000-0003-4668-8579
dc.contributor.referee1Lattes.fl_str_mv http://lattes.cnpq.br/1428637808064409
dc.contributor.referee2.fl_str_mv Bassrei, Amin
dc.contributor.referee2ID.fl_str_mv 0000-0002-4653-2016
dc.contributor.referee2Lattes.fl_str_mv http://lattes.cnpq.br/0254085595142341
dc.contributor.referee3.fl_str_mv Santos, Peterson Nogueira
dc.contributor.referee3ID.fl_str_mv 0000-0002-7728-7463
dc.contributor.referee3Lattes.fl_str_mv http://lattes.cnpq.br/0893868643154618
dc.contributor.referee4.fl_str_mv Oliveira, Saulo Pomponet
dc.contributor.referee4ID.fl_str_mv 0000-0001-8227-8230
dc.contributor.referee4Lattes.fl_str_mv http://lattes.cnpq.br/3048153332110327
dc.contributor.referee5.fl_str_mv Oliveira, Sérgio Adriano Moura
dc.contributor.referee5ID.fl_str_mv 0000-0002-2988-8272
dc.contributor.referee5Lattes.fl_str_mv http://lattes.cnpq.br/8240686670167148
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/7464905313739223
dc.contributor.author.fl_str_mv Ariza Ariza, Cristian David
contributor_str_mv Porsani, Milton José
Porsani, Milton José
Bassrei, Amin
Santos, Peterson Nogueira
Oliveira, Saulo Pomponet
Oliveira, Sérgio Adriano Moura
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA
CNPQ::CIENCIAS EXATAS E DA TERRA::GEOCIENCIAS
CNPQ::CIENCIAS EXATAS E DA TERRA::GEOCIENCIAS::GEOFISICA
CNPQ::CIENCIAS EXATAS E DA TERRA::GEOCIENCIAS::GEOFISICA::GEOFISICA APLICADA
topic CNPQ::CIENCIAS EXATAS E DA TERRA
CNPQ::CIENCIAS EXATAS E DA TERRA::GEOCIENCIAS
CNPQ::CIENCIAS EXATAS E DA TERRA::GEOCIENCIAS::GEOFISICA
CNPQ::CIENCIAS EXATAS E DA TERRA::GEOCIENCIAS::GEOFISICA::GEOFISICA APLICADA
Sistemas lineares
Computação
Modelagem
Computação de alto desempenho
Processamento paralelo (Computadores)
Linear system
Computing
Modeling
High performance computing
Parallel processing (Computers)
dc.subject.por.fl_str_mv Sistemas lineares
Computação
Modelagem
Computação de alto desempenho
Processamento paralelo (Computadores)
dc.subject.other.pt_BR.fl_str_mv Linear system
Computing
Modeling
High performance computing
Parallel processing (Computers)
description Este trabalho descreve um método de solução de sistemas lineares densos de grande porte, positivo definido e bloco-estruturado, com múltiplos lados direitos, que utiliza computação paralela de alto desempenho. A solução do sistema é obtida através da recursão de Levinson generalizada que utiliza a combinação linear de soluções menores, direta e reversa, associadas aos subsistemas de menor ordem. A nova implementação é descrita para computação paralela e baseada em um algoritmo de matriz particionada. O algoritmo foi separado em duas sub-rotinas, a primeira que calcula a solução reversa e a matriz da energia dos erros para as ordens menores, e a segunda que calcula a solução recursivamente. O algoritmo foi implementado para três tipos de sistemas: sistemas de memória compartilhada, memória distribuída e para sistemas com GPU. Em cada caso os sistemas de menor ordem foram calculados usando bibliotecas apropriadas. No primeiro, foi utilizada a biblioteca OpenBLAS ou MKL, no segundo SCALAPACK e finalmente para sistemas com GPU implementamos um algoritmo OUT-OF-CORE, no qual os sistemas de menor ordem foram calculados utilizando MAGMA. Nos três casos, a solução final é comparada com a solução completa do sistema utilizando LAPACK, SCALAPACK e MAGMA, respectivamente. Nos três casos, a primeira parte do algoritmo mostrou-se mais dispendiosa computacionalmente, comparada à decomposição de Cholesky. Porém a segunda parte que calcula a solução, mostrou-se mais eficiente que a solução sucessiva de dois sistemas triangulares, quando o lado direito do sistema possui um tamanho significativo, geralmente algumas vezes o valor de N. O erro no modelo estimado não apresenta variações significativas comparado com a solução de referência. Finalmente, apresentamos a utilização do algoritmo na modelagem de ondas sísmicas no domínio da frequência, que envolve a solução de grandes sistemas lineares esparsos. Estes resultados mostram uma desvantagem do algoritmo em sistemas esparsos não Toeplitz, já que aumenta o custo computacional e o consumo de memória.
publishDate 2024
dc.date.accessioned.fl_str_mv 2024-04-24T19:09:50Z
dc.date.available.fl_str_mv 2024-04-24
2024-04-24T19:09:50Z
dc.date.issued.fl_str_mv 2024-01-15
dc.type.driver.fl_str_mv Doutorado
info:eu-repo/semantics/doctoralThesis
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv ARIZA ARIZA, Cristian David. Solução de sistemas lineares de grande porte e computação de alto desempenho. 2024. 164 f. Tese (Doutorado em Geofísica) Instituto de Geociências, Universidade Federal da Bahia, Salvador, Ba, 2024.
dc.identifier.uri.fl_str_mv https://repositorio.ufba.br/handle/ri/39304
identifier_str_mv ARIZA ARIZA, Cristian David. Solução de sistemas lineares de grande porte e computação de alto desempenho. 2024. 164 f. Tese (Doutorado em Geofísica) Instituto de Geociências, Universidade Federal da Bahia, Salvador, Ba, 2024.
url https://repositorio.ufba.br/handle/ri/39304
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal da Bahia
dc.publisher.program.fl_str_mv Pós-Graduação em Geofísica (PGEOF) 
dc.publisher.initials.fl_str_mv UFBA
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Instituto de Geociências
publisher.none.fl_str_mv Universidade Federal da Bahia
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFBA
instname:Universidade Federal da Bahia (UFBA)
instacron:UFBA
instname_str Universidade Federal da Bahia (UFBA)
instacron_str UFBA
institution UFBA
reponame_str Repositório Institucional da UFBA
collection Repositório Institucional da UFBA
bitstream.url.fl_str_mv https://repositorio.ufba.br/bitstream/ri/39304/1/Cristian%20David%20Ariza%20Ariza_Tese%20doutorado.pdf
https://repositorio.ufba.br/bitstream/ri/39304/2/license.txt
bitstream.checksum.fl_str_mv d89fa057bd605231a35076f1af5a32a7
d9b7566281c22d808dbf8f29ff0425c8
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFBA - Universidade Federal da Bahia (UFBA)
repository.mail.fl_str_mv
_version_ 1808459717987532800