Escolha do ladrilhamento para um simulador de ondas acústicas em gpus por meio de aprendizado de máquina
| Ano de defesa: | 2024 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de São Carlos
Câmpus São Carlos |
| Programa de Pós-Graduação: |
Programa de Pós-Graduação em Ciência da Computação - PPGCC
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Inglês: | |
| Área do conhecimento CNPq: | |
| Link de acesso: | https://hdl.handle.net/20.500.14289/22829 |
Resumo: | The simulation of acoustic wave propagation is crucial in fields such as geophysics and seismic imaging, being modeled by numerical methods such as finite difference methods (FDM). These simulations are resource-intensive, especially in large-scale problems with 3D grids and multiple time steps. The use of GPUs has shown promise due to their parallel processing power, but one challenge is the memory access overhead. Tiling, which divides the grid into smaller blocks, improves data locality, optimizing memory access and increasing performance. However, selecting the optimal tile size for a given computation is not a trivial task. The optimal tile size depends on a variety of factors, including the specific architecture of the GPU, the size of the problem being solved, and the characteristics of the data being processed. In practice, the optimal tile size can vary significantly depending on the GPU’s memory hierarchy, the bandwidth between the processor and memory, and the computational intensity of the kernel. Moreover, the choice of tile size can also affect the parallelism and load balancing of the computation, making it a complex trade-off that requires careful tuning. In this study, we used machine learning to predict optimized tile sizes for acoustic wave simulations. We evaluated six algorithms (KNN, Decision Tree, Random Forest, XGBoost, LightGBM, and J48), and the results showed significant improvement, with the best model achieving improvement coefficients of 1.17 for the Turing GPU (RTX2080) and 1.11 for the Volta GPU (V100), as well as a success rate of over 75% for both GPUs. |
| id |
SCAR_3f494f442e1c3f1356209a848bea8905 |
|---|---|
| oai_identifier_str |
oai:repositorio.ufscar.br:20.500.14289/22829 |
| network_acronym_str |
SCAR |
| network_name_str |
Repositório Institucional da UFSCAR |
| repository_id_str |
|
| spelling |
Silva, Tiago daHermes, Sengerhttp://lattes.cnpq.br/3691742159298316https://lattes.cnpq.br/9807548046251584Senger, HermesGuardia, Hélio CrestanaPedrino, Emerson CarlosMatias, PauloBruschi, Sarita Mazzinihttp://lattes.cnpq.br/3691742159298316http://lattes.cnpq.br/1780902767520967http://lattes.cnpq.br/6481363465527189http://lattes.cnpq.br/3792055796261017http://lattes.cnpq.br/46941423154973642025-09-25T18:58:16Z2024-12-16SILVA, Tiago da. Escolha do ladrilhamento para um simulador de ondas acústicas em gpus por meio de aprendizado de máquina. 2024. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2024. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/22829.https://hdl.handle.net/20.500.14289/22829The simulation of acoustic wave propagation is crucial in fields such as geophysics and seismic imaging, being modeled by numerical methods such as finite difference methods (FDM). These simulations are resource-intensive, especially in large-scale problems with 3D grids and multiple time steps. The use of GPUs has shown promise due to their parallel processing power, but one challenge is the memory access overhead. Tiling, which divides the grid into smaller blocks, improves data locality, optimizing memory access and increasing performance. However, selecting the optimal tile size for a given computation is not a trivial task. The optimal tile size depends on a variety of factors, including the specific architecture of the GPU, the size of the problem being solved, and the characteristics of the data being processed. In practice, the optimal tile size can vary significantly depending on the GPU’s memory hierarchy, the bandwidth between the processor and memory, and the computational intensity of the kernel. Moreover, the choice of tile size can also affect the parallelism and load balancing of the computation, making it a complex trade-off that requires careful tuning. In this study, we used machine learning to predict optimized tile sizes for acoustic wave simulations. We evaluated six algorithms (KNN, Decision Tree, Random Forest, XGBoost, LightGBM, and J48), and the results showed significant improvement, with the best model achieving improvement coefficients of 1.17 for the Turing GPU (RTX2080) and 1.11 for the Volta GPU (V100), as well as a success rate of over 75% for both GPUs.A simulação da propagação da onda acústica é crucial em áreas como geofísica e imagem sísmica, sendo modelada por métodos numéricos, como o de diferenças finitas (FDM). Essas simulações são intensivas em recursos, especialmente em problemas de grande escala com grids 3D e múltiplos passos de tempo. O uso de GPUs tem se mostrado promissor devido ao seu poder de processamento paralelo, mas um desafio é a sobrecarga de acessos à memória. O tiling, que divide o grid em blocos menores, melhora a localidade dos dados, otimizando o acesso à memória e aumentando o desempenho. Entretanto, determinar o tamanho do tile para uma dada aplicação não é uma tarefa simples. Esse valor depende de diversos fatores, como a arquitetura da GPU, o tamanho do problema e as características específicas dos dados processados. A escolha do tamanho do tile é afetada diretamente pela utilização da memória cache, a largura de banda da memória e o paralelismo do cálculo, tornando a questão bastante complexa e sujeita a várias trocas de eficiência. Neste estudo, utilizamos aprendizado de máquina para prever tamanhos otimizados de tiles na simulação de ondas acústicas. Avaliamos seis algoritmos (KNN, Árvore de Decisão, Random Forest, XGBoost, LightGBM e J48), e os resultados mostraram uma melhoria significativa, com o melhor modelo alcançando coeficientes de melhoria de 1,17 para a GPU Turing (RTX2080) e 1,11 para a Volta (V100), além de uma taxa de sucesso superior a 75% para ambas as GPUs.Não recebi financiamentoporUniversidade Federal de São CarlosCâmpus São CarlosPrograma de Pós-Graduação em Ciência da Computação - PPGCCUFSCarhttps://sol.sbc.org.br/index.php/sscad/article/view/30999Attribution 3.0 Brazilhttp://creativecommons.org/licenses/by/3.0/br/info:eu-repo/semantics/openAccessAcoustic wave simulationStencilGPUOpenmpPerformanceEfficiencyParallel programmingLoop tillingLoop blockingPartitioned matrixBlockingCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO9. Indústria, Inovação e InfraestruturaEscolha do ladrilhamento para um simulador de ondas acústicas em gpus por meio de aprendizado de máquinaTiling choice for an acoustic wave simulator on gpus via machine learninginfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARTEXTEscolha do Ladrilhamento para um Simulador de Ondas Acústicas em GPUs por meio de Aprendizado de Máquina.pdf.txtEscolha do Ladrilhamento para um Simulador de Ondas Acústicas em GPUs por meio de Aprendizado de Máquina.pdf.txtExtracted texttext/plain103437https://repositorio.ufscar.br/bitstreams/0e8d97c9-d1df-4760-8a72-fa3c83c361e8/download85b5fbca9302a144ef8bb97ee72eb5edMD54falseAnonymousREADTHUMBNAILEscolha do Ladrilhamento para um Simulador de Ondas Acústicas em GPUs por meio de Aprendizado de Máquina.pdf.jpgEscolha do Ladrilhamento para um Simulador de Ondas Acústicas em GPUs por meio de Aprendizado de Máquina.pdf.jpgGenerated Thumbnailimage/jpeg4089https://repositorio.ufscar.br/bitstreams/f8e89efd-5fe8-465b-875d-8c000d8018cc/download02dd94b75892c01c78f7e03312064db6MD55falseAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81026https://repositorio.ufscar.br/bitstreams/2642c734-a9bf-472b-b23a-8c5008527797/download8b1d7be50365a944321ad7a1789f6ebfMD53falseAnonymousREADORIGINALEscolha do Ladrilhamento para um Simulador de Ondas Acústicas em GPUs por meio de Aprendizado de Máquina.pdfEscolha do Ladrilhamento para um Simulador de Ondas Acústicas em GPUs por meio de Aprendizado de Máquina.pdfapplication/pdf1964472https://repositorio.ufscar.br/bitstreams/21a95d8a-5181-4c66-96a2-25d5cb936ff2/download767e86a0a0f5781d8301b6e4be614fdbMD52trueAnonymousREAD20.500.14289/228292025-09-26T03:10:33.040946Zhttp://creativecommons.org/licenses/by/3.0/br/Attribution 3.0 Brazilopen.accessoai:repositorio.ufscar.br:20.500.14289/22829https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-09-26T03:10:33Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false |
| dc.title.none.fl_str_mv |
Escolha do ladrilhamento para um simulador de ondas acústicas em gpus por meio de aprendizado de máquina |
| dc.title.alternative.eng.fl_str_mv |
Tiling choice for an acoustic wave simulator on gpus via machine learning |
| title |
Escolha do ladrilhamento para um simulador de ondas acústicas em gpus por meio de aprendizado de máquina |
| spellingShingle |
Escolha do ladrilhamento para um simulador de ondas acústicas em gpus por meio de aprendizado de máquina Silva, Tiago da Acoustic wave simulation Stencil GPU Openmp Performance Efficiency Parallel programming Loop tilling Loop blocking Partitioned matrix Blocking CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO 9. Indústria, Inovação e Infraestrutura |
| title_short |
Escolha do ladrilhamento para um simulador de ondas acústicas em gpus por meio de aprendizado de máquina |
| title_full |
Escolha do ladrilhamento para um simulador de ondas acústicas em gpus por meio de aprendizado de máquina |
| title_fullStr |
Escolha do ladrilhamento para um simulador de ondas acústicas em gpus por meio de aprendizado de máquina |
| title_full_unstemmed |
Escolha do ladrilhamento para um simulador de ondas acústicas em gpus por meio de aprendizado de máquina |
| title_sort |
Escolha do ladrilhamento para um simulador de ondas acústicas em gpus por meio de aprendizado de máquina |
| author |
Silva, Tiago da |
| author_facet |
Silva, Tiago da |
| author_role |
author |
| dc.contributor.authorlattes.none.fl_str_mv |
https://lattes.cnpq.br/9807548046251584 |
| dc.contributor.referee.none.fl_str_mv |
Senger, Hermes Guardia, Hélio Crestana Pedrino, Emerson Carlos Matias, Paulo Bruschi, Sarita Mazzini |
| dc.contributor.refereeLattes.none.fl_str_mv |
http://lattes.cnpq.br/3691742159298316 http://lattes.cnpq.br/1780902767520967 http://lattes.cnpq.br/6481363465527189 http://lattes.cnpq.br/3792055796261017 http://lattes.cnpq.br/4694142315497364 |
| dc.contributor.author.fl_str_mv |
Silva, Tiago da |
| dc.contributor.advisor1.fl_str_mv |
Hermes, Senger |
| dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/3691742159298316 |
| contributor_str_mv |
Hermes, Senger |
| dc.subject.eng.fl_str_mv |
Acoustic wave simulation Stencil GPU Openmp Performance Efficiency Parallel programming Loop tilling Loop blocking Partitioned matrix Blocking |
| topic |
Acoustic wave simulation Stencil GPU Openmp Performance Efficiency Parallel programming Loop tilling Loop blocking Partitioned matrix Blocking CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO 9. Indústria, Inovação e Infraestrutura |
| dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
| dc.subject.ods.none.fl_str_mv |
9. Indústria, Inovação e Infraestrutura |
| description |
The simulation of acoustic wave propagation is crucial in fields such as geophysics and seismic imaging, being modeled by numerical methods such as finite difference methods (FDM). These simulations are resource-intensive, especially in large-scale problems with 3D grids and multiple time steps. The use of GPUs has shown promise due to their parallel processing power, but one challenge is the memory access overhead. Tiling, which divides the grid into smaller blocks, improves data locality, optimizing memory access and increasing performance. However, selecting the optimal tile size for a given computation is not a trivial task. The optimal tile size depends on a variety of factors, including the specific architecture of the GPU, the size of the problem being solved, and the characteristics of the data being processed. In practice, the optimal tile size can vary significantly depending on the GPU’s memory hierarchy, the bandwidth between the processor and memory, and the computational intensity of the kernel. Moreover, the choice of tile size can also affect the parallelism and load balancing of the computation, making it a complex trade-off that requires careful tuning. In this study, we used machine learning to predict optimized tile sizes for acoustic wave simulations. We evaluated six algorithms (KNN, Decision Tree, Random Forest, XGBoost, LightGBM, and J48), and the results showed significant improvement, with the best model achieving improvement coefficients of 1.17 for the Turing GPU (RTX2080) and 1.11 for the Volta GPU (V100), as well as a success rate of over 75% for both GPUs. |
| publishDate |
2024 |
| dc.date.issued.fl_str_mv |
2024-12-16 |
| dc.date.accessioned.fl_str_mv |
2025-09-25T18:58:16Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
SILVA, Tiago da. Escolha do ladrilhamento para um simulador de ondas acústicas em gpus por meio de aprendizado de máquina. 2024. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2024. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/22829. |
| dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/20.500.14289/22829 |
| identifier_str_mv |
SILVA, Tiago da. Escolha do ladrilhamento para um simulador de ondas acústicas em gpus por meio de aprendizado de máquina. 2024. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de São Carlos, São Carlos, 2024. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/22829. |
| url |
https://hdl.handle.net/20.500.14289/22829 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.uri.none.fl_str_mv |
https://sol.sbc.org.br/index.php/sscad/article/view/30999 |
| dc.rights.driver.fl_str_mv |
Attribution 3.0 Brazil http://creativecommons.org/licenses/by/3.0/br/ info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Attribution 3.0 Brazil http://creativecommons.org/licenses/by/3.0/br/ |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
| dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação - PPGCC |
| dc.publisher.initials.fl_str_mv |
UFSCar |
| publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
| instname_str |
Universidade Federal de São Carlos (UFSCAR) |
| instacron_str |
UFSCAR |
| institution |
UFSCAR |
| reponame_str |
Repositório Institucional da UFSCAR |
| collection |
Repositório Institucional da UFSCAR |
| bitstream.url.fl_str_mv |
https://repositorio.ufscar.br/bitstreams/0e8d97c9-d1df-4760-8a72-fa3c83c361e8/download https://repositorio.ufscar.br/bitstreams/f8e89efd-5fe8-465b-875d-8c000d8018cc/download https://repositorio.ufscar.br/bitstreams/2642c734-a9bf-472b-b23a-8c5008527797/download https://repositorio.ufscar.br/bitstreams/21a95d8a-5181-4c66-96a2-25d5cb936ff2/download |
| bitstream.checksum.fl_str_mv |
85b5fbca9302a144ef8bb97ee72eb5ed 02dd94b75892c01c78f7e03312064db6 8b1d7be50365a944321ad7a1789f6ebf 767e86a0a0f5781d8301b6e4be614fdb |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
| repository.mail.fl_str_mv |
repositorio.sibi@ufscar.br |
| _version_ |
1851688943174549504 |