Otimização do tempo de vida de processadores multicore homogêneos através da variação do grau de TLP e das políticas de alocação de threads
| Ano de defesa: | 2021 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal do Pampa
|
| Programa de Pós-Graduação: |
Mestrado Profissional em Engenharia de Software
|
| Departamento: |
Campus Alegrete
|
| País: |
Brasil
|
| Palavras-chave em Português: | |
| Área do conhecimento CNPq: | |
| Link de acesso: | https://repositorio.unipampa.edu.br/jspui/handle/riu/7316 |
Resumo: | O avanço na tecnologia dos transistores tem permitido o aumento no número de cores em um único chip. Isso, por sua vez, possibilita o desenvolvimento de sistemas de alto desempenho com melhores capacidades para explorar o paralelismo no nível de threads (TLP). No entanto, isso também leva a problemas relacionados à temperatura desses sistemas. Alcançar altas temperaturas acelera o processo de envelhecimento dos componentes de hardware influenciando suas causas (por exemplo, instabilidade de temperatura de polarização negativa - NBTI). Adicionalmente, este efeito não depende apenas do número de cores, mas também da distância entre eles e seu uso. Além disso, as aplicações paralelas apresentam vários padrões, como irregularidade, cálculos desequilibrados ou altas taxas de comunicação. Essas diferentes características podem acentuar esses efeitos adversos. Com etapa preliminar desta dissertação, realizamos a execução de treze benchmarks bem conhecidos em três arquiteturas multicore diferentes para avaliar diferentes configurações de TLP e políticas de placement e estratégias de afinidade de threads implementadas em OpenMP. Os resultados demonstraram que não há uma configuração única que forneça o melhor NBTI para todas as aplicações. Diante deste cenário, esta dissertação propõe AATS, uma metodologia para reduzir o aging através da combinação de exploração de TLP e estratégia de alocação de threads. AATS foi empregado de duas maneiras, uma que atua de modo offline executando externamente à aplicação e uma online que faz a otimização em tempo de execução. AATS offline apresentou resultados efetivos na redução do aging com uma distância de apenas 1.02 da melhor solução encontrada na exploração de espaço de projeto para a arquitetura AMD de 16 cores. Ainda, é capaz de encontrar uma solução em um grande espaço de exploração avaliando um número reduzido de configurações, como por exemplo na arquitetura IBM de 160 cores na qual foram avaliadas, na média, apenas 1,9% das configurações possíveis. No caso do AATS online foi possível observar que os ajustes dinâmicos durante a execução da aplicação não possibilitaram redução do aging, principalmente pelo aumento do tempo de execução. A justificativa para tal está no aumento da quantidade de acessos à memória devido à variação das políticas de alocação, as quais requerem atualização dos dados que estão nas memórias cache quando as threads são realocadas. Palavras-chave: Otimização. Envelhecimento. Afinidade de threads. Paralelismo a nível de threads. OpenMP. |
| id |
UNIP_6f93f21dc1a96f1f35e89381cbd089b0 |
|---|---|
| oai_identifier_str |
oai:repositorio.unipampa.edu.br:riu/7316 |
| network_acronym_str |
UNIP |
| network_name_str |
Repositório Institucional da UNIPAMPA |
| repository_id_str |
|
| spelling |
Lorenzon, Arthur FranciscoMedeiros, Thiarles Soares2022-06-01T18:22:08Z2022-05-302022-06-01T18:22:08Z2021-06-11MEDEIROS, Thiarles Soares. Otimização do tempo de vida de processadores multicore homogêneos através da variação do grau de TLP e das políticas de alocação de threads. Orientador: Arthur Francisco Lorenzon. 2021. 105p. Dissertação (Mestrado Profissional em Engenharia de Software) – Universidade Federal do Pampa, Campus Alegrete, Alegrete, 2021.https://repositorio.unipampa.edu.br/jspui/handle/riu/7316O avanço na tecnologia dos transistores tem permitido o aumento no número de cores em um único chip. Isso, por sua vez, possibilita o desenvolvimento de sistemas de alto desempenho com melhores capacidades para explorar o paralelismo no nível de threads (TLP). No entanto, isso também leva a problemas relacionados à temperatura desses sistemas. Alcançar altas temperaturas acelera o processo de envelhecimento dos componentes de hardware influenciando suas causas (por exemplo, instabilidade de temperatura de polarização negativa - NBTI). Adicionalmente, este efeito não depende apenas do número de cores, mas também da distância entre eles e seu uso. Além disso, as aplicações paralelas apresentam vários padrões, como irregularidade, cálculos desequilibrados ou altas taxas de comunicação. Essas diferentes características podem acentuar esses efeitos adversos. Com etapa preliminar desta dissertação, realizamos a execução de treze benchmarks bem conhecidos em três arquiteturas multicore diferentes para avaliar diferentes configurações de TLP e políticas de placement e estratégias de afinidade de threads implementadas em OpenMP. Os resultados demonstraram que não há uma configuração única que forneça o melhor NBTI para todas as aplicações. Diante deste cenário, esta dissertação propõe AATS, uma metodologia para reduzir o aging através da combinação de exploração de TLP e estratégia de alocação de threads. AATS foi empregado de duas maneiras, uma que atua de modo offline executando externamente à aplicação e uma online que faz a otimização em tempo de execução. AATS offline apresentou resultados efetivos na redução do aging com uma distância de apenas 1.02 da melhor solução encontrada na exploração de espaço de projeto para a arquitetura AMD de 16 cores. Ainda, é capaz de encontrar uma solução em um grande espaço de exploração avaliando um número reduzido de configurações, como por exemplo na arquitetura IBM de 160 cores na qual foram avaliadas, na média, apenas 1,9% das configurações possíveis. No caso do AATS online foi possível observar que os ajustes dinâmicos durante a execução da aplicação não possibilitaram redução do aging, principalmente pelo aumento do tempo de execução. A justificativa para tal está no aumento da quantidade de acessos à memória devido à variação das políticas de alocação, as quais requerem atualização dos dados que estão nas memórias cache quando as threads são realocadas. Palavras-chave: Otimização. Envelhecimento. Afinidade de threads. Paralelismo a nível de threads. OpenMP.The advancement in transistor technology has allowed an increase in the number of cores in a single chip. This, in turn, enables high-performance computing systems with better capabilities to exploit thread-level parallelism (TLP). However, this also leads to unforeseen issues related to the temperature of these systems. Reaching high temperatures speeds up the aging process of hardware components by influencing their causes (e.g., negative bias temperature instability – NBTI). In addition, this effect depends not only on the number of cores, but also the distance between them and their use. On top of that, parallel applications present various patterns, such as irregularity, unbalanced computations, or high rates of communications. These different characteristics may accentuate such adverse effects. With the preliminary stage of this dissertation, we perform thirteen well-known benchmarks in three different multicore architectures to evaluate different TLP configurations and thread placement policies and affinity strategies implemented in OpenMP. The results demonstrate no haves a configuration that delivers the best NBTI for all applications. Given this scenario, this dissertation proposes AATS, a methodology to reduce aging through the combination of TLP exploration and threads allocation strategy. AATS was employed in two ways, one that acts in a offline way running outside the application and a online that makes the optimization at run time. AATS offline showed effective results in reducing aging with a distance of only 1.02 from the best solution found in the design space exploration for the AMD 16 cores architecture. Still, it is able to find a solution in a large space exploration evaluating a reduced number of configurations, as example in the IBM 160 cores architecture in which, on average, only 1.9% of the possible configurations were evaluated. In the case of AATS online was possible to observe that the dynamic adjustments during the execution of the application did not make possible to reduce the aging, mainly due to the increase in the execution time. The justification for this is in the increase of the number of accesses to the memory due to the variation of the allocation policies, in which they require updating of the data that are in the cache memories when the threads are reallocated. Keywords: Optimization. Aging. Thread affinity. Thread-level parallelism. OpenMP.porUniversidade Federal do PampaMestrado Profissional em Engenharia de SoftwareUNIPAMPABrasilCampus AlegreteCNPQ::CIENCIAS EXATAS E DA TERRAEngenharia de softwareProgramação paralela (Computação)OtimizaçãoOpenMPSoftware engineeringParallel programming (Computer science)OptimizationOtimização do tempo de vida de processadores multicore homogêneos através da variação do grau de TLP e das políticas de alocação de threadsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNIPAMPAinstname:Universidade Federal do Pampa (UNIPAMPA)instacron:UNIPAMPAORIGINALThiarles Soares Medeiros-2021.pdfThiarles Soares Medeiros-2021.pdfapplication/pdf6594204https://repositorio.unipampa.edu.br/bitstreams/21c46a23-8158-42b9-a7ad-5d4f70590225/download5fe1fd66e71fb379ad66ba319c2b030fMD51trueAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81854https://repositorio.unipampa.edu.br/bitstreams/18394f1f-7377-4c3a-ac7d-1ae746cce1a2/downloadc9ad5aff503ef7873c4004c5b07c0b27MD52falseAnonymousREADriu/73162022-06-01 18:22:08.568open.accessoai:repositorio.unipampa.edu.br:riu/7316https://repositorio.unipampa.edu.brRepositório InstitucionalPUBhttp://dspace.unipampa.edu.br:8080/oai/requestsisbi@unipampa.edu.bropendoar:2022-06-01T18:22:08Repositório Institucional da UNIPAMPA - Universidade Federal do Pampa (UNIPAMPA)falseTElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgYW8gUmVwb3NpdMOzcmlvCkluc3RpdHVjaW9uYWwgbyBkaXJlaXRvIG7Do28tZXhjbHVzaXZvIGRlIHJlcHJvZHV6aXIsICB0cmFkdXppciAoY29uZm9ybWUgZGVmaW5pZG8gYWJhaXhvKSwgZS9vdSBkaXN0cmlidWlyIGEKc3VhIHB1YmxpY2HDp8OjbyAoaW5jbHVpbmRvIG8gcmVzdW1vKSBwb3IgdG9kbyBvIG11bmRvIG5vIGZvcm1hdG8gaW1wcmVzc28gZSBlbGV0csO0bmljbyBlIGVtIHF1YWxxdWVyIG1laW8sIGluY2x1aW5kbyBvcwpmb3JtYXRvcyDDoXVkaW8gb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIGEgVU5JUEFNUEEgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIHRyYW5zcG9yIGEgc3VhIHB1YmxpY2HDp8OjbyBwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0bwpwYXJhIGZpbnMgZGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIHRhbWLDqW0gY29uY29yZGEgcXVlICBhIFVOSVBBTVBBIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBkZSBzdWEgcHVibGljYcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwCmUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIGEgc3VhIHB1YmxpY2HDp8OjbyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4KVm9jw6ogdGFtYsOpbSBkZWNsYXJhIHF1ZSBvIGRlcMOzc2l0byBkYSBzdWEgcHVibGljYcOnw6NvIG7Do28sIHF1ZSBzZWphIGRlIHNldSBjb25oZWNpbWVudG8sIGluZnJpbmdlIGRpcmVpdG9zIGF1dG9yYWlzCmRlIG5pbmd1w6ltLgoKQ2FzbyBhIHN1YSBwdWJsaWNhw6fDo28gY29udGVuaGEgbWF0ZXJpYWwgcXVlIHZvY8OqIG7Do28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jw6ogZGVjbGFyYSBxdWUKb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBwYXJhIGNvbmNlZGVyIMOgIFVOSVBBTVBBIG9zIGRpcmVpdG9zIGFwcmVzZW50YWRvcwpuZXN0YSBsaWNlbsOnYSwgZSBxdWUgZXNzZSBtYXRlcmlhbCBkZSBwcm9wcmllZGFkZSBkZSB0ZXJjZWlyb3MgZXN0w6EgY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0bwpvdSBubyBjb250ZcO6ZG8gZGEgcHVibGljYcOnw6NvIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFBVQkxJQ0HDh8ODTyBPUkEgREVQT1NJVEFEQSBURU5IQSBTSURPIFJFU1VMVEFETyBERSBVTSBQQVRST0PDjU5JTyBPVSBBUE9JTyBERSBVTUEgQUfDik5DSUEgREUgRk9NRU5UTyBPVSBPVVRSTwpPUkdBTklTTU8sIFZPQ8OKIERFQ0xBUkEgUVVFIFJFU1BFSVRPVSBUT0RPUyBFIFFVQUlTUVVFUiBESVJFSVRPUyBERSBSRVZJU8ODTyBDT01PIFRBTULDiU0gQVMgREVNQUlTIE9CUklHQcOHw5VFUwpFWElHSURBUyBQT1IgQ09OVFJBVE8gT1UgQUNPUkRPLgoKQSBVTklQQU1QQSBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lIChzKSBvdSBvKHMpIG5vbWUocykgZG8ocykgZGV0ZW50b3IoZXMpIGRvcyBkaXJlaXRvcwphdXRvcmFpcyBkYSBwdWJsaWNhw6fDo28sIGUgbsOjbyBmYXLDoSBxdWFscXVlciBhbHRlcmHDp8OjbywgYWzDqW0gZGFxdWVsYXMgY29uY2VkaWRhcyBwb3IgZXN0YSBsaWNlbsOnYS4K |
| dc.title.pt_BR.fl_str_mv |
Otimização do tempo de vida de processadores multicore homogêneos através da variação do grau de TLP e das políticas de alocação de threads |
| title |
Otimização do tempo de vida de processadores multicore homogêneos através da variação do grau de TLP e das políticas de alocação de threads |
| spellingShingle |
Otimização do tempo de vida de processadores multicore homogêneos através da variação do grau de TLP e das políticas de alocação de threads Medeiros, Thiarles Soares CNPQ::CIENCIAS EXATAS E DA TERRA Engenharia de software Programação paralela (Computação) Otimização OpenMP Software engineering Parallel programming (Computer science) Optimization |
| title_short |
Otimização do tempo de vida de processadores multicore homogêneos através da variação do grau de TLP e das políticas de alocação de threads |
| title_full |
Otimização do tempo de vida de processadores multicore homogêneos através da variação do grau de TLP e das políticas de alocação de threads |
| title_fullStr |
Otimização do tempo de vida de processadores multicore homogêneos através da variação do grau de TLP e das políticas de alocação de threads |
| title_full_unstemmed |
Otimização do tempo de vida de processadores multicore homogêneos através da variação do grau de TLP e das políticas de alocação de threads |
| title_sort |
Otimização do tempo de vida de processadores multicore homogêneos através da variação do grau de TLP e das políticas de alocação de threads |
| author |
Medeiros, Thiarles Soares |
| author_facet |
Medeiros, Thiarles Soares |
| author_role |
author |
| dc.contributor.advisor1.fl_str_mv |
Lorenzon, Arthur Francisco |
| dc.contributor.author.fl_str_mv |
Medeiros, Thiarles Soares |
| contributor_str_mv |
Lorenzon, Arthur Francisco |
| dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA |
| topic |
CNPQ::CIENCIAS EXATAS E DA TERRA Engenharia de software Programação paralela (Computação) Otimização OpenMP Software engineering Parallel programming (Computer science) Optimization |
| dc.subject.por.fl_str_mv |
Engenharia de software Programação paralela (Computação) Otimização OpenMP Software engineering Parallel programming (Computer science) Optimization |
| description |
O avanço na tecnologia dos transistores tem permitido o aumento no número de cores em um único chip. Isso, por sua vez, possibilita o desenvolvimento de sistemas de alto desempenho com melhores capacidades para explorar o paralelismo no nível de threads (TLP). No entanto, isso também leva a problemas relacionados à temperatura desses sistemas. Alcançar altas temperaturas acelera o processo de envelhecimento dos componentes de hardware influenciando suas causas (por exemplo, instabilidade de temperatura de polarização negativa - NBTI). Adicionalmente, este efeito não depende apenas do número de cores, mas também da distância entre eles e seu uso. Além disso, as aplicações paralelas apresentam vários padrões, como irregularidade, cálculos desequilibrados ou altas taxas de comunicação. Essas diferentes características podem acentuar esses efeitos adversos. Com etapa preliminar desta dissertação, realizamos a execução de treze benchmarks bem conhecidos em três arquiteturas multicore diferentes para avaliar diferentes configurações de TLP e políticas de placement e estratégias de afinidade de threads implementadas em OpenMP. Os resultados demonstraram que não há uma configuração única que forneça o melhor NBTI para todas as aplicações. Diante deste cenário, esta dissertação propõe AATS, uma metodologia para reduzir o aging através da combinação de exploração de TLP e estratégia de alocação de threads. AATS foi empregado de duas maneiras, uma que atua de modo offline executando externamente à aplicação e uma online que faz a otimização em tempo de execução. AATS offline apresentou resultados efetivos na redução do aging com uma distância de apenas 1.02 da melhor solução encontrada na exploração de espaço de projeto para a arquitetura AMD de 16 cores. Ainda, é capaz de encontrar uma solução em um grande espaço de exploração avaliando um número reduzido de configurações, como por exemplo na arquitetura IBM de 160 cores na qual foram avaliadas, na média, apenas 1,9% das configurações possíveis. No caso do AATS online foi possível observar que os ajustes dinâmicos durante a execução da aplicação não possibilitaram redução do aging, principalmente pelo aumento do tempo de execução. A justificativa para tal está no aumento da quantidade de acessos à memória devido à variação das políticas de alocação, as quais requerem atualização dos dados que estão nas memórias cache quando as threads são realocadas. Palavras-chave: Otimização. Envelhecimento. Afinidade de threads. Paralelismo a nível de threads. OpenMP. |
| publishDate |
2021 |
| dc.date.issued.fl_str_mv |
2021-06-11 |
| dc.date.accessioned.fl_str_mv |
2022-06-01T18:22:08Z |
| dc.date.available.fl_str_mv |
2022-05-30 2022-06-01T18:22:08Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
MEDEIROS, Thiarles Soares. Otimização do tempo de vida de processadores multicore homogêneos através da variação do grau de TLP e das políticas de alocação de threads. Orientador: Arthur Francisco Lorenzon. 2021. 105p. Dissertação (Mestrado Profissional em Engenharia de Software) – Universidade Federal do Pampa, Campus Alegrete, Alegrete, 2021. |
| dc.identifier.uri.fl_str_mv |
https://repositorio.unipampa.edu.br/jspui/handle/riu/7316 |
| identifier_str_mv |
MEDEIROS, Thiarles Soares. Otimização do tempo de vida de processadores multicore homogêneos através da variação do grau de TLP e das políticas de alocação de threads. Orientador: Arthur Francisco Lorenzon. 2021. 105p. Dissertação (Mestrado Profissional em Engenharia de Software) – Universidade Federal do Pampa, Campus Alegrete, Alegrete, 2021. |
| url |
https://repositorio.unipampa.edu.br/jspui/handle/riu/7316 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal do Pampa |
| dc.publisher.program.fl_str_mv |
Mestrado Profissional em Engenharia de Software |
| dc.publisher.initials.fl_str_mv |
UNIPAMPA |
| dc.publisher.country.fl_str_mv |
Brasil |
| dc.publisher.department.fl_str_mv |
Campus Alegrete |
| publisher.none.fl_str_mv |
Universidade Federal do Pampa |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UNIPAMPA instname:Universidade Federal do Pampa (UNIPAMPA) instacron:UNIPAMPA |
| instname_str |
Universidade Federal do Pampa (UNIPAMPA) |
| instacron_str |
UNIPAMPA |
| institution |
UNIPAMPA |
| reponame_str |
Repositório Institucional da UNIPAMPA |
| collection |
Repositório Institucional da UNIPAMPA |
| bitstream.url.fl_str_mv |
https://repositorio.unipampa.edu.br/bitstreams/21c46a23-8158-42b9-a7ad-5d4f70590225/download https://repositorio.unipampa.edu.br/bitstreams/18394f1f-7377-4c3a-ac7d-1ae746cce1a2/download |
| bitstream.checksum.fl_str_mv |
5fe1fd66e71fb379ad66ba319c2b030f c9ad5aff503ef7873c4004c5b07c0b27 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UNIPAMPA - Universidade Federal do Pampa (UNIPAMPA) |
| repository.mail.fl_str_mv |
sisbi@unipampa.edu.br |
| _version_ |
1854750389675491328 |