Applied computing to study structural and enviromental properties of SDSS's galaxies / Computação aplicada ao estudo das propriedades estruturais e ambientais de galáxias do SDSS

Detalhes bibliográficos
Ano de defesa: 2017
Autor(a) principal: Diego Herbin Stalder Diaz
Orientador(a): Reinaldo Roberto Rosa, Reinaldo Ramos de Carvalho
Banca de defesa: Haroldo Fraga de Campos Velho, André Luís Batista Ribeiro, Irapuan Rodrigues de Oliveira Filho
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Instituto Nacional de Pesquisas Espaciais (INPE)
Programa de Pós-Graduação: Programa de Pós-Graduação do INPE em Computação Aplicada
Departamento: Não Informado pela instituição
País: BR
Link de acesso: http://urlib.net/sid.inpe.br/mtc-m21b/2017/05.01.11.27
Resumo: The exponential growth of data from cosmological simulations and observational catalogs has motivated the development and application of new computational techniques for the study of galaxy properties. In this context, two topics are addressed in this thesis in applied computing: (i) The study of the galaxy structural properties using a Bayesian approach; (ii) The investigation of the gaussianity of the velocity distribution of groups and clusters. We study the use of a Bayesian approach for modeling images of elliptical galaxies using a tool called GALPHAT (GALaxy PHotometric ATtributes). This work has improved the accuracy of the numerical integration involved in this application, as well its capability to handle a large data sets. Thus, the present research proposes a new pipeline, written in python, for GALPHAT, called PyPiGALHAT, developed and tested, to analyze of a large set of galaxies in a high performance computing environment (HPC). PyPiGALPHAT has been validated considering several sets of synthetic galaxy images, generated using Sérsics law. This application allowed us to improve GALPHAT and measure its ability to recover the true galaxy parameters. The results indicate that the Bayesian approach provides more robust and reliable values, compared to frequentist approaches (GALFIT). Once the improvement was established via PyPiGALPHAT, it was applied to real images of bright elliptical galaxies observed by the Sloan Digital Sky Survey (SDSS). The results of SDSS data analysis indicate that the use of PyPiGALPHAT provides complementary informations and more reliable results than a frequentist approach (eg. GALFIT). The second part of this project is related to the study of a new systematics to characterize the galaxy environment. In general the environment is defined in terms of the local density of galaxies or the mass of the dark matter halo mas of the cluster / group. In this case, we classify the groups according to their galaxy velocity distribution. We study two particular techniques to measure how far the distributions are from a Gaussian, which indicates the state of equilibrium of the system. The first method, try to identify a mixture of gaussians (two) for justifying the velocity distribution while the second simply measures the distance between two distributions (Hellingers distance). We have shown that our measurements of gaussianity are robust and reliable, and that the environment is correlated with galaxy properties, suggesting that gaussian systems have a higher infall rate, assembling more galaxies which suffered a preprocessing before entering the groups. This technique, unprecedented in cosmological applications, has proved to be an excellent tool for analyzing large-scale structures in the Universe.
id INPE_e8933c72a08c49af32e00908f91be548
oai_identifier_str oai:urlib.net:sid.inpe.br/mtc-m21b/2017/05.01.11.27.28-0
network_acronym_str INPE
network_name_str Biblioteca Digital de Teses e Dissertações do INPE
spelling info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisApplied computing to study structural and enviromental properties of SDSS's galaxies / Computação aplicada ao estudo das propriedades estruturais e ambientais de galáxias do SDSScomputação aplicada ao estudo das propriedades estruturais e ambientais de galáxias do SDSS2017-04-27Reinaldo Roberto RosaReinaldo Ramos de CarvalhoHaroldo Fraga de Campos VelhoAndré Luís Batista RibeiroIrapuan Rodrigues de Oliveira FilhoDiego Herbin Stalder DiazInstituto Nacional de Pesquisas Espaciais (INPE)Programa de Pós-Graduação do INPE em Computação AplicadaINPEBRcomputational cosmologyelliptical galaxiesbayesian statisticsgalaxies structure and environmentgroups and clusterscosmologia computacionalgaláxias elípticasestatísticas bayesianagaláxias estructura e ambientegrupos e aglomerados de galáxiasThe exponential growth of data from cosmological simulations and observational catalogs has motivated the development and application of new computational techniques for the study of galaxy properties. In this context, two topics are addressed in this thesis in applied computing: (i) The study of the galaxy structural properties using a Bayesian approach; (ii) The investigation of the gaussianity of the velocity distribution of groups and clusters. We study the use of a Bayesian approach for modeling images of elliptical galaxies using a tool called GALPHAT (GALaxy PHotometric ATtributes). This work has improved the accuracy of the numerical integration involved in this application, as well its capability to handle a large data sets. Thus, the present research proposes a new pipeline, written in python, for GALPHAT, called PyPiGALHAT, developed and tested, to analyze of a large set of galaxies in a high performance computing environment (HPC). PyPiGALPHAT has been validated considering several sets of synthetic galaxy images, generated using Sérsics law. This application allowed us to improve GALPHAT and measure its ability to recover the true galaxy parameters. The results indicate that the Bayesian approach provides more robust and reliable values, compared to frequentist approaches (GALFIT). Once the improvement was established via PyPiGALPHAT, it was applied to real images of bright elliptical galaxies observed by the Sloan Digital Sky Survey (SDSS). The results of SDSS data analysis indicate that the use of PyPiGALPHAT provides complementary informations and more reliable results than a frequentist approach (eg. GALFIT). The second part of this project is related to the study of a new systematics to characterize the galaxy environment. In general the environment is defined in terms of the local density of galaxies or the mass of the dark matter halo mas of the cluster / group. In this case, we classify the groups according to their galaxy velocity distribution. We study two particular techniques to measure how far the distributions are from a Gaussian, which indicates the state of equilibrium of the system. The first method, try to identify a mixture of gaussians (two) for justifying the velocity distribution while the second simply measures the distance between two distributions (Hellingers distance). We have shown that our measurements of gaussianity are robust and reliable, and that the environment is correlated with galaxy properties, suggesting that gaussian systems have a higher infall rate, assembling more galaxies which suffered a preprocessing before entering the groups. This technique, unprecedented in cosmological applications, has proved to be an excellent tool for analyzing large-scale structures in the Universe.O crescimento exponencial da quantidade de dados provenientes das simulações cosmológicas e de catálogos observacionais tem motivado o desenvolvimento e aplicação de novas técnicas computacionais para o estudo das propriedades das galáxias. Dentro deste contexto, dois tópicos foram abordados nesta tese em computação aplicada: (i) O estudo das propriedades estruturais de galáxias utilizando uma abordagem Bayesiana; (ii) Detecção de não-gaussianidade na distribuição de velocidades de galáxias em grupos. Inicialmente estudamos a utilização de uma abordagem Bayesiana para a modelagem de imagens de galáxias elípticas utilizando uma ferramenta chamada GALPHAT (GALaxy PHotometric ATtributes). Nesse contexto, destaca-se a necessidade de encontrar soluções para melhorar a precisão da integração numérica envolvida nesta aplicação, além de aumentar o seu desempenho para lidar com um grande volume de dados. Dessa forma, a presente pesquisa propõe um novo pipeline, escrito em python, para o GALPHAT, denominado PyPiGALPHAT (Python Pipelining GALPHAT), desenvolvido e testado, para a análise de um grande conjunto de galáxias num ambiente computacional de alto desempenho (HPC). O PyPiGALPHAT foi validado considerando vários conjuntos de imagens sintéticas de galáxias geradas utilizando a lei de Sérsic. Essa aplicação permitiu aprimorar o GALPHAT e medir a sua capacidade de recuperar os valores verdadeiros. Os resultados indicam que a abordagem Bayesiana fornece valores mais robustos e confiáveis quando comparados com abordagens frequentistas (GALFIT). Uma vez consolidado o melhoramento via PyPiGALPHAT, o mesmo foi aplicado sobre imagens reais de galáxias elípticas brilhantes, observadas pelo Sloan Digital Sky Survey (SDSS). Os resultados da análise dos dados do SDSS indicam que o uso do PyPiGALPHAT fornece informações complementares e mais confiáveis, sobre os parâmetros estruturais, em comparação com a abordagem frequentista (GALFIT). A segunda parte desta tese relaciona-se com o estudo de uma nova sistemática para caracterizar o ambiente onde as galáxias se encontram. Em geral o ambiente é definido em termos da densidade local de galáxias ou da massa do halo de matéria escura do grupo/aglomerado. Neste caso, utilizamos a distribuição de velocidades das galáxias pertencentes à estrutura. Estudamos duas particulares técnicas de medida do quanto a distribuição se afasta de uma Gaussiana, que indica o estado de equilíbrio do sistema. A primeira procura ajustar duas gaussianas à distribuição de velocidades enquanto que a segunda mede simplesmente a distância entre duas distribuições (Distância de Hellinger). Desta forma, o ambiente assim definido mostrou-se eficaz em estabelecer relações entre as propriedades das galáxias e o grau de gaussianidade da distribuição de velocidades, evidenciando o processo de pré-processamento dos sistemas galácticos em pequenos grupos ao longo de filamentos antes que sejam incorporados em aglomerados massivos. Esta técnica, inédita em aplicações cosmológicas mostrou-se uma excelente ferramenta de análise das estruturas em grande escala no Universo.http://urlib.net/sid.inpe.br/mtc-m21b/2017/05.01.11.27info:eu-repo/semantics/openAccessengreponame:Biblioteca Digital de Teses e Dissertações do INPEinstname:Instituto Nacional de Pesquisas Espaciais (INPE)instacron:INPE2021-07-31T06:55:21Zoai:urlib.net:sid.inpe.br/mtc-m21b/2017/05.01.11.27.28-0Biblioteca Digital de Teses e Dissertaçõeshttp://bibdigital.sid.inpe.br/PUBhttp://bibdigital.sid.inpe.br/col/iconet.com.br/banon/2003/11.21.21.08/doc/oai.cgiopendoar:32772021-07-31 06:55:22.418Biblioteca Digital de Teses e Dissertações do INPE - Instituto Nacional de Pesquisas Espaciais (INPE)false
dc.title.en.fl_str_mv Applied computing to study structural and enviromental properties of SDSS's galaxies / Computação aplicada ao estudo das propriedades estruturais e ambientais de galáxias do SDSS
dc.title.alternative.pt.fl_str_mv computação aplicada ao estudo das propriedades estruturais e ambientais de galáxias do SDSS
title Applied computing to study structural and enviromental properties of SDSS's galaxies / Computação aplicada ao estudo das propriedades estruturais e ambientais de galáxias do SDSS
spellingShingle Applied computing to study structural and enviromental properties of SDSS's galaxies / Computação aplicada ao estudo das propriedades estruturais e ambientais de galáxias do SDSS
Diego Herbin Stalder Diaz
title_short Applied computing to study structural and enviromental properties of SDSS's galaxies / Computação aplicada ao estudo das propriedades estruturais e ambientais de galáxias do SDSS
title_full Applied computing to study structural and enviromental properties of SDSS's galaxies / Computação aplicada ao estudo das propriedades estruturais e ambientais de galáxias do SDSS
title_fullStr Applied computing to study structural and enviromental properties of SDSS's galaxies / Computação aplicada ao estudo das propriedades estruturais e ambientais de galáxias do SDSS
title_full_unstemmed Applied computing to study structural and enviromental properties of SDSS's galaxies / Computação aplicada ao estudo das propriedades estruturais e ambientais de galáxias do SDSS
title_sort Applied computing to study structural and enviromental properties of SDSS's galaxies / Computação aplicada ao estudo das propriedades estruturais e ambientais de galáxias do SDSS
author Diego Herbin Stalder Diaz
author_facet Diego Herbin Stalder Diaz
author_role author
dc.contributor.advisor1.fl_str_mv Reinaldo Roberto Rosa
dc.contributor.advisor2.fl_str_mv Reinaldo Ramos de Carvalho
dc.contributor.referee1.fl_str_mv Haroldo Fraga de Campos Velho
dc.contributor.referee2.fl_str_mv André Luís Batista Ribeiro
dc.contributor.referee3.fl_str_mv Irapuan Rodrigues de Oliveira Filho
dc.contributor.author.fl_str_mv Diego Herbin Stalder Diaz
contributor_str_mv Reinaldo Roberto Rosa
Reinaldo Ramos de Carvalho
Haroldo Fraga de Campos Velho
André Luís Batista Ribeiro
Irapuan Rodrigues de Oliveira Filho
dc.description.abstract.por.fl_txt_mv The exponential growth of data from cosmological simulations and observational catalogs has motivated the development and application of new computational techniques for the study of galaxy properties. In this context, two topics are addressed in this thesis in applied computing: (i) The study of the galaxy structural properties using a Bayesian approach; (ii) The investigation of the gaussianity of the velocity distribution of groups and clusters. We study the use of a Bayesian approach for modeling images of elliptical galaxies using a tool called GALPHAT (GALaxy PHotometric ATtributes). This work has improved the accuracy of the numerical integration involved in this application, as well its capability to handle a large data sets. Thus, the present research proposes a new pipeline, written in python, for GALPHAT, called PyPiGALHAT, developed and tested, to analyze of a large set of galaxies in a high performance computing environment (HPC). PyPiGALPHAT has been validated considering several sets of synthetic galaxy images, generated using Sérsics law. This application allowed us to improve GALPHAT and measure its ability to recover the true galaxy parameters. The results indicate that the Bayesian approach provides more robust and reliable values, compared to frequentist approaches (GALFIT). Once the improvement was established via PyPiGALPHAT, it was applied to real images of bright elliptical galaxies observed by the Sloan Digital Sky Survey (SDSS). The results of SDSS data analysis indicate that the use of PyPiGALPHAT provides complementary informations and more reliable results than a frequentist approach (eg. GALFIT). The second part of this project is related to the study of a new systematics to characterize the galaxy environment. In general the environment is defined in terms of the local density of galaxies or the mass of the dark matter halo mas of the cluster / group. In this case, we classify the groups according to their galaxy velocity distribution. We study two particular techniques to measure how far the distributions are from a Gaussian, which indicates the state of equilibrium of the system. The first method, try to identify a mixture of gaussians (two) for justifying the velocity distribution while the second simply measures the distance between two distributions (Hellingers distance). We have shown that our measurements of gaussianity are robust and reliable, and that the environment is correlated with galaxy properties, suggesting that gaussian systems have a higher infall rate, assembling more galaxies which suffered a preprocessing before entering the groups. This technique, unprecedented in cosmological applications, has proved to be an excellent tool for analyzing large-scale structures in the Universe.
O crescimento exponencial da quantidade de dados provenientes das simulações cosmológicas e de catálogos observacionais tem motivado o desenvolvimento e aplicação de novas técnicas computacionais para o estudo das propriedades das galáxias. Dentro deste contexto, dois tópicos foram abordados nesta tese em computação aplicada: (i) O estudo das propriedades estruturais de galáxias utilizando uma abordagem Bayesiana; (ii) Detecção de não-gaussianidade na distribuição de velocidades de galáxias em grupos. Inicialmente estudamos a utilização de uma abordagem Bayesiana para a modelagem de imagens de galáxias elípticas utilizando uma ferramenta chamada GALPHAT (GALaxy PHotometric ATtributes). Nesse contexto, destaca-se a necessidade de encontrar soluções para melhorar a precisão da integração numérica envolvida nesta aplicação, além de aumentar o seu desempenho para lidar com um grande volume de dados. Dessa forma, a presente pesquisa propõe um novo pipeline, escrito em python, para o GALPHAT, denominado PyPiGALPHAT (Python Pipelining GALPHAT), desenvolvido e testado, para a análise de um grande conjunto de galáxias num ambiente computacional de alto desempenho (HPC). O PyPiGALPHAT foi validado considerando vários conjuntos de imagens sintéticas de galáxias geradas utilizando a lei de Sérsic. Essa aplicação permitiu aprimorar o GALPHAT e medir a sua capacidade de recuperar os valores verdadeiros. Os resultados indicam que a abordagem Bayesiana fornece valores mais robustos e confiáveis quando comparados com abordagens frequentistas (GALFIT). Uma vez consolidado o melhoramento via PyPiGALPHAT, o mesmo foi aplicado sobre imagens reais de galáxias elípticas brilhantes, observadas pelo Sloan Digital Sky Survey (SDSS). Os resultados da análise dos dados do SDSS indicam que o uso do PyPiGALPHAT fornece informações complementares e mais confiáveis, sobre os parâmetros estruturais, em comparação com a abordagem frequentista (GALFIT). A segunda parte desta tese relaciona-se com o estudo de uma nova sistemática para caracterizar o ambiente onde as galáxias se encontram. Em geral o ambiente é definido em termos da densidade local de galáxias ou da massa do halo de matéria escura do grupo/aglomerado. Neste caso, utilizamos a distribuição de velocidades das galáxias pertencentes à estrutura. Estudamos duas particulares técnicas de medida do quanto a distribuição se afasta de uma Gaussiana, que indica o estado de equilíbrio do sistema. A primeira procura ajustar duas gaussianas à distribuição de velocidades enquanto que a segunda mede simplesmente a distância entre duas distribuições (Distância de Hellinger). Desta forma, o ambiente assim definido mostrou-se eficaz em estabelecer relações entre as propriedades das galáxias e o grau de gaussianidade da distribuição de velocidades, evidenciando o processo de pré-processamento dos sistemas galácticos em pequenos grupos ao longo de filamentos antes que sejam incorporados em aglomerados massivos. Esta técnica, inédita em aplicações cosmológicas mostrou-se uma excelente ferramenta de análise das estruturas em grande escala no Universo.
description The exponential growth of data from cosmological simulations and observational catalogs has motivated the development and application of new computational techniques for the study of galaxy properties. In this context, two topics are addressed in this thesis in applied computing: (i) The study of the galaxy structural properties using a Bayesian approach; (ii) The investigation of the gaussianity of the velocity distribution of groups and clusters. We study the use of a Bayesian approach for modeling images of elliptical galaxies using a tool called GALPHAT (GALaxy PHotometric ATtributes). This work has improved the accuracy of the numerical integration involved in this application, as well its capability to handle a large data sets. Thus, the present research proposes a new pipeline, written in python, for GALPHAT, called PyPiGALHAT, developed and tested, to analyze of a large set of galaxies in a high performance computing environment (HPC). PyPiGALPHAT has been validated considering several sets of synthetic galaxy images, generated using Sérsics law. This application allowed us to improve GALPHAT and measure its ability to recover the true galaxy parameters. The results indicate that the Bayesian approach provides more robust and reliable values, compared to frequentist approaches (GALFIT). Once the improvement was established via PyPiGALPHAT, it was applied to real images of bright elliptical galaxies observed by the Sloan Digital Sky Survey (SDSS). The results of SDSS data analysis indicate that the use of PyPiGALPHAT provides complementary informations and more reliable results than a frequentist approach (eg. GALFIT). The second part of this project is related to the study of a new systematics to characterize the galaxy environment. In general the environment is defined in terms of the local density of galaxies or the mass of the dark matter halo mas of the cluster / group. In this case, we classify the groups according to their galaxy velocity distribution. We study two particular techniques to measure how far the distributions are from a Gaussian, which indicates the state of equilibrium of the system. The first method, try to identify a mixture of gaussians (two) for justifying the velocity distribution while the second simply measures the distance between two distributions (Hellingers distance). We have shown that our measurements of gaussianity are robust and reliable, and that the environment is correlated with galaxy properties, suggesting that gaussian systems have a higher infall rate, assembling more galaxies which suffered a preprocessing before entering the groups. This technique, unprecedented in cosmological applications, has proved to be an excellent tool for analyzing large-scale structures in the Universe.
publishDate 2017
dc.date.issued.fl_str_mv 2017-04-27
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
status_str publishedVersion
format doctoralThesis
dc.identifier.uri.fl_str_mv http://urlib.net/sid.inpe.br/mtc-m21b/2017/05.01.11.27
url http://urlib.net/sid.inpe.br/mtc-m21b/2017/05.01.11.27
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Instituto Nacional de Pesquisas Espaciais (INPE)
dc.publisher.program.fl_str_mv Programa de Pós-Graduação do INPE em Computação Aplicada
dc.publisher.initials.fl_str_mv INPE
dc.publisher.country.fl_str_mv BR
publisher.none.fl_str_mv Instituto Nacional de Pesquisas Espaciais (INPE)
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações do INPE
instname:Instituto Nacional de Pesquisas Espaciais (INPE)
instacron:INPE
reponame_str Biblioteca Digital de Teses e Dissertações do INPE
collection Biblioteca Digital de Teses e Dissertações do INPE
instname_str Instituto Nacional de Pesquisas Espaciais (INPE)
instacron_str INPE
institution INPE
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações do INPE - Instituto Nacional de Pesquisas Espaciais (INPE)
repository.mail.fl_str_mv
publisher_program_txtF_mv Programa de Pós-Graduação do INPE em Computação Aplicada
contributor_advisor1_txtF_mv Reinaldo Roberto Rosa
_version_ 1706805040513024000