Uso de ensembles de classificadores para identificação do trânsito de exoplanetas em dados com relação sinal/ruído baixa
| Ano de defesa: | 2022 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/100/100131/tde-28092022-220854/ |
Resumo: | O presente estudo busca avaliar a aplicação de ensemble de classificadores ao passo de identificação do método de detecção de exoplanetas através de seu trânsito, em especial para dados com baixa relação sinal/ruído. Para tanto, foi levantado o estado da arte da aplicação de classificadores e outras técnicas de inteligência artificial ao problema da busca por exoplanetas através de seu trânsito, foram identificadas as mais promissoras técnicas, e utilizando-as, foi proposto um modelo de ensemble do tipo stacking. Tanto as técnicas selecionadas quanto o modelo de stacking foram testados e validados em experimentos que seguiram uma estratégia de holdout repetitivo contra um conjunto de dados reais do telescópio espacial Kepler, que fora tratado com uma estratégia de enfraquecimento e piora de seu sinal astrofsico, por nós definida também no contexto desse estudo, a fim de gerar uma massa de dados com baixa relação sinal/rudo e com causa ou classe já conhecida. Também abordamos o uso de técnicas de amostragem do conjunto de teste como undersampling e oversampling em nossos experimentos. Tomamos como métricas de qualidade, em cada experimento, a acurácia, especificidade, sensibilidade e precisão dos classificadores, e com base nelas conseguimos identificar que há ganho no uso de técnicas de ensemble do tipo stacking, em relação aos melhores modelos do estado da arte testados. |
| id |
USP_644fc76a7655c08aadb34306a4e9e9b5 |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-28092022-220854 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Uso de ensembles de classificadores para identificação do trânsito de exoplanetas em dados com relação sinal/ruído baixaUsage of ensembles of classifiers for identification of exoplanets\' transits in low signal-to-noise ratio dataBaixo sinal/ruídoClassificadoresClassifiersEnsembleEnsembleExoplanetasExoplanetsLow signal-to-noiseTransitTrânsitoO presente estudo busca avaliar a aplicação de ensemble de classificadores ao passo de identificação do método de detecção de exoplanetas através de seu trânsito, em especial para dados com baixa relação sinal/ruído. Para tanto, foi levantado o estado da arte da aplicação de classificadores e outras técnicas de inteligência artificial ao problema da busca por exoplanetas através de seu trânsito, foram identificadas as mais promissoras técnicas, e utilizando-as, foi proposto um modelo de ensemble do tipo stacking. Tanto as técnicas selecionadas quanto o modelo de stacking foram testados e validados em experimentos que seguiram uma estratégia de holdout repetitivo contra um conjunto de dados reais do telescópio espacial Kepler, que fora tratado com uma estratégia de enfraquecimento e piora de seu sinal astrofsico, por nós definida também no contexto desse estudo, a fim de gerar uma massa de dados com baixa relação sinal/rudo e com causa ou classe já conhecida. Também abordamos o uso de técnicas de amostragem do conjunto de teste como undersampling e oversampling em nossos experimentos. Tomamos como métricas de qualidade, em cada experimento, a acurácia, especificidade, sensibilidade e precisão dos classificadores, e com base nelas conseguimos identificar que há ganho no uso de técnicas de ensemble do tipo stacking, em relação aos melhores modelos do estado da arte testados.This study aims to evaluate the application of ensembles of classifiers to the identification step of the transit method for exoplanet detection, in special, to the scenarios with low signal-to-noise ratio. To this end, the state of art of the application of machine learning and artificial intelligence in the search of exoplanets through the transit method was recovered, the most promising techniques were identified, and a stacking ensemble method was proposed using these techniques as its base classifiers. Both the selected techniques and the stacking model were tested in experiments following a repeated holdout strategy, over a set of real and unaltered light curves from Kepler Space Telescope, that were treated with a signal worsening and weakening strategy, also defined by us in the context of this study, in other to generate a dataset with both low signal-to-noise ratios and the real cause of the transits already known. We also studied the application of undersampling and oversampling of the training set in our experiments. In each experiment, we took as quality metrics accuracy, specificity, recall and precision, and through them, we could identify that there are gains in using stacking ensemble approach, in comparison to the state of arts best models.Biblioteca Digitais de Teses e Dissertações da USPRoman, Norton TrevisanBraga, Fernando Correia2022-09-01info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/100/100131/tde-28092022-220854/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2025-09-25T13:03:02Zoai:teses.usp.br:tde-28092022-220854Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-09-25T13:03:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Uso de ensembles de classificadores para identificação do trânsito de exoplanetas em dados com relação sinal/ruído baixa Usage of ensembles of classifiers for identification of exoplanets\' transits in low signal-to-noise ratio data |
| title |
Uso de ensembles de classificadores para identificação do trânsito de exoplanetas em dados com relação sinal/ruído baixa |
| spellingShingle |
Uso de ensembles de classificadores para identificação do trânsito de exoplanetas em dados com relação sinal/ruído baixa Braga, Fernando Correia Baixo sinal/ruído Classificadores Classifiers Ensemble Ensemble Exoplanetas Exoplanets Low signal-to-noise Transit Trânsito |
| title_short |
Uso de ensembles de classificadores para identificação do trânsito de exoplanetas em dados com relação sinal/ruído baixa |
| title_full |
Uso de ensembles de classificadores para identificação do trânsito de exoplanetas em dados com relação sinal/ruído baixa |
| title_fullStr |
Uso de ensembles de classificadores para identificação do trânsito de exoplanetas em dados com relação sinal/ruído baixa |
| title_full_unstemmed |
Uso de ensembles de classificadores para identificação do trânsito de exoplanetas em dados com relação sinal/ruído baixa |
| title_sort |
Uso de ensembles de classificadores para identificação do trânsito de exoplanetas em dados com relação sinal/ruído baixa |
| author |
Braga, Fernando Correia |
| author_facet |
Braga, Fernando Correia |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Roman, Norton Trevisan |
| dc.contributor.author.fl_str_mv |
Braga, Fernando Correia |
| dc.subject.por.fl_str_mv |
Baixo sinal/ruído Classificadores Classifiers Ensemble Ensemble Exoplanetas Exoplanets Low signal-to-noise Transit Trânsito |
| topic |
Baixo sinal/ruído Classificadores Classifiers Ensemble Ensemble Exoplanetas Exoplanets Low signal-to-noise Transit Trânsito |
| description |
O presente estudo busca avaliar a aplicação de ensemble de classificadores ao passo de identificação do método de detecção de exoplanetas através de seu trânsito, em especial para dados com baixa relação sinal/ruído. Para tanto, foi levantado o estado da arte da aplicação de classificadores e outras técnicas de inteligência artificial ao problema da busca por exoplanetas através de seu trânsito, foram identificadas as mais promissoras técnicas, e utilizando-as, foi proposto um modelo de ensemble do tipo stacking. Tanto as técnicas selecionadas quanto o modelo de stacking foram testados e validados em experimentos que seguiram uma estratégia de holdout repetitivo contra um conjunto de dados reais do telescópio espacial Kepler, que fora tratado com uma estratégia de enfraquecimento e piora de seu sinal astrofsico, por nós definida também no contexto desse estudo, a fim de gerar uma massa de dados com baixa relação sinal/rudo e com causa ou classe já conhecida. Também abordamos o uso de técnicas de amostragem do conjunto de teste como undersampling e oversampling em nossos experimentos. Tomamos como métricas de qualidade, em cada experimento, a acurácia, especificidade, sensibilidade e precisão dos classificadores, e com base nelas conseguimos identificar que há ganho no uso de técnicas de ensemble do tipo stacking, em relação aos melhores modelos do estado da arte testados. |
| publishDate |
2022 |
| dc.date.none.fl_str_mv |
2022-09-01 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/100/100131/tde-28092022-220854/ |
| url |
https://www.teses.usp.br/teses/disponiveis/100/100131/tde-28092022-220854/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1848370491832664064 |