Incorporando as irregularidades de dados em séries temporais multivariadas.

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Barros, Marcel Rodrigues de
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/3/3141/tde-21082025-134723/
Resumo: Incorporando as Irregularidades de Dados em Séries Temporais Multivariadas. Dados de séries temporais multivariadas (MTS) são predominantes em diversos domínios, como ciência climática, saúde, finanças e operações industriais, desempenhando papel crucial no monitoramento e na previsão do comportamento de sistemas. No entanto, MTS do mundo real frequentemente apresentam irregularidades, como dados ausentes, observações assíncronas e taxas de amostragem variáveis, que impõem desafios significativos aos modelos convencionais de aprendizado de máquina. Métodos tradicionais geralmente regularizam os dados de MTS, introduzindo ineficiências e ignorando o valor inerente dessas irregularidades. Esta tese propõe novas definições e abordagens para processar irregularidades em MTS de forma direta, sem a necessidade de extenso pré-processamento, melhorando, assim, o desempenho do modelo e simplificando os fluxos de dados. A questão central desta pesquisa é saber se uma arquitetura unificada de aprendizado de máquina pode lidar de maneira eficaz tanto com MTS regulares quanto irregulares. Para esse fim, apresentamos a nova arquitetura de aprendizado de máquina GAMR, que integra redes neurais recorrentes (RNNs) e redes neurais baseadas em grafos (GNNs), permitindo capturar dependências tanto temporais quanto entre diferentes sensores. Um dos principais avanços é o desenvolvimento do mecanismo GATE, projetado para lidar com intervalos irregulares entre observações, o que aprimora a capacidade do modelo de gerenciar dados ausentes e taxas de amostragem variáveis. A arquitetura foi validada em colaboração com dois grupos de pesquisa: a equipe Neural Motion Estimation (NeMo), que foca na previsão do comportamento dinâmico de plataformas de petróleo offshore, e a iniciativa Oceanography-Informed Machine Learning (OceanML), dedicada à detecção precoce de marés de tempestade extremas a partir de dados multimodais. Os resultados demonstram que o modelo supera abordagens tradicionais ao usar as irregularidades como informações relevantes, em vez de pré-processá-las. As descobertas têm implicações significativas para o avanço da análise de MTS em aplicações complexas do mundo real, onde irregularidades são a regra, e não a exceção.
id USP_8c86dc82460b8a33a1422c82f746872b
oai_identifier_str oai:teses.usp.br:tde-21082025-134723
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Incorporando as irregularidades de dados em séries temporais multivariadas.Embracing data irregularities in multivariate time series.Análise de séries temporaisAprendizado computacionalData irregularitiesMaré (Previsão)Multivariate time seriesNachine learningRedes neuraisTime encodingIncorporando as Irregularidades de Dados em Séries Temporais Multivariadas. Dados de séries temporais multivariadas (MTS) são predominantes em diversos domínios, como ciência climática, saúde, finanças e operações industriais, desempenhando papel crucial no monitoramento e na previsão do comportamento de sistemas. No entanto, MTS do mundo real frequentemente apresentam irregularidades, como dados ausentes, observações assíncronas e taxas de amostragem variáveis, que impõem desafios significativos aos modelos convencionais de aprendizado de máquina. Métodos tradicionais geralmente regularizam os dados de MTS, introduzindo ineficiências e ignorando o valor inerente dessas irregularidades. Esta tese propõe novas definições e abordagens para processar irregularidades em MTS de forma direta, sem a necessidade de extenso pré-processamento, melhorando, assim, o desempenho do modelo e simplificando os fluxos de dados. A questão central desta pesquisa é saber se uma arquitetura unificada de aprendizado de máquina pode lidar de maneira eficaz tanto com MTS regulares quanto irregulares. Para esse fim, apresentamos a nova arquitetura de aprendizado de máquina GAMR, que integra redes neurais recorrentes (RNNs) e redes neurais baseadas em grafos (GNNs), permitindo capturar dependências tanto temporais quanto entre diferentes sensores. Um dos principais avanços é o desenvolvimento do mecanismo GATE, projetado para lidar com intervalos irregulares entre observações, o que aprimora a capacidade do modelo de gerenciar dados ausentes e taxas de amostragem variáveis. A arquitetura foi validada em colaboração com dois grupos de pesquisa: a equipe Neural Motion Estimation (NeMo), que foca na previsão do comportamento dinâmico de plataformas de petróleo offshore, e a iniciativa Oceanography-Informed Machine Learning (OceanML), dedicada à detecção precoce de marés de tempestade extremas a partir de dados multimodais. Os resultados demonstram que o modelo supera abordagens tradicionais ao usar as irregularidades como informações relevantes, em vez de pré-processá-las. As descobertas têm implicações significativas para o avanço da análise de MTS em aplicações complexas do mundo real, onde irregularidades são a regra, e não a exceção.Multivariate time series (MTS) data are prevalent in numerous domains, including climate science, healthcare, finance, and industrial operations, where they play a crucial role in monitoring and forecasting system behavior. However, real-world MTS often exhibits irregularities, such as missing data, asynchronous observations, and varying sampling rates, which pose significant challenges for conventional machine learning models. Traditional methods frequently regularize MTS data, introducing inefficiencies, and overlooking the inherent value of these irregularities. This thesis proposes new definitions and approaches to process irregularities in MTS directly, without the need for extensive preprocessing, thus improving model performance and streamlining data pipelines. The central research question addressed is whether a unified machine learning architecture can handle regular and irregular MTS effectively. To this end, we introduce a novel machine learning architecture GAMR, which integrates recurrent neural networks (RNNs) and graph neural networks (GNNs), allowing the capture of both temporal and cross-sensor dependencies. A key contribution is the development of the GATE mechanism, designed to handle irregular intervals between observations, which enhances the models ability to manage missing data and variable sampling rates. The architecture is validated through collaborations with two research groups: the Neural Motion Estimation (NeMo) team, which focuses on predicting the dynamic behavior of offshore oil platforms, and the Oceanography-Informed Machine Learning (OceanML) initiative, which targets the early detection of extreme storm tides using multimodal data. The results demonstrate that this model outperforms traditional approaches by using irregularities as informative features rather than preprocessing them. The findings have significant implications for the advancement of the analysis of MTS in complex real-world applications, where irregularities are the norm rather than the exception.Biblioteca Digitais de Teses e Dissertações da USPCosta, Anna Helena RealiBarros, Marcel Rodrigues de2024-11-12info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/3/3141/tde-21082025-134723/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2025-08-21T17:08:02Zoai:teses.usp.br:tde-21082025-134723Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-08-21T17:08:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Incorporando as irregularidades de dados em séries temporais multivariadas.
Embracing data irregularities in multivariate time series.
title Incorporando as irregularidades de dados em séries temporais multivariadas.
spellingShingle Incorporando as irregularidades de dados em séries temporais multivariadas.
Barros, Marcel Rodrigues de
Análise de séries temporais
Aprendizado computacional
Data irregularities
Maré (Previsão)
Multivariate time series
Nachine learning
Redes neurais
Time encoding
title_short Incorporando as irregularidades de dados em séries temporais multivariadas.
title_full Incorporando as irregularidades de dados em séries temporais multivariadas.
title_fullStr Incorporando as irregularidades de dados em séries temporais multivariadas.
title_full_unstemmed Incorporando as irregularidades de dados em séries temporais multivariadas.
title_sort Incorporando as irregularidades de dados em séries temporais multivariadas.
author Barros, Marcel Rodrigues de
author_facet Barros, Marcel Rodrigues de
author_role author
dc.contributor.none.fl_str_mv Costa, Anna Helena Reali
dc.contributor.author.fl_str_mv Barros, Marcel Rodrigues de
dc.subject.por.fl_str_mv Análise de séries temporais
Aprendizado computacional
Data irregularities
Maré (Previsão)
Multivariate time series
Nachine learning
Redes neurais
Time encoding
topic Análise de séries temporais
Aprendizado computacional
Data irregularities
Maré (Previsão)
Multivariate time series
Nachine learning
Redes neurais
Time encoding
description Incorporando as Irregularidades de Dados em Séries Temporais Multivariadas. Dados de séries temporais multivariadas (MTS) são predominantes em diversos domínios, como ciência climática, saúde, finanças e operações industriais, desempenhando papel crucial no monitoramento e na previsão do comportamento de sistemas. No entanto, MTS do mundo real frequentemente apresentam irregularidades, como dados ausentes, observações assíncronas e taxas de amostragem variáveis, que impõem desafios significativos aos modelos convencionais de aprendizado de máquina. Métodos tradicionais geralmente regularizam os dados de MTS, introduzindo ineficiências e ignorando o valor inerente dessas irregularidades. Esta tese propõe novas definições e abordagens para processar irregularidades em MTS de forma direta, sem a necessidade de extenso pré-processamento, melhorando, assim, o desempenho do modelo e simplificando os fluxos de dados. A questão central desta pesquisa é saber se uma arquitetura unificada de aprendizado de máquina pode lidar de maneira eficaz tanto com MTS regulares quanto irregulares. Para esse fim, apresentamos a nova arquitetura de aprendizado de máquina GAMR, que integra redes neurais recorrentes (RNNs) e redes neurais baseadas em grafos (GNNs), permitindo capturar dependências tanto temporais quanto entre diferentes sensores. Um dos principais avanços é o desenvolvimento do mecanismo GATE, projetado para lidar com intervalos irregulares entre observações, o que aprimora a capacidade do modelo de gerenciar dados ausentes e taxas de amostragem variáveis. A arquitetura foi validada em colaboração com dois grupos de pesquisa: a equipe Neural Motion Estimation (NeMo), que foca na previsão do comportamento dinâmico de plataformas de petróleo offshore, e a iniciativa Oceanography-Informed Machine Learning (OceanML), dedicada à detecção precoce de marés de tempestade extremas a partir de dados multimodais. Os resultados demonstram que o modelo supera abordagens tradicionais ao usar as irregularidades como informações relevantes, em vez de pré-processá-las. As descobertas têm implicações significativas para o avanço da análise de MTS em aplicações complexas do mundo real, onde irregularidades são a regra, e não a exceção.
publishDate 2024
dc.date.none.fl_str_mv 2024-11-12
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/3/3141/tde-21082025-134723/
url https://www.teses.usp.br/teses/disponiveis/3/3141/tde-21082025-134723/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1848370488157405184