Incorporando as irregularidades de dados em séries temporais multivariadas.
| Ano de defesa: | 2024 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/3/3141/tde-21082025-134723/ |
Resumo: | Incorporando as Irregularidades de Dados em Séries Temporais Multivariadas. Dados de séries temporais multivariadas (MTS) são predominantes em diversos domínios, como ciência climática, saúde, finanças e operações industriais, desempenhando papel crucial no monitoramento e na previsão do comportamento de sistemas. No entanto, MTS do mundo real frequentemente apresentam irregularidades, como dados ausentes, observações assíncronas e taxas de amostragem variáveis, que impõem desafios significativos aos modelos convencionais de aprendizado de máquina. Métodos tradicionais geralmente regularizam os dados de MTS, introduzindo ineficiências e ignorando o valor inerente dessas irregularidades. Esta tese propõe novas definições e abordagens para processar irregularidades em MTS de forma direta, sem a necessidade de extenso pré-processamento, melhorando, assim, o desempenho do modelo e simplificando os fluxos de dados. A questão central desta pesquisa é saber se uma arquitetura unificada de aprendizado de máquina pode lidar de maneira eficaz tanto com MTS regulares quanto irregulares. Para esse fim, apresentamos a nova arquitetura de aprendizado de máquina GAMR, que integra redes neurais recorrentes (RNNs) e redes neurais baseadas em grafos (GNNs), permitindo capturar dependências tanto temporais quanto entre diferentes sensores. Um dos principais avanços é o desenvolvimento do mecanismo GATE, projetado para lidar com intervalos irregulares entre observações, o que aprimora a capacidade do modelo de gerenciar dados ausentes e taxas de amostragem variáveis. A arquitetura foi validada em colaboração com dois grupos de pesquisa: a equipe Neural Motion Estimation (NeMo), que foca na previsão do comportamento dinâmico de plataformas de petróleo offshore, e a iniciativa Oceanography-Informed Machine Learning (OceanML), dedicada à detecção precoce de marés de tempestade extremas a partir de dados multimodais. Os resultados demonstram que o modelo supera abordagens tradicionais ao usar as irregularidades como informações relevantes, em vez de pré-processá-las. As descobertas têm implicações significativas para o avanço da análise de MTS em aplicações complexas do mundo real, onde irregularidades são a regra, e não a exceção. |
| id |
USP_8c86dc82460b8a33a1422c82f746872b |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-21082025-134723 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Incorporando as irregularidades de dados em séries temporais multivariadas.Embracing data irregularities in multivariate time series.Análise de séries temporaisAprendizado computacionalData irregularitiesMaré (Previsão)Multivariate time seriesNachine learningRedes neuraisTime encodingIncorporando as Irregularidades de Dados em Séries Temporais Multivariadas. Dados de séries temporais multivariadas (MTS) são predominantes em diversos domínios, como ciência climática, saúde, finanças e operações industriais, desempenhando papel crucial no monitoramento e na previsão do comportamento de sistemas. No entanto, MTS do mundo real frequentemente apresentam irregularidades, como dados ausentes, observações assíncronas e taxas de amostragem variáveis, que impõem desafios significativos aos modelos convencionais de aprendizado de máquina. Métodos tradicionais geralmente regularizam os dados de MTS, introduzindo ineficiências e ignorando o valor inerente dessas irregularidades. Esta tese propõe novas definições e abordagens para processar irregularidades em MTS de forma direta, sem a necessidade de extenso pré-processamento, melhorando, assim, o desempenho do modelo e simplificando os fluxos de dados. A questão central desta pesquisa é saber se uma arquitetura unificada de aprendizado de máquina pode lidar de maneira eficaz tanto com MTS regulares quanto irregulares. Para esse fim, apresentamos a nova arquitetura de aprendizado de máquina GAMR, que integra redes neurais recorrentes (RNNs) e redes neurais baseadas em grafos (GNNs), permitindo capturar dependências tanto temporais quanto entre diferentes sensores. Um dos principais avanços é o desenvolvimento do mecanismo GATE, projetado para lidar com intervalos irregulares entre observações, o que aprimora a capacidade do modelo de gerenciar dados ausentes e taxas de amostragem variáveis. A arquitetura foi validada em colaboração com dois grupos de pesquisa: a equipe Neural Motion Estimation (NeMo), que foca na previsão do comportamento dinâmico de plataformas de petróleo offshore, e a iniciativa Oceanography-Informed Machine Learning (OceanML), dedicada à detecção precoce de marés de tempestade extremas a partir de dados multimodais. Os resultados demonstram que o modelo supera abordagens tradicionais ao usar as irregularidades como informações relevantes, em vez de pré-processá-las. As descobertas têm implicações significativas para o avanço da análise de MTS em aplicações complexas do mundo real, onde irregularidades são a regra, e não a exceção.Multivariate time series (MTS) data are prevalent in numerous domains, including climate science, healthcare, finance, and industrial operations, where they play a crucial role in monitoring and forecasting system behavior. However, real-world MTS often exhibits irregularities, such as missing data, asynchronous observations, and varying sampling rates, which pose significant challenges for conventional machine learning models. Traditional methods frequently regularize MTS data, introducing inefficiencies, and overlooking the inherent value of these irregularities. This thesis proposes new definitions and approaches to process irregularities in MTS directly, without the need for extensive preprocessing, thus improving model performance and streamlining data pipelines. The central research question addressed is whether a unified machine learning architecture can handle regular and irregular MTS effectively. To this end, we introduce a novel machine learning architecture GAMR, which integrates recurrent neural networks (RNNs) and graph neural networks (GNNs), allowing the capture of both temporal and cross-sensor dependencies. A key contribution is the development of the GATE mechanism, designed to handle irregular intervals between observations, which enhances the models ability to manage missing data and variable sampling rates. The architecture is validated through collaborations with two research groups: the Neural Motion Estimation (NeMo) team, which focuses on predicting the dynamic behavior of offshore oil platforms, and the Oceanography-Informed Machine Learning (OceanML) initiative, which targets the early detection of extreme storm tides using multimodal data. The results demonstrate that this model outperforms traditional approaches by using irregularities as informative features rather than preprocessing them. The findings have significant implications for the advancement of the analysis of MTS in complex real-world applications, where irregularities are the norm rather than the exception.Biblioteca Digitais de Teses e Dissertações da USPCosta, Anna Helena RealiBarros, Marcel Rodrigues de2024-11-12info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/3/3141/tde-21082025-134723/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2025-08-21T17:08:02Zoai:teses.usp.br:tde-21082025-134723Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-08-21T17:08:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Incorporando as irregularidades de dados em séries temporais multivariadas. Embracing data irregularities in multivariate time series. |
| title |
Incorporando as irregularidades de dados em séries temporais multivariadas. |
| spellingShingle |
Incorporando as irregularidades de dados em séries temporais multivariadas. Barros, Marcel Rodrigues de Análise de séries temporais Aprendizado computacional Data irregularities Maré (Previsão) Multivariate time series Nachine learning Redes neurais Time encoding |
| title_short |
Incorporando as irregularidades de dados em séries temporais multivariadas. |
| title_full |
Incorporando as irregularidades de dados em séries temporais multivariadas. |
| title_fullStr |
Incorporando as irregularidades de dados em séries temporais multivariadas. |
| title_full_unstemmed |
Incorporando as irregularidades de dados em séries temporais multivariadas. |
| title_sort |
Incorporando as irregularidades de dados em séries temporais multivariadas. |
| author |
Barros, Marcel Rodrigues de |
| author_facet |
Barros, Marcel Rodrigues de |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Costa, Anna Helena Reali |
| dc.contributor.author.fl_str_mv |
Barros, Marcel Rodrigues de |
| dc.subject.por.fl_str_mv |
Análise de séries temporais Aprendizado computacional Data irregularities Maré (Previsão) Multivariate time series Nachine learning Redes neurais Time encoding |
| topic |
Análise de séries temporais Aprendizado computacional Data irregularities Maré (Previsão) Multivariate time series Nachine learning Redes neurais Time encoding |
| description |
Incorporando as Irregularidades de Dados em Séries Temporais Multivariadas. Dados de séries temporais multivariadas (MTS) são predominantes em diversos domínios, como ciência climática, saúde, finanças e operações industriais, desempenhando papel crucial no monitoramento e na previsão do comportamento de sistemas. No entanto, MTS do mundo real frequentemente apresentam irregularidades, como dados ausentes, observações assíncronas e taxas de amostragem variáveis, que impõem desafios significativos aos modelos convencionais de aprendizado de máquina. Métodos tradicionais geralmente regularizam os dados de MTS, introduzindo ineficiências e ignorando o valor inerente dessas irregularidades. Esta tese propõe novas definições e abordagens para processar irregularidades em MTS de forma direta, sem a necessidade de extenso pré-processamento, melhorando, assim, o desempenho do modelo e simplificando os fluxos de dados. A questão central desta pesquisa é saber se uma arquitetura unificada de aprendizado de máquina pode lidar de maneira eficaz tanto com MTS regulares quanto irregulares. Para esse fim, apresentamos a nova arquitetura de aprendizado de máquina GAMR, que integra redes neurais recorrentes (RNNs) e redes neurais baseadas em grafos (GNNs), permitindo capturar dependências tanto temporais quanto entre diferentes sensores. Um dos principais avanços é o desenvolvimento do mecanismo GATE, projetado para lidar com intervalos irregulares entre observações, o que aprimora a capacidade do modelo de gerenciar dados ausentes e taxas de amostragem variáveis. A arquitetura foi validada em colaboração com dois grupos de pesquisa: a equipe Neural Motion Estimation (NeMo), que foca na previsão do comportamento dinâmico de plataformas de petróleo offshore, e a iniciativa Oceanography-Informed Machine Learning (OceanML), dedicada à detecção precoce de marés de tempestade extremas a partir de dados multimodais. Os resultados demonstram que o modelo supera abordagens tradicionais ao usar as irregularidades como informações relevantes, em vez de pré-processá-las. As descobertas têm implicações significativas para o avanço da análise de MTS em aplicações complexas do mundo real, onde irregularidades são a regra, e não a exceção. |
| publishDate |
2024 |
| dc.date.none.fl_str_mv |
2024-11-12 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/3/3141/tde-21082025-134723/ |
| url |
https://www.teses.usp.br/teses/disponiveis/3/3141/tde-21082025-134723/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1848370488157405184 |