Collaborative image classification for expansible datasets

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Padilha, Bruno
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/45/45134/tde-25082025-112227/
Resumo: During the last decade, we have been experiencing a striking evolution of Deep Learning models along with our capacity of generating and storing data. Nowadays, it is common to find application domains generating data streams, subjecting models trained on static datasets to knowledge obsolescence. Several authors are proposing learning methods based on invariant discovery inspired on causal inference. In this work, we assume the following hypothesis: the generalization of Deep Learning models for image classification is correlated to its ability to precisely capture Class Invariants in expansible datasets. In order to validate this hypothesis, we propose a 5-Step learning strategy to approximate global invariants by composition of local invariants learned from subdomain segmented data of expansible datasets. Our experiments conducted with raw video data from USP-EMS, for the classes cyclist, motorcyclist and pedestrian, showed how the domain segmentation and local invariants composition to approximate global invariants through knowledge sharing is indeed a more suitable approach to overcome generalization challenges in expansible datasets. Additionally, we are developing our experimental software framework to manage subdomain segmentation, datasets generation and computational resources to expedite parallel training in distributed environments. Next steps include scalability experiments for thousands of cameras with increased number of classes, and learning of object interactions with temporal dimension to support suspect behavior analysis with expansible datasets in multi-camera environments.
id USP_68d6dfe3593ebca611c6802f8409b524
oai_identifier_str oai:teses.usp.br:tde-25082025-112227
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Collaborative image classification for expansible datasetsClassificação colaborativa de imagens para conjuntos de dados expansíveisBig dataBig dataCausal inferenceComposição de invariantesConjuntos de dados expansíveisDeep learningDeep learningExpansive datasetsGeneralizaçãoGeneralizationInferência causalInvariant compositionDuring the last decade, we have been experiencing a striking evolution of Deep Learning models along with our capacity of generating and storing data. Nowadays, it is common to find application domains generating data streams, subjecting models trained on static datasets to knowledge obsolescence. Several authors are proposing learning methods based on invariant discovery inspired on causal inference. In this work, we assume the following hypothesis: the generalization of Deep Learning models for image classification is correlated to its ability to precisely capture Class Invariants in expansible datasets. In order to validate this hypothesis, we propose a 5-Step learning strategy to approximate global invariants by composition of local invariants learned from subdomain segmented data of expansible datasets. Our experiments conducted with raw video data from USP-EMS, for the classes cyclist, motorcyclist and pedestrian, showed how the domain segmentation and local invariants composition to approximate global invariants through knowledge sharing is indeed a more suitable approach to overcome generalization challenges in expansible datasets. Additionally, we are developing our experimental software framework to manage subdomain segmentation, datasets generation and computational resources to expedite parallel training in distributed environments. Next steps include scalability experiments for thousands of cameras with increased number of classes, and learning of object interactions with temporal dimension to support suspect behavior analysis with expansible datasets in multi-camera environments.Durante a última década, temos experimentado uma evolução marcante dos modelos de Deep Learning juntamente com a nossa capacidade de gerar e armazenar dados. Hoje em dia, é comum encontrarmos domínios de aplicação gerando fluxos de dados, submetendo modelos treinados em conjuntos de dados estáticos à obsolescência do conhecimento. Vários autores estão propondo métodos de aprendizagem baseados na descoberta de invariante inspirada na inferência causal. Neste trabalho, assumimos a seguinte hipótese: a generalização de modelos de Deep Learning para classificação de imagens está correlacionada à sua capacidade de capturar com precisão Invariantes de Classe em conjuntos de dados expansíveis. Para validar esta hipótese, propomos uma estratégia de aprendizagem em 5 etapas para aproximar invariantes globais por composição de invariantes locais aprendidos a partir de dados segmentados por subdomínios de conjuntos de dados expansíveis. Nossos experimentos conduzidos com dados brutos de vídeo da USP-EMS, para as classes ciclista, motociclista e pedestre, mostraram como a segmentação de domínio e a composição de invariantes locais para aproximar invariantes globais por meio do compartilhamento de conhecimento é de fato uma abordagem mais adequada para superar desafios de generalização em conjuntos de dados expansíveis . Além disso, estamos desenvolvendo nossa estrutura de software experimental para gerenciar segmentação de subdomínios, geração de conjuntos de dados e recursos computacionais para agilizar o treinamento paralelo em ambientes distribuídos. As próximas etapas incluem experimentos de escalabilidade para milhares de câmeras com maior número de classes e aprendizado de interações de objetos com dimensão temporal para apoiar a análise de comportamento suspeito com conjuntos de dados expansíveis em ambientes multicâmeras.Biblioteca Digitais de Teses e Dissertações da USPFerreira, João EduardoPadilha, Bruno2024-04-18info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/45/45134/tde-25082025-112227/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesseng2025-08-25T15:00:02Zoai:teses.usp.br:tde-25082025-112227Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-08-25T15:00:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Collaborative image classification for expansible datasets
Classificação colaborativa de imagens para conjuntos de dados expansíveis
title Collaborative image classification for expansible datasets
spellingShingle Collaborative image classification for expansible datasets
Padilha, Bruno
Big data
Big data
Causal inference
Composição de invariantes
Conjuntos de dados expansíveis
Deep learning
Deep learning
Expansive datasets
Generalização
Generalization
Inferência causal
Invariant composition
title_short Collaborative image classification for expansible datasets
title_full Collaborative image classification for expansible datasets
title_fullStr Collaborative image classification for expansible datasets
title_full_unstemmed Collaborative image classification for expansible datasets
title_sort Collaborative image classification for expansible datasets
author Padilha, Bruno
author_facet Padilha, Bruno
author_role author
dc.contributor.none.fl_str_mv Ferreira, João Eduardo
dc.contributor.author.fl_str_mv Padilha, Bruno
dc.subject.por.fl_str_mv Big data
Big data
Causal inference
Composição de invariantes
Conjuntos de dados expansíveis
Deep learning
Deep learning
Expansive datasets
Generalização
Generalization
Inferência causal
Invariant composition
topic Big data
Big data
Causal inference
Composição de invariantes
Conjuntos de dados expansíveis
Deep learning
Deep learning
Expansive datasets
Generalização
Generalization
Inferência causal
Invariant composition
description During the last decade, we have been experiencing a striking evolution of Deep Learning models along with our capacity of generating and storing data. Nowadays, it is common to find application domains generating data streams, subjecting models trained on static datasets to knowledge obsolescence. Several authors are proposing learning methods based on invariant discovery inspired on causal inference. In this work, we assume the following hypothesis: the generalization of Deep Learning models for image classification is correlated to its ability to precisely capture Class Invariants in expansible datasets. In order to validate this hypothesis, we propose a 5-Step learning strategy to approximate global invariants by composition of local invariants learned from subdomain segmented data of expansible datasets. Our experiments conducted with raw video data from USP-EMS, for the classes cyclist, motorcyclist and pedestrian, showed how the domain segmentation and local invariants composition to approximate global invariants through knowledge sharing is indeed a more suitable approach to overcome generalization challenges in expansible datasets. Additionally, we are developing our experimental software framework to manage subdomain segmentation, datasets generation and computational resources to expedite parallel training in distributed environments. Next steps include scalability experiments for thousands of cameras with increased number of classes, and learning of object interactions with temporal dimension to support suspect behavior analysis with expansible datasets in multi-camera environments.
publishDate 2024
dc.date.none.fl_str_mv 2024-04-18
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/45/45134/tde-25082025-112227/
url https://www.teses.usp.br/teses/disponiveis/45/45134/tde-25082025-112227/
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1848370489796329472