Collaborative image classification for expansible datasets
| Ano de defesa: | 2024 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | eng |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/45/45134/tde-25082025-112227/ |
Resumo: | During the last decade, we have been experiencing a striking evolution of Deep Learning models along with our capacity of generating and storing data. Nowadays, it is common to find application domains generating data streams, subjecting models trained on static datasets to knowledge obsolescence. Several authors are proposing learning methods based on invariant discovery inspired on causal inference. In this work, we assume the following hypothesis: the generalization of Deep Learning models for image classification is correlated to its ability to precisely capture Class Invariants in expansible datasets. In order to validate this hypothesis, we propose a 5-Step learning strategy to approximate global invariants by composition of local invariants learned from subdomain segmented data of expansible datasets. Our experiments conducted with raw video data from USP-EMS, for the classes cyclist, motorcyclist and pedestrian, showed how the domain segmentation and local invariants composition to approximate global invariants through knowledge sharing is indeed a more suitable approach to overcome generalization challenges in expansible datasets. Additionally, we are developing our experimental software framework to manage subdomain segmentation, datasets generation and computational resources to expedite parallel training in distributed environments. Next steps include scalability experiments for thousands of cameras with increased number of classes, and learning of object interactions with temporal dimension to support suspect behavior analysis with expansible datasets in multi-camera environments. |
| id |
USP_68d6dfe3593ebca611c6802f8409b524 |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-25082025-112227 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Collaborative image classification for expansible datasetsClassificação colaborativa de imagens para conjuntos de dados expansíveisBig dataBig dataCausal inferenceComposição de invariantesConjuntos de dados expansíveisDeep learningDeep learningExpansive datasetsGeneralizaçãoGeneralizationInferência causalInvariant compositionDuring the last decade, we have been experiencing a striking evolution of Deep Learning models along with our capacity of generating and storing data. Nowadays, it is common to find application domains generating data streams, subjecting models trained on static datasets to knowledge obsolescence. Several authors are proposing learning methods based on invariant discovery inspired on causal inference. In this work, we assume the following hypothesis: the generalization of Deep Learning models for image classification is correlated to its ability to precisely capture Class Invariants in expansible datasets. In order to validate this hypothesis, we propose a 5-Step learning strategy to approximate global invariants by composition of local invariants learned from subdomain segmented data of expansible datasets. Our experiments conducted with raw video data from USP-EMS, for the classes cyclist, motorcyclist and pedestrian, showed how the domain segmentation and local invariants composition to approximate global invariants through knowledge sharing is indeed a more suitable approach to overcome generalization challenges in expansible datasets. Additionally, we are developing our experimental software framework to manage subdomain segmentation, datasets generation and computational resources to expedite parallel training in distributed environments. Next steps include scalability experiments for thousands of cameras with increased number of classes, and learning of object interactions with temporal dimension to support suspect behavior analysis with expansible datasets in multi-camera environments.Durante a última década, temos experimentado uma evolução marcante dos modelos de Deep Learning juntamente com a nossa capacidade de gerar e armazenar dados. Hoje em dia, é comum encontrarmos domínios de aplicação gerando fluxos de dados, submetendo modelos treinados em conjuntos de dados estáticos à obsolescência do conhecimento. Vários autores estão propondo métodos de aprendizagem baseados na descoberta de invariante inspirada na inferência causal. Neste trabalho, assumimos a seguinte hipótese: a generalização de modelos de Deep Learning para classificação de imagens está correlacionada à sua capacidade de capturar com precisão Invariantes de Classe em conjuntos de dados expansíveis. Para validar esta hipótese, propomos uma estratégia de aprendizagem em 5 etapas para aproximar invariantes globais por composição de invariantes locais aprendidos a partir de dados segmentados por subdomínios de conjuntos de dados expansíveis. Nossos experimentos conduzidos com dados brutos de vídeo da USP-EMS, para as classes ciclista, motociclista e pedestre, mostraram como a segmentação de domínio e a composição de invariantes locais para aproximar invariantes globais por meio do compartilhamento de conhecimento é de fato uma abordagem mais adequada para superar desafios de generalização em conjuntos de dados expansíveis . Além disso, estamos desenvolvendo nossa estrutura de software experimental para gerenciar segmentação de subdomínios, geração de conjuntos de dados e recursos computacionais para agilizar o treinamento paralelo em ambientes distribuídos. As próximas etapas incluem experimentos de escalabilidade para milhares de câmeras com maior número de classes e aprendizado de interações de objetos com dimensão temporal para apoiar a análise de comportamento suspeito com conjuntos de dados expansíveis em ambientes multicâmeras.Biblioteca Digitais de Teses e Dissertações da USPFerreira, João EduardoPadilha, Bruno2024-04-18info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/45/45134/tde-25082025-112227/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesseng2025-08-25T15:00:02Zoai:teses.usp.br:tde-25082025-112227Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-08-25T15:00:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Collaborative image classification for expansible datasets Classificação colaborativa de imagens para conjuntos de dados expansíveis |
| title |
Collaborative image classification for expansible datasets |
| spellingShingle |
Collaborative image classification for expansible datasets Padilha, Bruno Big data Big data Causal inference Composição de invariantes Conjuntos de dados expansíveis Deep learning Deep learning Expansive datasets Generalização Generalization Inferência causal Invariant composition |
| title_short |
Collaborative image classification for expansible datasets |
| title_full |
Collaborative image classification for expansible datasets |
| title_fullStr |
Collaborative image classification for expansible datasets |
| title_full_unstemmed |
Collaborative image classification for expansible datasets |
| title_sort |
Collaborative image classification for expansible datasets |
| author |
Padilha, Bruno |
| author_facet |
Padilha, Bruno |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Ferreira, João Eduardo |
| dc.contributor.author.fl_str_mv |
Padilha, Bruno |
| dc.subject.por.fl_str_mv |
Big data Big data Causal inference Composição de invariantes Conjuntos de dados expansíveis Deep learning Deep learning Expansive datasets Generalização Generalization Inferência causal Invariant composition |
| topic |
Big data Big data Causal inference Composição de invariantes Conjuntos de dados expansíveis Deep learning Deep learning Expansive datasets Generalização Generalization Inferência causal Invariant composition |
| description |
During the last decade, we have been experiencing a striking evolution of Deep Learning models along with our capacity of generating and storing data. Nowadays, it is common to find application domains generating data streams, subjecting models trained on static datasets to knowledge obsolescence. Several authors are proposing learning methods based on invariant discovery inspired on causal inference. In this work, we assume the following hypothesis: the generalization of Deep Learning models for image classification is correlated to its ability to precisely capture Class Invariants in expansible datasets. In order to validate this hypothesis, we propose a 5-Step learning strategy to approximate global invariants by composition of local invariants learned from subdomain segmented data of expansible datasets. Our experiments conducted with raw video data from USP-EMS, for the classes cyclist, motorcyclist and pedestrian, showed how the domain segmentation and local invariants composition to approximate global invariants through knowledge sharing is indeed a more suitable approach to overcome generalization challenges in expansible datasets. Additionally, we are developing our experimental software framework to manage subdomain segmentation, datasets generation and computational resources to expedite parallel training in distributed environments. Next steps include scalability experiments for thousands of cameras with increased number of classes, and learning of object interactions with temporal dimension to support suspect behavior analysis with expansible datasets in multi-camera environments. |
| publishDate |
2024 |
| dc.date.none.fl_str_mv |
2024-04-18 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/45/45134/tde-25082025-112227/ |
| url |
https://www.teses.usp.br/teses/disponiveis/45/45134/tde-25082025-112227/ |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1848370489796329472 |