Combined learning for decentralized neural network training with data privacy preservation

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Ioste, Aline Rodrigheri
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/45/45134/tde-11112024-095141/
Resumo: This thesis presents CoLN (Combined Learning Network), a new approach to decentralized machine learning that employs a non-convex model focused on privacy preservation. Unlike traditional methods used in federated learning, which rely on simple parameter aggregations like weighted averages, CoLN explores solutions beyond the convex space, addressing the complexities of non-identically distributed data commonly found in deep learning scenarios. CoLN stands out as an efficient alternative for collaborative learning in industrial and research contexts, particularly due to its applicability in scenarios with limited participants, where data centralization is not feasible due to privacy or regulatory constraints. The model enables effective collaboration between distinct parties, maintaining confidentiality and delivering consistent performance in a few iterations, even in environments with few participants. This is especially relevant for shared objectives that require collaboration among different stakeholders, enhancing participants\' overall performance without the need to share raw data for centralized model training. Empirical tests demonstrate that CoLN can approximate the performance of centralized models, showing robustness across distinct neural network architectures, even with substantial variations in data among local models. With a simplified implementation, rapid adaptation to imbalanced datasets, and the ability to achieve combined generalization in few iterations, CoLN emerges as a promising alternative for collaborative learning.
id USP_3db96589e974a6dd32310edd2bff9f29
oai_identifier_str oai:teses.usp.br:tde-11112024-095141
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Combined learning for decentralized neural network training with data privacy preservationAprendizagem combinada para treinamento descentralizado de redes neurais com preservação da privacidade dos dadosAprendizado combinadoAprendizado descentralizadoAprendizado profundoCombined learningConjunto de dados não-IDDDecentralized learningDeep learningNon-IDD datasetThis thesis presents CoLN (Combined Learning Network), a new approach to decentralized machine learning that employs a non-convex model focused on privacy preservation. Unlike traditional methods used in federated learning, which rely on simple parameter aggregations like weighted averages, CoLN explores solutions beyond the convex space, addressing the complexities of non-identically distributed data commonly found in deep learning scenarios. CoLN stands out as an efficient alternative for collaborative learning in industrial and research contexts, particularly due to its applicability in scenarios with limited participants, where data centralization is not feasible due to privacy or regulatory constraints. The model enables effective collaboration between distinct parties, maintaining confidentiality and delivering consistent performance in a few iterations, even in environments with few participants. This is especially relevant for shared objectives that require collaboration among different stakeholders, enhancing participants\' overall performance without the need to share raw data for centralized model training. Empirical tests demonstrate that CoLN can approximate the performance of centralized models, showing robustness across distinct neural network architectures, even with substantial variations in data among local models. With a simplified implementation, rapid adaptation to imbalanced datasets, and the ability to achieve combined generalization in few iterations, CoLN emerges as a promising alternative for collaborative learning.Esta tese apresenta a CoLN (Combined Learning Network), uma nova abordagem de aprendizado de máquina descentralizado que utiliza um modelo não convexo focado na preservação da privacidade. Diferente dos métodos tradicionais usados no aprendizado federado, que se baseiam em agregações de parâmetros simples, como médias ponderadas, a CoLN explora soluções além do espaço convexo, abordando as complexidades de dados não identicamente distribuídos, comumente encontrados em cenários de aprendizado profundo. A CoLN se destaca como uma alternativa eficiente para o aprendizado colaborativo em contextos industriais e de pesquisa, especialmente devido à sua aplicabilidade em cenários com participantes limitados, onde a centralização de dados não é viável por motivos de privacidade ou restrições regulatórias. O modelo permite uma colaboração eficaz entre diferentes partes, mantendo a confidencialidade e alcançando desempenho consistente em poucas iterações, mesmo em ambientes com poucos participantes. Isso é particularmente relevante para objetivos compartilhados que exigem colaboração entre diferentes partes interessadas, aprimorando o desempenho geral dos participantes sem a necessidade de compartilhar dados brutos para o treinamento de um modelo centralizado. Testes empíricos demonstram que a CoLN consegue aproximar o desempenho de modelos centralizados, mostrando robustez em arquiteturas distintas de redes neurais, mesmo com variações substanciais nos dados entre os modelos locais. Com uma implementação simplificada, adaptação rápida a conjuntos de dados desbalanceados e a capacidade de atingir generalização combinada em poucas iterações, a CoLN se apresenta como uma alternativa promissora para o aprendizado colaborativo.Biblioteca Digitais de Teses e Dissertações da USPFinger, MarceloIoste, Aline Rodrigheri2024-08-12info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/45/45134/tde-11112024-095141/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesseng2024-11-11T19:30:02Zoai:teses.usp.br:tde-11112024-095141Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-11-11T19:30:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Combined learning for decentralized neural network training with data privacy preservation
Aprendizagem combinada para treinamento descentralizado de redes neurais com preservação da privacidade dos dados
title Combined learning for decentralized neural network training with data privacy preservation
spellingShingle Combined learning for decentralized neural network training with data privacy preservation
Ioste, Aline Rodrigheri
Aprendizado combinado
Aprendizado descentralizado
Aprendizado profundo
Combined learning
Conjunto de dados não-IDD
Decentralized learning
Deep learning
Non-IDD dataset
title_short Combined learning for decentralized neural network training with data privacy preservation
title_full Combined learning for decentralized neural network training with data privacy preservation
title_fullStr Combined learning for decentralized neural network training with data privacy preservation
title_full_unstemmed Combined learning for decentralized neural network training with data privacy preservation
title_sort Combined learning for decentralized neural network training with data privacy preservation
author Ioste, Aline Rodrigheri
author_facet Ioste, Aline Rodrigheri
author_role author
dc.contributor.none.fl_str_mv Finger, Marcelo
dc.contributor.author.fl_str_mv Ioste, Aline Rodrigheri
dc.subject.por.fl_str_mv Aprendizado combinado
Aprendizado descentralizado
Aprendizado profundo
Combined learning
Conjunto de dados não-IDD
Decentralized learning
Deep learning
Non-IDD dataset
topic Aprendizado combinado
Aprendizado descentralizado
Aprendizado profundo
Combined learning
Conjunto de dados não-IDD
Decentralized learning
Deep learning
Non-IDD dataset
description This thesis presents CoLN (Combined Learning Network), a new approach to decentralized machine learning that employs a non-convex model focused on privacy preservation. Unlike traditional methods used in federated learning, which rely on simple parameter aggregations like weighted averages, CoLN explores solutions beyond the convex space, addressing the complexities of non-identically distributed data commonly found in deep learning scenarios. CoLN stands out as an efficient alternative for collaborative learning in industrial and research contexts, particularly due to its applicability in scenarios with limited participants, where data centralization is not feasible due to privacy or regulatory constraints. The model enables effective collaboration between distinct parties, maintaining confidentiality and delivering consistent performance in a few iterations, even in environments with few participants. This is especially relevant for shared objectives that require collaboration among different stakeholders, enhancing participants\' overall performance without the need to share raw data for centralized model training. Empirical tests demonstrate that CoLN can approximate the performance of centralized models, showing robustness across distinct neural network architectures, even with substantial variations in data among local models. With a simplified implementation, rapid adaptation to imbalanced datasets, and the ability to achieve combined generalization in few iterations, CoLN emerges as a promising alternative for collaborative learning.
publishDate 2024
dc.date.none.fl_str_mv 2024-08-12
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/45/45134/tde-11112024-095141/
url https://www.teses.usp.br/teses/disponiveis/45/45134/tde-11112024-095141/
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1865491672501059584