Algoritmo para o aprendizado via espaço de aprendizado de W-operadores multicamadas

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Feldman, Mariana de Sousa
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/45/45134/tde-14012025-161445/
Resumo: Técnicas de Morfologia Matemática desempenham um papel fundamental no processamento de imagens digitais, especialmente por meio de operadores morfológicos. Entre eles, destacam-se os W-operadores, uma classe específica que realiza transformações em imagens binárias, localmente definidas em uma janela W e invariantes por translação. Algumas classes de W-operadores podem ser representadas por uma composição de n W-operadores, o que equivale a um W-operador localmente definido na janela dada pela soma de Minkowski das n janelas. Esta classe de W-operadores, denominados W-operadores multicamadas, permite a representação de filtros morfológicos e outras classes de operadores nos contextos de transformação e classificação de imagens. Além disso, W-operadores multicamadas são um caso especial das redes neurais morfológicas discretas. A classe dos W-operadores multicamadas pode ser decomposta em subclasses, cada uma associada a uma sequência específica de janelas. O espaço dessas subclasses forma um subconjunto de um reticulado Booleano que, quando considerado como um Espaço de Aprendizado, permite o aprendizado de W-operadores multicamadas por meio da minimização de uma função de erro utilizando o algoritmo do Reticulado Descendente. Esse processo de otimização no espaço de aprendizado permite o aprendizado das janelas e das funções Booleanas características de cada W-operador, de maneira eficiente, sem a necessidade de uma busca exaustiva. Neste trabalho, desenvolvemos um algoritmo capaz de aprender W-operadores multicamadas para os contextos de transformação e classificação de imagens chamado de Algoritmo do Reticulado Descendente Para o Aprendizado de W-operadores Multicamadas. Aplicamos esse algoritmo a problemas práticos, como o reconhecimento de bordas em imagens ruidosas, o aprendizado da função de transição do Conway\'s Game of Life, e a classificação de dígitos manuscritos na base MNIST. Para abordar esses problemas mais complexos, foi implementada uma otimização da busca no Espaço de Aprendizado, incluindo a exploração estocástica das cadeias e a vetorização dos dados em GPU. Evidenciamos características distintivas do método, como sua alta interpretabilidade, consistência lógica e transparência, com capacidade de aprendizado com pouquíssimas amostras de dados, que contrastam com muitos métodos modernos de aprendizado baseados em redes neurais. Embora o método apresente limitações inerentes à sua natureza combinatória, o objetivo deste trabalho foi encontrar uma solução em tempo hábil com erro aceitável e consistência lógica do operador estimado.
id USP_ba49b1c7c8b11f6b577ec4461f72776e
oai_identifier_str oai:teses.usp.br:tde-14012025-161445
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Algoritmo para o aprendizado via espaço de aprendizado de W-operadores multicamadasAlgorithm for learning multilayer W-operators via learning spaceAprendizado de máquinaEspaço de aprendizadoLearning spaceMachine learningMathematical morphologyMorfologia matemáticaW-operadorW-operatorTécnicas de Morfologia Matemática desempenham um papel fundamental no processamento de imagens digitais, especialmente por meio de operadores morfológicos. Entre eles, destacam-se os W-operadores, uma classe específica que realiza transformações em imagens binárias, localmente definidas em uma janela W e invariantes por translação. Algumas classes de W-operadores podem ser representadas por uma composição de n W-operadores, o que equivale a um W-operador localmente definido na janela dada pela soma de Minkowski das n janelas. Esta classe de W-operadores, denominados W-operadores multicamadas, permite a representação de filtros morfológicos e outras classes de operadores nos contextos de transformação e classificação de imagens. Além disso, W-operadores multicamadas são um caso especial das redes neurais morfológicas discretas. A classe dos W-operadores multicamadas pode ser decomposta em subclasses, cada uma associada a uma sequência específica de janelas. O espaço dessas subclasses forma um subconjunto de um reticulado Booleano que, quando considerado como um Espaço de Aprendizado, permite o aprendizado de W-operadores multicamadas por meio da minimização de uma função de erro utilizando o algoritmo do Reticulado Descendente. Esse processo de otimização no espaço de aprendizado permite o aprendizado das janelas e das funções Booleanas características de cada W-operador, de maneira eficiente, sem a necessidade de uma busca exaustiva. Neste trabalho, desenvolvemos um algoritmo capaz de aprender W-operadores multicamadas para os contextos de transformação e classificação de imagens chamado de Algoritmo do Reticulado Descendente Para o Aprendizado de W-operadores Multicamadas. Aplicamos esse algoritmo a problemas práticos, como o reconhecimento de bordas em imagens ruidosas, o aprendizado da função de transição do Conway\'s Game of Life, e a classificação de dígitos manuscritos na base MNIST. Para abordar esses problemas mais complexos, foi implementada uma otimização da busca no Espaço de Aprendizado, incluindo a exploração estocástica das cadeias e a vetorização dos dados em GPU. Evidenciamos características distintivas do método, como sua alta interpretabilidade, consistência lógica e transparência, com capacidade de aprendizado com pouquíssimas amostras de dados, que contrastam com muitos métodos modernos de aprendizado baseados em redes neurais. Embora o método apresente limitações inerentes à sua natureza combinatória, o objetivo deste trabalho foi encontrar uma solução em tempo hábil com erro aceitável e consistência lógica do operador estimado.Mathematical Morphology techniques play a fundamental role in digital image processing, especially through morphological operators. Among them, W-operators stand out, a specific class that performs transformations on binary images, locally defined within a window W and translation-invariant. Some classes of W-operators can be represented by a composition of n W-operators, which is equivalent to a W-operator locally defined within the window given by the Minkowski sum of the n windows. This class of W-operators, called multilayer W-operators, allows the representation of morphological filters and other classes of operators in the contexts of image transformation and classification. Additionally, multilayer W-operators are a special case of discrete morphological neural networks. The class of multilayer W-operators can be decomposed into subclasses, each associated with a specific sequence of windows. The space of these subclasses forms a subset of a Boolean lattice that, when considered as a Learning Space, enables the learning of multilayer W-operators by minimizing an error function using the stochastic lattice descent algorithm algorithm. This optimization process in the learning space allows the learning of the windows and the Boolean functions characteristic of each W-operator efficiently, without the need for exhaustive search. In this work, we developed an algorithm, The Lattice Descent Algorithm for Learning Multilayer W-operators, capable of learning multilayer W-operators for the contexts of image transformation and classification. We applied this algorithm to practical problems such as edge recognition in noisy images, learning the transition function of Conway\'s Game of Life, and classifying handwritten digits in the MNIST database. To address these more complex problems, an optimization of the search in the Learning Space was implemented, including stochastic exploration of the chains and data vectorization on the GPU. We highlight distinctive characteristics of the method, such as its high interpretability, logical consistency, and transparency, with the ability to learn with very few data samples, which contrast with many modern learning methods based on neural networks. Although the method has limitations inherent to its combinatorial nature, the goal of this work was to find a solution in a timely manner with acceptable error and logical consistency of the estimated operator.Biblioteca Digitais de Teses e Dissertações da USPBarrera, JuniorFeldman, Mariana de Sousa2024-11-14info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/45/45134/tde-14012025-161445/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2025-01-21T18:13:02Zoai:teses.usp.br:tde-14012025-161445Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-01-21T18:13:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Algoritmo para o aprendizado via espaço de aprendizado de W-operadores multicamadas
Algorithm for learning multilayer W-operators via learning space
title Algoritmo para o aprendizado via espaço de aprendizado de W-operadores multicamadas
spellingShingle Algoritmo para o aprendizado via espaço de aprendizado de W-operadores multicamadas
Feldman, Mariana de Sousa
Aprendizado de máquina
Espaço de aprendizado
Learning space
Machine learning
Mathematical morphology
Morfologia matemática
W-operador
W-operator
title_short Algoritmo para o aprendizado via espaço de aprendizado de W-operadores multicamadas
title_full Algoritmo para o aprendizado via espaço de aprendizado de W-operadores multicamadas
title_fullStr Algoritmo para o aprendizado via espaço de aprendizado de W-operadores multicamadas
title_full_unstemmed Algoritmo para o aprendizado via espaço de aprendizado de W-operadores multicamadas
title_sort Algoritmo para o aprendizado via espaço de aprendizado de W-operadores multicamadas
author Feldman, Mariana de Sousa
author_facet Feldman, Mariana de Sousa
author_role author
dc.contributor.none.fl_str_mv Barrera, Junior
dc.contributor.author.fl_str_mv Feldman, Mariana de Sousa
dc.subject.por.fl_str_mv Aprendizado de máquina
Espaço de aprendizado
Learning space
Machine learning
Mathematical morphology
Morfologia matemática
W-operador
W-operator
topic Aprendizado de máquina
Espaço de aprendizado
Learning space
Machine learning
Mathematical morphology
Morfologia matemática
W-operador
W-operator
description Técnicas de Morfologia Matemática desempenham um papel fundamental no processamento de imagens digitais, especialmente por meio de operadores morfológicos. Entre eles, destacam-se os W-operadores, uma classe específica que realiza transformações em imagens binárias, localmente definidas em uma janela W e invariantes por translação. Algumas classes de W-operadores podem ser representadas por uma composição de n W-operadores, o que equivale a um W-operador localmente definido na janela dada pela soma de Minkowski das n janelas. Esta classe de W-operadores, denominados W-operadores multicamadas, permite a representação de filtros morfológicos e outras classes de operadores nos contextos de transformação e classificação de imagens. Além disso, W-operadores multicamadas são um caso especial das redes neurais morfológicas discretas. A classe dos W-operadores multicamadas pode ser decomposta em subclasses, cada uma associada a uma sequência específica de janelas. O espaço dessas subclasses forma um subconjunto de um reticulado Booleano que, quando considerado como um Espaço de Aprendizado, permite o aprendizado de W-operadores multicamadas por meio da minimização de uma função de erro utilizando o algoritmo do Reticulado Descendente. Esse processo de otimização no espaço de aprendizado permite o aprendizado das janelas e das funções Booleanas características de cada W-operador, de maneira eficiente, sem a necessidade de uma busca exaustiva. Neste trabalho, desenvolvemos um algoritmo capaz de aprender W-operadores multicamadas para os contextos de transformação e classificação de imagens chamado de Algoritmo do Reticulado Descendente Para o Aprendizado de W-operadores Multicamadas. Aplicamos esse algoritmo a problemas práticos, como o reconhecimento de bordas em imagens ruidosas, o aprendizado da função de transição do Conway\'s Game of Life, e a classificação de dígitos manuscritos na base MNIST. Para abordar esses problemas mais complexos, foi implementada uma otimização da busca no Espaço de Aprendizado, incluindo a exploração estocástica das cadeias e a vetorização dos dados em GPU. Evidenciamos características distintivas do método, como sua alta interpretabilidade, consistência lógica e transparência, com capacidade de aprendizado com pouquíssimas amostras de dados, que contrastam com muitos métodos modernos de aprendizado baseados em redes neurais. Embora o método apresente limitações inerentes à sua natureza combinatória, o objetivo deste trabalho foi encontrar uma solução em tempo hábil com erro aceitável e consistência lógica do operador estimado.
publishDate 2024
dc.date.none.fl_str_mv 2024-11-14
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/45/45134/tde-14012025-161445/
url https://www.teses.usp.br/teses/disponiveis/45/45134/tde-14012025-161445/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1839839145776644096