An integrated implementation of probabilistic graphical models

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Ferreira, Renato Cordeiro
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/45/45134/tde-19062025-195033/
Resumo: Probabilistic Graphical Models (PGMs) are a class of machine learning models used for sequence labeling and alignment. They are widely applied in many research fields, such as natural language processing, speech recognition, computer vision and bioinformatics. Firstly, this project provides a review about PGMs. It summarizes the relationship between 11 models studied and introduces a standardized representation of their algorithms including a comparison of their time and space algorithmic complexity. Thereafter, this project presents two new models that integrate the implementation of PGMs: the Generalized Multi-Sequence Hidden Markov Model (GMHMM), and the Generalized Covariance Model (GCM). It introduces their algorithms and shows how to configure the graph structure of the models to achieve the same algorithmic efficiency as the specialized models they extend. Finally, this project resulted in the extension and major refactoring of the Toolkit of Probabilistic Models of Sequences (ToPS) framework. It shows how the refactoring of the system led to a novel architecture to implement PGMs and the discovery of a new object-oriented design pattern called the Secretary pattern.
id USP_75fa708aefadb8ec36c18a5834a92e3b
oai_identifier_str oai:teses.usp.br:tde-19062025-195033
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling An integrated implementation of probabilistic graphical modelsUma implementação integrada de modelos probabilísticos gráficosAprendizagem de máquinaArquitetura de softwareDesign patternsMachine learningModelos Probabilísticos GráficosPadrão secretárioPadrões de projetoProbabilistic Graphical ModelsSecretary patternSoftware architectureProbabilistic Graphical Models (PGMs) are a class of machine learning models used for sequence labeling and alignment. They are widely applied in many research fields, such as natural language processing, speech recognition, computer vision and bioinformatics. Firstly, this project provides a review about PGMs. It summarizes the relationship between 11 models studied and introduces a standardized representation of their algorithms including a comparison of their time and space algorithmic complexity. Thereafter, this project presents two new models that integrate the implementation of PGMs: the Generalized Multi-Sequence Hidden Markov Model (GMHMM), and the Generalized Covariance Model (GCM). It introduces their algorithms and shows how to configure the graph structure of the models to achieve the same algorithmic efficiency as the specialized models they extend. Finally, this project resulted in the extension and major refactoring of the Toolkit of Probabilistic Models of Sequences (ToPS) framework. It shows how the refactoring of the system led to a novel architecture to implement PGMs and the discovery of a new object-oriented design pattern called the Secretary pattern.Modelos Probabilísticos Gráficos (PGMs, na sigla em inglês) são uma classe de modelos de aprendizagem de máquina utilizada para rotulação e alinhamento de sequências. Eles são amplamente utilizados em muitas áreas do conhecimento, tais como processamento de linguagem natural, reconhecimento de voz, visão computacional e bioinformática. Primeiramente, o projeto provê uma revisão sobre PGMs. Ele resume o relacionamento entre 11 modelos estudados e introduz uma representação padronizada dos seus algoritmos, incluindo a comparação entre complexidade algorítimica de tempo e espaço de cada um deles. Em seguida, este projeto introduz dois novos modelos que criam uma implementação integrada de MPGs: o Modelo Oculto de Markov Generalizado para Múltiplas Sequências (GMHMM), e o Modelo de Covariância Generalizado (GCM), introduzindo seus algoritmos e mostrando como configurar a estrutura dos grafos dos modelos para atingir a mesma eficiência que os modelos especializados que eles estendem. Finalmente, este projeto resultou na extensão e refatoração do arcabouço ToPS (Toolkit of Probabilistic Models of Sequences). Ele mostra como a refatoração feita no sistema levou à criação de uma nova arquitetura para implementar PGMs e à descoberta do padrão de projeto orientado a objetos chamado padrão Secretário.Biblioteca Digitais de Teses e Dissertações da USPDurham, Alan MitchellFerreira, Renato Cordeiro2020-06-29info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/45/45134/tde-19062025-195033/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesseng2025-06-27T09:02:02Zoai:teses.usp.br:tde-19062025-195033Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-06-27T09:02:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv An integrated implementation of probabilistic graphical models
Uma implementação integrada de modelos probabilísticos gráficos
title An integrated implementation of probabilistic graphical models
spellingShingle An integrated implementation of probabilistic graphical models
Ferreira, Renato Cordeiro
Aprendizagem de máquina
Arquitetura de software
Design patterns
Machine learning
Modelos Probabilísticos Gráficos
Padrão secretário
Padrões de projeto
Probabilistic Graphical Models
Secretary pattern
Software architecture
title_short An integrated implementation of probabilistic graphical models
title_full An integrated implementation of probabilistic graphical models
title_fullStr An integrated implementation of probabilistic graphical models
title_full_unstemmed An integrated implementation of probabilistic graphical models
title_sort An integrated implementation of probabilistic graphical models
author Ferreira, Renato Cordeiro
author_facet Ferreira, Renato Cordeiro
author_role author
dc.contributor.none.fl_str_mv Durham, Alan Mitchell
dc.contributor.author.fl_str_mv Ferreira, Renato Cordeiro
dc.subject.por.fl_str_mv Aprendizagem de máquina
Arquitetura de software
Design patterns
Machine learning
Modelos Probabilísticos Gráficos
Padrão secretário
Padrões de projeto
Probabilistic Graphical Models
Secretary pattern
Software architecture
topic Aprendizagem de máquina
Arquitetura de software
Design patterns
Machine learning
Modelos Probabilísticos Gráficos
Padrão secretário
Padrões de projeto
Probabilistic Graphical Models
Secretary pattern
Software architecture
description Probabilistic Graphical Models (PGMs) are a class of machine learning models used for sequence labeling and alignment. They are widely applied in many research fields, such as natural language processing, speech recognition, computer vision and bioinformatics. Firstly, this project provides a review about PGMs. It summarizes the relationship between 11 models studied and introduces a standardized representation of their algorithms including a comparison of their time and space algorithmic complexity. Thereafter, this project presents two new models that integrate the implementation of PGMs: the Generalized Multi-Sequence Hidden Markov Model (GMHMM), and the Generalized Covariance Model (GCM). It introduces their algorithms and shows how to configure the graph structure of the models to achieve the same algorithmic efficiency as the specialized models they extend. Finally, this project resulted in the extension and major refactoring of the Toolkit of Probabilistic Models of Sequences (ToPS) framework. It shows how the refactoring of the system led to a novel architecture to implement PGMs and the discovery of a new object-oriented design pattern called the Secretary pattern.
publishDate 2020
dc.date.none.fl_str_mv 2020-06-29
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/45/45134/tde-19062025-195033/
url https://www.teses.usp.br/teses/disponiveis/45/45134/tde-19062025-195033/
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1844786338925117440