An integrated implementation of probabilistic graphical models
| Ano de defesa: | 2020 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | eng |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/45/45134/tde-19062025-195033/ |
Resumo: | Probabilistic Graphical Models (PGMs) are a class of machine learning models used for sequence labeling and alignment. They are widely applied in many research fields, such as natural language processing, speech recognition, computer vision and bioinformatics. Firstly, this project provides a review about PGMs. It summarizes the relationship between 11 models studied and introduces a standardized representation of their algorithms including a comparison of their time and space algorithmic complexity. Thereafter, this project presents two new models that integrate the implementation of PGMs: the Generalized Multi-Sequence Hidden Markov Model (GMHMM), and the Generalized Covariance Model (GCM). It introduces their algorithms and shows how to configure the graph structure of the models to achieve the same algorithmic efficiency as the specialized models they extend. Finally, this project resulted in the extension and major refactoring of the Toolkit of Probabilistic Models of Sequences (ToPS) framework. It shows how the refactoring of the system led to a novel architecture to implement PGMs and the discovery of a new object-oriented design pattern called the Secretary pattern. |
| id |
USP_75fa708aefadb8ec36c18a5834a92e3b |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-19062025-195033 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
An integrated implementation of probabilistic graphical modelsUma implementação integrada de modelos probabilísticos gráficosAprendizagem de máquinaArquitetura de softwareDesign patternsMachine learningModelos Probabilísticos GráficosPadrão secretárioPadrões de projetoProbabilistic Graphical ModelsSecretary patternSoftware architectureProbabilistic Graphical Models (PGMs) are a class of machine learning models used for sequence labeling and alignment. They are widely applied in many research fields, such as natural language processing, speech recognition, computer vision and bioinformatics. Firstly, this project provides a review about PGMs. It summarizes the relationship between 11 models studied and introduces a standardized representation of their algorithms including a comparison of their time and space algorithmic complexity. Thereafter, this project presents two new models that integrate the implementation of PGMs: the Generalized Multi-Sequence Hidden Markov Model (GMHMM), and the Generalized Covariance Model (GCM). It introduces their algorithms and shows how to configure the graph structure of the models to achieve the same algorithmic efficiency as the specialized models they extend. Finally, this project resulted in the extension and major refactoring of the Toolkit of Probabilistic Models of Sequences (ToPS) framework. It shows how the refactoring of the system led to a novel architecture to implement PGMs and the discovery of a new object-oriented design pattern called the Secretary pattern.Modelos Probabilísticos Gráficos (PGMs, na sigla em inglês) são uma classe de modelos de aprendizagem de máquina utilizada para rotulação e alinhamento de sequências. Eles são amplamente utilizados em muitas áreas do conhecimento, tais como processamento de linguagem natural, reconhecimento de voz, visão computacional e bioinformática. Primeiramente, o projeto provê uma revisão sobre PGMs. Ele resume o relacionamento entre 11 modelos estudados e introduz uma representação padronizada dos seus algoritmos, incluindo a comparação entre complexidade algorítimica de tempo e espaço de cada um deles. Em seguida, este projeto introduz dois novos modelos que criam uma implementação integrada de MPGs: o Modelo Oculto de Markov Generalizado para Múltiplas Sequências (GMHMM), e o Modelo de Covariância Generalizado (GCM), introduzindo seus algoritmos e mostrando como configurar a estrutura dos grafos dos modelos para atingir a mesma eficiência que os modelos especializados que eles estendem. Finalmente, este projeto resultou na extensão e refatoração do arcabouço ToPS (Toolkit of Probabilistic Models of Sequences). Ele mostra como a refatoração feita no sistema levou à criação de uma nova arquitetura para implementar PGMs e à descoberta do padrão de projeto orientado a objetos chamado padrão Secretário.Biblioteca Digitais de Teses e Dissertações da USPDurham, Alan MitchellFerreira, Renato Cordeiro2020-06-29info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/45/45134/tde-19062025-195033/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesseng2025-06-27T09:02:02Zoai:teses.usp.br:tde-19062025-195033Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-06-27T09:02:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
An integrated implementation of probabilistic graphical models Uma implementação integrada de modelos probabilísticos gráficos |
| title |
An integrated implementation of probabilistic graphical models |
| spellingShingle |
An integrated implementation of probabilistic graphical models Ferreira, Renato Cordeiro Aprendizagem de máquina Arquitetura de software Design patterns Machine learning Modelos Probabilísticos Gráficos Padrão secretário Padrões de projeto Probabilistic Graphical Models Secretary pattern Software architecture |
| title_short |
An integrated implementation of probabilistic graphical models |
| title_full |
An integrated implementation of probabilistic graphical models |
| title_fullStr |
An integrated implementation of probabilistic graphical models |
| title_full_unstemmed |
An integrated implementation of probabilistic graphical models |
| title_sort |
An integrated implementation of probabilistic graphical models |
| author |
Ferreira, Renato Cordeiro |
| author_facet |
Ferreira, Renato Cordeiro |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Durham, Alan Mitchell |
| dc.contributor.author.fl_str_mv |
Ferreira, Renato Cordeiro |
| dc.subject.por.fl_str_mv |
Aprendizagem de máquina Arquitetura de software Design patterns Machine learning Modelos Probabilísticos Gráficos Padrão secretário Padrões de projeto Probabilistic Graphical Models Secretary pattern Software architecture |
| topic |
Aprendizagem de máquina Arquitetura de software Design patterns Machine learning Modelos Probabilísticos Gráficos Padrão secretário Padrões de projeto Probabilistic Graphical Models Secretary pattern Software architecture |
| description |
Probabilistic Graphical Models (PGMs) are a class of machine learning models used for sequence labeling and alignment. They are widely applied in many research fields, such as natural language processing, speech recognition, computer vision and bioinformatics. Firstly, this project provides a review about PGMs. It summarizes the relationship between 11 models studied and introduces a standardized representation of their algorithms including a comparison of their time and space algorithmic complexity. Thereafter, this project presents two new models that integrate the implementation of PGMs: the Generalized Multi-Sequence Hidden Markov Model (GMHMM), and the Generalized Covariance Model (GCM). It introduces their algorithms and shows how to configure the graph structure of the models to achieve the same algorithmic efficiency as the specialized models they extend. Finally, this project resulted in the extension and major refactoring of the Toolkit of Probabilistic Models of Sequences (ToPS) framework. It shows how the refactoring of the system led to a novel architecture to implement PGMs and the discovery of a new object-oriented design pattern called the Secretary pattern. |
| publishDate |
2020 |
| dc.date.none.fl_str_mv |
2020-06-29 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/45/45134/tde-19062025-195033/ |
| url |
https://www.teses.usp.br/teses/disponiveis/45/45134/tde-19062025-195033/ |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1844786338925117440 |