Uma abordagem robusta para a detecção de dependências em modelos de redes bayesianas
| Ano de defesa: | 2025 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal do Rio de Janeiro
Brasil Instituto de Matemática Programa de Pós-Graduação em Estatística UFRJ |
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | http://hdl.handle.net/11422/27317 |
Resumo: | In many areas of knowledge, there is interest in the joint modeling of random variables. To represent and accommodate the existing dependencies between these variables, a widely used approach considers Bayesian network models. Bayesian networks are defined by two elements: a directed acyclic graph and a probability space related to it. Each node in the graph represents a random variable, while the arcs are the dependencies between them. To detect the graph of a Bayesian Network from a dataset, there are three main classes of algorithms, the score-based, the constraint-based and the hybrid algorithms, something in commom between them is the use of score functions or conditional independence tests that assume multinomial or Gaussian distributions. These kinds of methods were applied on synthetic networks and real data throughout this work, showing the differences they can present and their usability. Additionally, the score-based algorithms were extended to non-Gaussian continuous distributions using a BIC score that assumes an Asymmetric Laplace model. The experiments to compare this score with the BIC variations for Gaussian and discrete networks were promising in synthetic networs and real data. On synthetic networks, outliers were introduced into the data, and in the real-data illustration, a small dataset was used, for which the estimation is more sensitive to extreme values. |
| id |
UFRJ_849bbcd044f5a44b8e773e9f745a3ca6 |
|---|---|
| oai_identifier_str |
oai:pantheon.ufrj.br:11422/27317 |
| network_acronym_str |
UFRJ |
| network_name_str |
Repositório Institucional da UFRJ |
| repository_id_str |
|
| spelling |
Uma abordagem robusta para a detecção de dependências em modelos de redes bayesianasRedes bayesianasAlgoritmosBayesian networksAlgorithmsCNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICAIn many areas of knowledge, there is interest in the joint modeling of random variables. To represent and accommodate the existing dependencies between these variables, a widely used approach considers Bayesian network models. Bayesian networks are defined by two elements: a directed acyclic graph and a probability space related to it. Each node in the graph represents a random variable, while the arcs are the dependencies between them. To detect the graph of a Bayesian Network from a dataset, there are three main classes of algorithms, the score-based, the constraint-based and the hybrid algorithms, something in commom between them is the use of score functions or conditional independence tests that assume multinomial or Gaussian distributions. These kinds of methods were applied on synthetic networks and real data throughout this work, showing the differences they can present and their usability. Additionally, the score-based algorithms were extended to non-Gaussian continuous distributions using a BIC score that assumes an Asymmetric Laplace model. The experiments to compare this score with the BIC variations for Gaussian and discrete networks were promising in synthetic networs and real data. On synthetic networks, outliers were introduced into the data, and in the real-data illustration, a small dataset was used, for which the estimation is more sensitive to extreme values.Em diversas áreas do conhecimento, há interesse na modelagem conjunta de variáveis aleatórias. Para representar e acomodar as dependências existentes entre essas variáveis, uma abordagem amplamente utilizada considera modelos de Redes Bayesianas. As Redes Bayesianas são definidas por dois elementos: um grafo direcionado e acíclico e um espaço de probabilidades relacionado a ele. Cada nó nesse grafo representa uma variável aleatória, enquanto as arestas indicam as relações de dependência entre elas. Para detectar o grafo de uma Rede Bayesiana a partir de dados, existem três classes de algoritmos, os baseados em score, os baseados em restrição e os híbridos, algo comum entre eles é o uso de funções de score ou testes de independência condicional que assumem distribuição multinomial ou Gaussiana. Métodos deste tipo foram aplicados em Redes sintéticas e dados reais ao longo deste trabalho, mostrando as diferenças que eles podem apresentar e a sua usabilidade. Além disso, os algoritmos baseados em score foram estendidos para distribuições contínuas não normais usando um score BIC que assume um modelo Laplace assimétrico. Os testes executados para comparar esse score com as variações do BIC para Redes normais e discretas se mostraram promissores em Redes sintéticas e dados reais. Nas Redes sintéticas, foram introduzidos outliers nos dados, e na ilustração utilizando dados reais, foi usada uma base pequena, para a qual a estimação é mais sensível a valores extremos.Universidade Federal do Rio de JaneiroBrasilInstituto de MatemáticaPrograma de Pós-Graduação em EstatísticaUFRJFonseca, Thaís Cristina Oliveira dahttp://lattes.cnpq.br/9577872882074512http://lattes.cnpq.br/1424830719022887Aguiar, Guilherme Ost dehttp://lattes.cnpq.br/6602933388819992Galletti, Thaís Paivahttp://lattes.cnpq.br/6313658269652848Oliveira, Pedro Henrique Neves de2025-10-06T15:30:31Z2025-10-08T03:00:09Z2025-08-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/11422/27317porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRJinstname:Universidade Federal do Rio de Janeiro (UFRJ)instacron:UFRJ2025-10-08T03:00:09Zoai:pantheon.ufrj.br:11422/27317Repositório InstitucionalPUBhttp://www.pantheon.ufrj.br/oai/requestpantheon@sibi.ufrj.bropendoar:2025-10-08T03:00:09Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ)false |
| dc.title.none.fl_str_mv |
Uma abordagem robusta para a detecção de dependências em modelos de redes bayesianas |
| title |
Uma abordagem robusta para a detecção de dependências em modelos de redes bayesianas |
| spellingShingle |
Uma abordagem robusta para a detecção de dependências em modelos de redes bayesianas Oliveira, Pedro Henrique Neves de Redes bayesianas Algoritmos Bayesian networks Algorithms CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA |
| title_short |
Uma abordagem robusta para a detecção de dependências em modelos de redes bayesianas |
| title_full |
Uma abordagem robusta para a detecção de dependências em modelos de redes bayesianas |
| title_fullStr |
Uma abordagem robusta para a detecção de dependências em modelos de redes bayesianas |
| title_full_unstemmed |
Uma abordagem robusta para a detecção de dependências em modelos de redes bayesianas |
| title_sort |
Uma abordagem robusta para a detecção de dependências em modelos de redes bayesianas |
| author |
Oliveira, Pedro Henrique Neves de |
| author_facet |
Oliveira, Pedro Henrique Neves de |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Fonseca, Thaís Cristina Oliveira da http://lattes.cnpq.br/9577872882074512 http://lattes.cnpq.br/1424830719022887 Aguiar, Guilherme Ost de http://lattes.cnpq.br/6602933388819992 Galletti, Thaís Paiva http://lattes.cnpq.br/6313658269652848 |
| dc.contributor.author.fl_str_mv |
Oliveira, Pedro Henrique Neves de |
| dc.subject.por.fl_str_mv |
Redes bayesianas Algoritmos Bayesian networks Algorithms CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA |
| topic |
Redes bayesianas Algoritmos Bayesian networks Algorithms CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA |
| description |
In many areas of knowledge, there is interest in the joint modeling of random variables. To represent and accommodate the existing dependencies between these variables, a widely used approach considers Bayesian network models. Bayesian networks are defined by two elements: a directed acyclic graph and a probability space related to it. Each node in the graph represents a random variable, while the arcs are the dependencies between them. To detect the graph of a Bayesian Network from a dataset, there are three main classes of algorithms, the score-based, the constraint-based and the hybrid algorithms, something in commom between them is the use of score functions or conditional independence tests that assume multinomial or Gaussian distributions. These kinds of methods were applied on synthetic networks and real data throughout this work, showing the differences they can present and their usability. Additionally, the score-based algorithms were extended to non-Gaussian continuous distributions using a BIC score that assumes an Asymmetric Laplace model. The experiments to compare this score with the BIC variations for Gaussian and discrete networks were promising in synthetic networs and real data. On synthetic networks, outliers were introduced into the data, and in the real-data illustration, a small dataset was used, for which the estimation is more sensitive to extreme values. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-10-06T15:30:31Z 2025-10-08T03:00:09Z 2025-08-28 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/11422/27317 |
| url |
http://hdl.handle.net/11422/27317 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal do Rio de Janeiro Brasil Instituto de Matemática Programa de Pós-Graduação em Estatística UFRJ |
| publisher.none.fl_str_mv |
Universidade Federal do Rio de Janeiro Brasil Instituto de Matemática Programa de Pós-Graduação em Estatística UFRJ |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRJ instname:Universidade Federal do Rio de Janeiro (UFRJ) instacron:UFRJ |
| instname_str |
Universidade Federal do Rio de Janeiro (UFRJ) |
| instacron_str |
UFRJ |
| institution |
UFRJ |
| reponame_str |
Repositório Institucional da UFRJ |
| collection |
Repositório Institucional da UFRJ |
| repository.name.fl_str_mv |
Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ) |
| repository.mail.fl_str_mv |
pantheon@sibi.ufrj.br |
| _version_ |
1861279131283488768 |