Seleção de variáveis em modelos de regressão: uma avaliação do uso de redes de probabilidades condicionais

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Melo, Roger Almeida Pereira lattes
Orientador(a): Oliveira, Izabela Regina Cardoso de
Banca de defesa: Cerqueira, Pedro Henrique Ramos, Fernandes, Tales Jesus, Dorneles, Elaine Maria Seles
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Lavras
Programa de Pós-Graduação: Programa de Pós-Graduação em Estatística e Experimentação Agropecuária
Departamento: Instituto de Ciências Exatas e Tecnológicas – ICET
País: brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.ufla.br/handle/1/59596
Resumo: A Rede bayesiana é um método apresentado por Judea Pearl em 1985 que descreve um modelo probabilístico gráfico, representando um conjunto de variáveis e suas dependências condicio- nais por meio de um grafo acíclico direcionado. Os vértices (ou nós) representam proposições (ou variáveis), as arestas (ou arcos), quando são direcionadas, significam as dependências pro- babilísticas entre essas variáveis. O objetivo deste trabalho é avaliar o uso de redes bayesia- nas para seleção de variáveis em modelos de regressão. A técnica é comparada com métodos stepwise em alguns cenários de simulação que consideram diferentes tamanhos amostrais, cor- relações entre as variáveis (resposta e variáveis) e diferentes números de variáveis. Além do estudo de simulação, apresentamos uma aplicação prática das redes bayesianas nesse contexto. Para isso, foram usados dados de uma pesquisa realizada entre 2018 e 2019, com médicos ve- terinários de Minas Gerais, com o objetivo de identificar os fatores de risco mais importantes associados à exposição acidental às vacinas anti-Brucella abortus (Brucelose). Uma das res- postas de interesse no trabalho é a prevalência de brucelose entre esses profissionais, que foi estimada a partir de um modelo de regressão logístico. Ao utilizar Rede bayesiana, as variáveis detectadas como mais importantes associadas à exposição acidental às vacinas foram o conhe- cimento sobre os sintomas da brucelose, se o profissional realizou procedimentos de partos prematuros ou abortos nos últimos seis meses e a frequência que o profissional usa equipamen- tos de proteção individual. Todas as análises foram realizadas no software R utilizando o pacote bnlearn. Recomendamos a combinação de métodos stepwise com redes bayesianas, pois os mé- todos stepwise são eficazes para a seleção automática de variáveis, enquanto as redes bayesianas são excelentes para visualizar e entender associações indiretas entre variáveis. Essa combinação enriquece a análise, oferecendo uma visão mais completa e detalhada dos resultados.
id UFLA_ae23c2c695f8d8fda357f1e502edf24a
oai_identifier_str oai:repositorio.ufla.br:1/59596
network_acronym_str UFLA
network_name_str Repositório Institucional da UFLA
repository_id_str
spelling 2024-10-23T19:58:28Z2024-10-23T19:58:28Z2024-10-232024-06-20MELO, Roger Almeida Pereira. Seleção de variáveis em modelos de regressão: uma avaliação do uso de redes de probabilidades condicionais. 2024. 167 p. Tese (Doutorado em Estatística e Experimentação Agropecuária) - Universidade Federal de Lavras, Lavras, 2024.https://repositorio.ufla.br/handle/1/59596A Rede bayesiana é um método apresentado por Judea Pearl em 1985 que descreve um modelo probabilístico gráfico, representando um conjunto de variáveis e suas dependências condicio- nais por meio de um grafo acíclico direcionado. Os vértices (ou nós) representam proposições (ou variáveis), as arestas (ou arcos), quando são direcionadas, significam as dependências pro- babilísticas entre essas variáveis. O objetivo deste trabalho é avaliar o uso de redes bayesia- nas para seleção de variáveis em modelos de regressão. A técnica é comparada com métodos stepwise em alguns cenários de simulação que consideram diferentes tamanhos amostrais, cor- relações entre as variáveis (resposta e variáveis) e diferentes números de variáveis. Além do estudo de simulação, apresentamos uma aplicação prática das redes bayesianas nesse contexto. Para isso, foram usados dados de uma pesquisa realizada entre 2018 e 2019, com médicos ve- terinários de Minas Gerais, com o objetivo de identificar os fatores de risco mais importantes associados à exposição acidental às vacinas anti-Brucella abortus (Brucelose). Uma das res- postas de interesse no trabalho é a prevalência de brucelose entre esses profissionais, que foi estimada a partir de um modelo de regressão logístico. Ao utilizar Rede bayesiana, as variáveis detectadas como mais importantes associadas à exposição acidental às vacinas foram o conhe- cimento sobre os sintomas da brucelose, se o profissional realizou procedimentos de partos prematuros ou abortos nos últimos seis meses e a frequência que o profissional usa equipamen- tos de proteção individual. Todas as análises foram realizadas no software R utilizando o pacote bnlearn. Recomendamos a combinação de métodos stepwise com redes bayesianas, pois os mé- todos stepwise são eficazes para a seleção automática de variáveis, enquanto as redes bayesianas são excelentes para visualizar e entender associações indiretas entre variáveis. Essa combinação enriquece a análise, oferecendo uma visão mais completa e detalhada dos resultados.The Bayesian network is a method presented by Judea Pearl in 1985 that describes a probabi- listic graphical model, which represents a set of variables and their conditional dependencies with a directed acyclic graph. The vertices (or nodes) represent propositions (or variables), and directed edges (or arcs) signify the probabilistic dependencies between these variables. The objective of this study is to evaluate the use of Bayesian networks for the selection of variables in regression models. This technique is compared with stepwise methods in simulation sce- narios that consider different sample sizes, correlations between the variables (responses and variables) and different numbers of variables. In addition to the simulation study, we present a practical application of Bayesian networks in this context. For this purpose, data from a study conducted between 2018 and 2019 involving veterinarians in Minas Gerais were used to iden- tify the most important risk factors associated with accidental exposure to antiviral vaccines, specifically, vaccines for Brucella abortus (Brucellosis). One of the results of interest in this study was the prevalence of brucellosis among these professionals, which was estimated using a logistic regression model. According to the Bayesian network, the most important covariates associated with accidental exposure to vaccines were knowledge about the symptoms of brucel- losis, whether the professional had performed premature childbirth procedures or abortions in the previous six months and the frequency with which the professional used personal protective equipment. All analyses were performed in R software using the bnlearn package. We recom- mend combining stepwise methods with Bayesian Networks, as stepwise methods are effective for automatic variable selection, while Bayesian Networks excel at visualizing and understan- ding indirect associations between variables. This combined approach enriches the analysis, providing a more comprehensive and detailed view of the results.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)Universidade Federal de LavrasPrograma de Pós-Graduação em Estatística e Experimentação AgropecuáriaUFLAbrasilInstituto de Ciências Exatas e Tecnológicas – ICETAttribution 4.0 Internationalhttp://creativecommons.org/licenses/by/4.0/info:eu-repo/semantics/openAccessProbabilidade e EstatísticaRedes bayesianasGrafo acíclico direcionadoModelo probabilísticoMétodos stepwiseBayesian networksDirected acyclic graphProbabilistic modelStepwise methodsSeleção de variáveis em modelos de regressão: uma avaliação do uso de redes de probabilidades condicionaisVariable selection in regression models: an evaluation of the use of conditional probability networksinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisOliveira, Izabela Regina Cardoso deBueno Filho, Júlio Sílvio de SousaCerqueira, Pedro Henrique RamosFernandes, Tales JesusDorneles, Elaine Maria Seleshttps://lattes.cnpq.br/0571126990127169Melo, Roger Almeida Pereiraporreponame:Repositório Institucional da UFLAinstname:Universidade Federal de Lavras (UFLA)instacron:UFLAORIGINALTESE_Seleção de variáveis em modelos de regressão: uma avaliação do uso de redes de probabilidades condicionais.pdfTESE_Seleção de variáveis em modelos de regressão: uma avaliação do uso de redes de probabilidades condicionais.pdfapplication/pdf2419337https://repositorio.ufla.br/bitstreams/ca01fffd-58af-422e-8301-57c25d6916f0/downloadc17b484a3c1d583b6200d9890497e7c9MD51trueAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8907https://repositorio.ufla.br/bitstreams/805243b5-29b7-42ac-b6e3-be95dd880f9c/downloadc07b6daef3dbee864bf87e6aa836cde2MD52falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-8956https://repositorio.ufla.br/bitstreams/10ea71bc-bedf-4531-b57d-7dbe9b826ceb/download5ea4a165b7202cbf475be400d2e16893MD53falseAnonymousREADTEXTTESE_Seleção de variáveis em modelos de regressão: uma avaliação do uso de redes de probabilidades condicionais.pdf.txtTESE_Seleção de variáveis em modelos de regressão: uma avaliação do uso de redes de probabilidades condicionais.pdf.txtExtracted texttext/plain104040https://repositorio.ufla.br/bitstreams/0486c19e-ccf3-4117-9491-216d5b9678b9/download8cb2e503732fbe67cb82479da5768f16MD54falseAnonymousREADTHUMBNAILTESE_Seleção de variáveis em modelos de regressão: uma avaliação do uso de redes de probabilidades condicionais.pdf.jpgTESE_Seleção de variáveis em modelos de regressão: uma avaliação do uso de redes de probabilidades condicionais.pdf.jpgGenerated Thumbnailimage/jpeg3202https://repositorio.ufla.br/bitstreams/5d28f792-2b9c-4d94-b02d-1454f41c148b/downloadf8272e675c6f240bcd10f0e5d04456f4MD55falseAnonymousREAD1/595962025-10-24 20:32:51.663http://creativecommons.org/licenses/by/4.0/Attribution 4.0 Internationalopen.accessoai:repositorio.ufla.br:1/59596https://repositorio.ufla.brRepositório InstitucionalPUBhttps://repositorio.ufla.br/server/oai/requestnivaldo@ufla.br || repositorio.biblioteca@ufla.bropendoar:2025-10-24T23:32:51Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA)falseREVDTEFSQcOHw4NPIERFIERJU1RSSUJVScOHw4NPIE7Dg08tRVhDTFVTSVZBCk8gcmVmZXJpZG8gYXV0b3I6CgphKSBEZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqSBzZXUgdHJhYmFsaG8gb3JpZ2luYWwsIGUgcXVlIGRldMOpbSBvIGRpcmVpdG8gZGUgY29uY2VkZXIgb3MgZGlyZWl0b3MgY29udGlkb3MgbmVzdGEgbGljZW7Dp2EuIERlY2xhcmEgdGFtYsOpbSBxdWUgYSBlbnRyZWdhIGRvIGRvY3VtZW50byBuw6NvIGluZnJpbmdlLCB0YW50byBxdWFudG8gbGhlIMOpIHBvc3PDrXZlbCBzYWJlciwgb3MgZGlyZWl0b3MgZGUgcXVhbHF1ZXIgb3V0cmEgcGVzc29hIG91ICBlbnRpZGFkZS4KCmIpIFNlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIGNvbnTDqW0gbWF0ZXJpYWwgZG8gcXVhbCBuw6NvIGRldMOpbSBvcyBkaXJlaXRvcyBkZSBhdXRvciwgZGVjbGFyYSBxdWUgb2J0ZXZlIGF1dG9yaXphw6fDo28gZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIHBhcmEgY29uY2VkZXIgw6AgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgTGF2cmFzIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgY3Vqb3MgZGlyZWl0b3Mgc8OjbyBkZSB0ZXJjZWlyb3MgZXN0w6EgY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbwpubyB0ZXh0byBvdSBjb250ZcO6ZG8gZG8gZG9jdW1lbnRvIGVudHJlZ3VlLiBTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqSBiYXNlYWRvIGVtIHRyYWJhbGhvIGZpbmFuY2lhZG8gb3UgYXBvaWFkbyBwb3Igb3V0cmEgaW5zdGl0dWnDp8OjbyBxdWUgbsOjbyBhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIExhdnJhcywgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIgb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gcmVzcGVjdGl2byBjb250cmF0byBvdSBhY29yZG8uCgo=
dc.title.pt_BR.fl_str_mv Seleção de variáveis em modelos de regressão: uma avaliação do uso de redes de probabilidades condicionais
dc.title.alternative.pt_BR.fl_str_mv Variable selection in regression models: an evaluation of the use of conditional probability networks
title Seleção de variáveis em modelos de regressão: uma avaliação do uso de redes de probabilidades condicionais
spellingShingle Seleção de variáveis em modelos de regressão: uma avaliação do uso de redes de probabilidades condicionais
Melo, Roger Almeida Pereira
Probabilidade e Estatística
Redes bayesianas
Grafo acíclico direcionado
Modelo probabilístico
Métodos stepwise
Bayesian networks
Directed acyclic graph
Probabilistic model
Stepwise methods
title_short Seleção de variáveis em modelos de regressão: uma avaliação do uso de redes de probabilidades condicionais
title_full Seleção de variáveis em modelos de regressão: uma avaliação do uso de redes de probabilidades condicionais
title_fullStr Seleção de variáveis em modelos de regressão: uma avaliação do uso de redes de probabilidades condicionais
title_full_unstemmed Seleção de variáveis em modelos de regressão: uma avaliação do uso de redes de probabilidades condicionais
title_sort Seleção de variáveis em modelos de regressão: uma avaliação do uso de redes de probabilidades condicionais
author Melo, Roger Almeida Pereira
author_facet Melo, Roger Almeida Pereira
author_role author
dc.contributor.advisor1.fl_str_mv Oliveira, Izabela Regina Cardoso de
dc.contributor.advisor-co1.fl_str_mv Bueno Filho, Júlio Sílvio de Sousa
dc.contributor.referee1.fl_str_mv Cerqueira, Pedro Henrique Ramos
dc.contributor.referee2.fl_str_mv Fernandes, Tales Jesus
dc.contributor.referee3.fl_str_mv Dorneles, Elaine Maria Seles
dc.contributor.authorLattes.fl_str_mv https://lattes.cnpq.br/0571126990127169
dc.contributor.author.fl_str_mv Melo, Roger Almeida Pereira
contributor_str_mv Oliveira, Izabela Regina Cardoso de
Bueno Filho, Júlio Sílvio de Sousa
Cerqueira, Pedro Henrique Ramos
Fernandes, Tales Jesus
Dorneles, Elaine Maria Seles
dc.subject.cnpq.fl_str_mv Probabilidade e Estatística
topic Probabilidade e Estatística
Redes bayesianas
Grafo acíclico direcionado
Modelo probabilístico
Métodos stepwise
Bayesian networks
Directed acyclic graph
Probabilistic model
Stepwise methods
dc.subject.por.fl_str_mv Redes bayesianas
Grafo acíclico direcionado
Modelo probabilístico
Métodos stepwise
Bayesian networks
Directed acyclic graph
Probabilistic model
Stepwise methods
description A Rede bayesiana é um método apresentado por Judea Pearl em 1985 que descreve um modelo probabilístico gráfico, representando um conjunto de variáveis e suas dependências condicio- nais por meio de um grafo acíclico direcionado. Os vértices (ou nós) representam proposições (ou variáveis), as arestas (ou arcos), quando são direcionadas, significam as dependências pro- babilísticas entre essas variáveis. O objetivo deste trabalho é avaliar o uso de redes bayesia- nas para seleção de variáveis em modelos de regressão. A técnica é comparada com métodos stepwise em alguns cenários de simulação que consideram diferentes tamanhos amostrais, cor- relações entre as variáveis (resposta e variáveis) e diferentes números de variáveis. Além do estudo de simulação, apresentamos uma aplicação prática das redes bayesianas nesse contexto. Para isso, foram usados dados de uma pesquisa realizada entre 2018 e 2019, com médicos ve- terinários de Minas Gerais, com o objetivo de identificar os fatores de risco mais importantes associados à exposição acidental às vacinas anti-Brucella abortus (Brucelose). Uma das res- postas de interesse no trabalho é a prevalência de brucelose entre esses profissionais, que foi estimada a partir de um modelo de regressão logístico. Ao utilizar Rede bayesiana, as variáveis detectadas como mais importantes associadas à exposição acidental às vacinas foram o conhe- cimento sobre os sintomas da brucelose, se o profissional realizou procedimentos de partos prematuros ou abortos nos últimos seis meses e a frequência que o profissional usa equipamen- tos de proteção individual. Todas as análises foram realizadas no software R utilizando o pacote bnlearn. Recomendamos a combinação de métodos stepwise com redes bayesianas, pois os mé- todos stepwise são eficazes para a seleção automática de variáveis, enquanto as redes bayesianas são excelentes para visualizar e entender associações indiretas entre variáveis. Essa combinação enriquece a análise, oferecendo uma visão mais completa e detalhada dos resultados.
publishDate 2024
dc.date.submitted.none.fl_str_mv 2024-06-20
dc.date.accessioned.fl_str_mv 2024-10-23T19:58:28Z
dc.date.available.fl_str_mv 2024-10-23T19:58:28Z
dc.date.issued.fl_str_mv 2024-10-23
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv MELO, Roger Almeida Pereira. Seleção de variáveis em modelos de regressão: uma avaliação do uso de redes de probabilidades condicionais. 2024. 167 p. Tese (Doutorado em Estatística e Experimentação Agropecuária) - Universidade Federal de Lavras, Lavras, 2024.
dc.identifier.uri.fl_str_mv https://repositorio.ufla.br/handle/1/59596
identifier_str_mv MELO, Roger Almeida Pereira. Seleção de variáveis em modelos de regressão: uma avaliação do uso de redes de probabilidades condicionais. 2024. 167 p. Tese (Doutorado em Estatística e Experimentação Agropecuária) - Universidade Federal de Lavras, Lavras, 2024.
url https://repositorio.ufla.br/handle/1/59596
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution 4.0 International
http://creativecommons.org/licenses/by/4.0/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution 4.0 International
http://creativecommons.org/licenses/by/4.0/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Lavras
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Estatística e Experimentação Agropecuária
dc.publisher.initials.fl_str_mv UFLA
dc.publisher.country.fl_str_mv brasil
dc.publisher.department.fl_str_mv Instituto de Ciências Exatas e Tecnológicas – ICET
publisher.none.fl_str_mv Universidade Federal de Lavras
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFLA
instname:Universidade Federal de Lavras (UFLA)
instacron:UFLA
instname_str Universidade Federal de Lavras (UFLA)
instacron_str UFLA
institution UFLA
reponame_str Repositório Institucional da UFLA
collection Repositório Institucional da UFLA
bitstream.url.fl_str_mv https://repositorio.ufla.br/bitstreams/ca01fffd-58af-422e-8301-57c25d6916f0/download
https://repositorio.ufla.br/bitstreams/805243b5-29b7-42ac-b6e3-be95dd880f9c/download
https://repositorio.ufla.br/bitstreams/10ea71bc-bedf-4531-b57d-7dbe9b826ceb/download
https://repositorio.ufla.br/bitstreams/0486c19e-ccf3-4117-9491-216d5b9678b9/download
https://repositorio.ufla.br/bitstreams/5d28f792-2b9c-4d94-b02d-1454f41c148b/download
bitstream.checksum.fl_str_mv c17b484a3c1d583b6200d9890497e7c9
c07b6daef3dbee864bf87e6aa836cde2
5ea4a165b7202cbf475be400d2e16893
8cb2e503732fbe67cb82479da5768f16
f8272e675c6f240bcd10f0e5d04456f4
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA)
repository.mail.fl_str_mv nivaldo@ufla.br || repositorio.biblioteca@ufla.br
_version_ 1854947697565368320