Seleção de variáveis em modelos de regressão: uma avaliação do uso de redes de probabilidades condicionais
| Ano de defesa: | 2024 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | , , |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de Lavras
|
| Programa de Pós-Graduação: |
Programa de Pós-Graduação em Estatística e Experimentação Agropecuária
|
| Departamento: |
Instituto de Ciências Exatas e Tecnológicas – ICET
|
| País: |
brasil
|
| Palavras-chave em Português: | |
| Área do conhecimento CNPq: | |
| Link de acesso: | https://repositorio.ufla.br/handle/1/59596 |
Resumo: | A Rede bayesiana é um método apresentado por Judea Pearl em 1985 que descreve um modelo probabilístico gráfico, representando um conjunto de variáveis e suas dependências condicio- nais por meio de um grafo acíclico direcionado. Os vértices (ou nós) representam proposições (ou variáveis), as arestas (ou arcos), quando são direcionadas, significam as dependências pro- babilísticas entre essas variáveis. O objetivo deste trabalho é avaliar o uso de redes bayesia- nas para seleção de variáveis em modelos de regressão. A técnica é comparada com métodos stepwise em alguns cenários de simulação que consideram diferentes tamanhos amostrais, cor- relações entre as variáveis (resposta e variáveis) e diferentes números de variáveis. Além do estudo de simulação, apresentamos uma aplicação prática das redes bayesianas nesse contexto. Para isso, foram usados dados de uma pesquisa realizada entre 2018 e 2019, com médicos ve- terinários de Minas Gerais, com o objetivo de identificar os fatores de risco mais importantes associados à exposição acidental às vacinas anti-Brucella abortus (Brucelose). Uma das res- postas de interesse no trabalho é a prevalência de brucelose entre esses profissionais, que foi estimada a partir de um modelo de regressão logístico. Ao utilizar Rede bayesiana, as variáveis detectadas como mais importantes associadas à exposição acidental às vacinas foram o conhe- cimento sobre os sintomas da brucelose, se o profissional realizou procedimentos de partos prematuros ou abortos nos últimos seis meses e a frequência que o profissional usa equipamen- tos de proteção individual. Todas as análises foram realizadas no software R utilizando o pacote bnlearn. Recomendamos a combinação de métodos stepwise com redes bayesianas, pois os mé- todos stepwise são eficazes para a seleção automática de variáveis, enquanto as redes bayesianas são excelentes para visualizar e entender associações indiretas entre variáveis. Essa combinação enriquece a análise, oferecendo uma visão mais completa e detalhada dos resultados. |
| id |
UFLA_ae23c2c695f8d8fda357f1e502edf24a |
|---|---|
| oai_identifier_str |
oai:repositorio.ufla.br:1/59596 |
| network_acronym_str |
UFLA |
| network_name_str |
Repositório Institucional da UFLA |
| repository_id_str |
|
| spelling |
2024-10-23T19:58:28Z2024-10-23T19:58:28Z2024-10-232024-06-20MELO, Roger Almeida Pereira. Seleção de variáveis em modelos de regressão: uma avaliação do uso de redes de probabilidades condicionais. 2024. 167 p. Tese (Doutorado em Estatística e Experimentação Agropecuária) - Universidade Federal de Lavras, Lavras, 2024.https://repositorio.ufla.br/handle/1/59596A Rede bayesiana é um método apresentado por Judea Pearl em 1985 que descreve um modelo probabilístico gráfico, representando um conjunto de variáveis e suas dependências condicio- nais por meio de um grafo acíclico direcionado. Os vértices (ou nós) representam proposições (ou variáveis), as arestas (ou arcos), quando são direcionadas, significam as dependências pro- babilísticas entre essas variáveis. O objetivo deste trabalho é avaliar o uso de redes bayesia- nas para seleção de variáveis em modelos de regressão. A técnica é comparada com métodos stepwise em alguns cenários de simulação que consideram diferentes tamanhos amostrais, cor- relações entre as variáveis (resposta e variáveis) e diferentes números de variáveis. Além do estudo de simulação, apresentamos uma aplicação prática das redes bayesianas nesse contexto. Para isso, foram usados dados de uma pesquisa realizada entre 2018 e 2019, com médicos ve- terinários de Minas Gerais, com o objetivo de identificar os fatores de risco mais importantes associados à exposição acidental às vacinas anti-Brucella abortus (Brucelose). Uma das res- postas de interesse no trabalho é a prevalência de brucelose entre esses profissionais, que foi estimada a partir de um modelo de regressão logístico. Ao utilizar Rede bayesiana, as variáveis detectadas como mais importantes associadas à exposição acidental às vacinas foram o conhe- cimento sobre os sintomas da brucelose, se o profissional realizou procedimentos de partos prematuros ou abortos nos últimos seis meses e a frequência que o profissional usa equipamen- tos de proteção individual. Todas as análises foram realizadas no software R utilizando o pacote bnlearn. Recomendamos a combinação de métodos stepwise com redes bayesianas, pois os mé- todos stepwise são eficazes para a seleção automática de variáveis, enquanto as redes bayesianas são excelentes para visualizar e entender associações indiretas entre variáveis. Essa combinação enriquece a análise, oferecendo uma visão mais completa e detalhada dos resultados.The Bayesian network is a method presented by Judea Pearl in 1985 that describes a probabi- listic graphical model, which represents a set of variables and their conditional dependencies with a directed acyclic graph. The vertices (or nodes) represent propositions (or variables), and directed edges (or arcs) signify the probabilistic dependencies between these variables. The objective of this study is to evaluate the use of Bayesian networks for the selection of variables in regression models. This technique is compared with stepwise methods in simulation sce- narios that consider different sample sizes, correlations between the variables (responses and variables) and different numbers of variables. In addition to the simulation study, we present a practical application of Bayesian networks in this context. For this purpose, data from a study conducted between 2018 and 2019 involving veterinarians in Minas Gerais were used to iden- tify the most important risk factors associated with accidental exposure to antiviral vaccines, specifically, vaccines for Brucella abortus (Brucellosis). One of the results of interest in this study was the prevalence of brucellosis among these professionals, which was estimated using a logistic regression model. According to the Bayesian network, the most important covariates associated with accidental exposure to vaccines were knowledge about the symptoms of brucel- losis, whether the professional had performed premature childbirth procedures or abortions in the previous six months and the frequency with which the professional used personal protective equipment. All analyses were performed in R software using the bnlearn package. We recom- mend combining stepwise methods with Bayesian Networks, as stepwise methods are effective for automatic variable selection, while Bayesian Networks excel at visualizing and understan- ding indirect associations between variables. This combined approach enriches the analysis, providing a more comprehensive and detailed view of the results.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)Universidade Federal de LavrasPrograma de Pós-Graduação em Estatística e Experimentação AgropecuáriaUFLAbrasilInstituto de Ciências Exatas e Tecnológicas – ICETAttribution 4.0 Internationalhttp://creativecommons.org/licenses/by/4.0/info:eu-repo/semantics/openAccessProbabilidade e EstatísticaRedes bayesianasGrafo acíclico direcionadoModelo probabilísticoMétodos stepwiseBayesian networksDirected acyclic graphProbabilistic modelStepwise methodsSeleção de variáveis em modelos de regressão: uma avaliação do uso de redes de probabilidades condicionaisVariable selection in regression models: an evaluation of the use of conditional probability networksinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisOliveira, Izabela Regina Cardoso deBueno Filho, Júlio Sílvio de SousaCerqueira, Pedro Henrique RamosFernandes, Tales JesusDorneles, Elaine Maria Seleshttps://lattes.cnpq.br/0571126990127169Melo, Roger Almeida Pereiraporreponame:Repositório Institucional da UFLAinstname:Universidade Federal de Lavras (UFLA)instacron:UFLAORIGINALTESE_Seleção de variáveis em modelos de regressão: uma avaliação do uso de redes de probabilidades condicionais.pdfTESE_Seleção de variáveis em modelos de regressão: uma avaliação do uso de redes de probabilidades condicionais.pdfapplication/pdf2419337https://repositorio.ufla.br/bitstreams/ca01fffd-58af-422e-8301-57c25d6916f0/downloadc17b484a3c1d583b6200d9890497e7c9MD51trueAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8907https://repositorio.ufla.br/bitstreams/805243b5-29b7-42ac-b6e3-be95dd880f9c/downloadc07b6daef3dbee864bf87e6aa836cde2MD52falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-8956https://repositorio.ufla.br/bitstreams/10ea71bc-bedf-4531-b57d-7dbe9b826ceb/download5ea4a165b7202cbf475be400d2e16893MD53falseAnonymousREADTEXTTESE_Seleção de variáveis em modelos de regressão: uma avaliação do uso de redes de probabilidades condicionais.pdf.txtTESE_Seleção de variáveis em modelos de regressão: uma avaliação do uso de redes de probabilidades condicionais.pdf.txtExtracted texttext/plain104040https://repositorio.ufla.br/bitstreams/0486c19e-ccf3-4117-9491-216d5b9678b9/download8cb2e503732fbe67cb82479da5768f16MD54falseAnonymousREADTHUMBNAILTESE_Seleção de variáveis em modelos de regressão: uma avaliação do uso de redes de probabilidades condicionais.pdf.jpgTESE_Seleção de variáveis em modelos de regressão: uma avaliação do uso de redes de probabilidades condicionais.pdf.jpgGenerated Thumbnailimage/jpeg3202https://repositorio.ufla.br/bitstreams/5d28f792-2b9c-4d94-b02d-1454f41c148b/downloadf8272e675c6f240bcd10f0e5d04456f4MD55falseAnonymousREAD1/595962025-10-24 20:32:51.663http://creativecommons.org/licenses/by/4.0/Attribution 4.0 Internationalopen.accessoai:repositorio.ufla.br:1/59596https://repositorio.ufla.brRepositório InstitucionalPUBhttps://repositorio.ufla.br/server/oai/requestnivaldo@ufla.br || repositorio.biblioteca@ufla.bropendoar:2025-10-24T23:32:51Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA)falseREVDTEFSQcOHw4NPIERFIERJU1RSSUJVScOHw4NPIE7Dg08tRVhDTFVTSVZBCk8gcmVmZXJpZG8gYXV0b3I6CgphKSBEZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqSBzZXUgdHJhYmFsaG8gb3JpZ2luYWwsIGUgcXVlIGRldMOpbSBvIGRpcmVpdG8gZGUgY29uY2VkZXIgb3MgZGlyZWl0b3MgY29udGlkb3MgbmVzdGEgbGljZW7Dp2EuIERlY2xhcmEgdGFtYsOpbSBxdWUgYSBlbnRyZWdhIGRvIGRvY3VtZW50byBuw6NvIGluZnJpbmdlLCB0YW50byBxdWFudG8gbGhlIMOpIHBvc3PDrXZlbCBzYWJlciwgb3MgZGlyZWl0b3MgZGUgcXVhbHF1ZXIgb3V0cmEgcGVzc29hIG91ICBlbnRpZGFkZS4KCmIpIFNlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIGNvbnTDqW0gbWF0ZXJpYWwgZG8gcXVhbCBuw6NvIGRldMOpbSBvcyBkaXJlaXRvcyBkZSBhdXRvciwgZGVjbGFyYSBxdWUgb2J0ZXZlIGF1dG9yaXphw6fDo28gZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIHBhcmEgY29uY2VkZXIgw6AgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgTGF2cmFzIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgY3Vqb3MgZGlyZWl0b3Mgc8OjbyBkZSB0ZXJjZWlyb3MgZXN0w6EgY2xhcmFtZW50ZSBpZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbwpubyB0ZXh0byBvdSBjb250ZcO6ZG8gZG8gZG9jdW1lbnRvIGVudHJlZ3VlLiBTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqSBiYXNlYWRvIGVtIHRyYWJhbGhvIGZpbmFuY2lhZG8gb3UgYXBvaWFkbyBwb3Igb3V0cmEgaW5zdGl0dWnDp8OjbyBxdWUgbsOjbyBhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIExhdnJhcywgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIgb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gcmVzcGVjdGl2byBjb250cmF0byBvdSBhY29yZG8uCgo= |
| dc.title.pt_BR.fl_str_mv |
Seleção de variáveis em modelos de regressão: uma avaliação do uso de redes de probabilidades condicionais |
| dc.title.alternative.pt_BR.fl_str_mv |
Variable selection in regression models: an evaluation of the use of conditional probability networks |
| title |
Seleção de variáveis em modelos de regressão: uma avaliação do uso de redes de probabilidades condicionais |
| spellingShingle |
Seleção de variáveis em modelos de regressão: uma avaliação do uso de redes de probabilidades condicionais Melo, Roger Almeida Pereira Probabilidade e Estatística Redes bayesianas Grafo acíclico direcionado Modelo probabilístico Métodos stepwise Bayesian networks Directed acyclic graph Probabilistic model Stepwise methods |
| title_short |
Seleção de variáveis em modelos de regressão: uma avaliação do uso de redes de probabilidades condicionais |
| title_full |
Seleção de variáveis em modelos de regressão: uma avaliação do uso de redes de probabilidades condicionais |
| title_fullStr |
Seleção de variáveis em modelos de regressão: uma avaliação do uso de redes de probabilidades condicionais |
| title_full_unstemmed |
Seleção de variáveis em modelos de regressão: uma avaliação do uso de redes de probabilidades condicionais |
| title_sort |
Seleção de variáveis em modelos de regressão: uma avaliação do uso de redes de probabilidades condicionais |
| author |
Melo, Roger Almeida Pereira |
| author_facet |
Melo, Roger Almeida Pereira |
| author_role |
author |
| dc.contributor.advisor1.fl_str_mv |
Oliveira, Izabela Regina Cardoso de |
| dc.contributor.advisor-co1.fl_str_mv |
Bueno Filho, Júlio Sílvio de Sousa |
| dc.contributor.referee1.fl_str_mv |
Cerqueira, Pedro Henrique Ramos |
| dc.contributor.referee2.fl_str_mv |
Fernandes, Tales Jesus |
| dc.contributor.referee3.fl_str_mv |
Dorneles, Elaine Maria Seles |
| dc.contributor.authorLattes.fl_str_mv |
https://lattes.cnpq.br/0571126990127169 |
| dc.contributor.author.fl_str_mv |
Melo, Roger Almeida Pereira |
| contributor_str_mv |
Oliveira, Izabela Regina Cardoso de Bueno Filho, Júlio Sílvio de Sousa Cerqueira, Pedro Henrique Ramos Fernandes, Tales Jesus Dorneles, Elaine Maria Seles |
| dc.subject.cnpq.fl_str_mv |
Probabilidade e Estatística |
| topic |
Probabilidade e Estatística Redes bayesianas Grafo acíclico direcionado Modelo probabilístico Métodos stepwise Bayesian networks Directed acyclic graph Probabilistic model Stepwise methods |
| dc.subject.por.fl_str_mv |
Redes bayesianas Grafo acíclico direcionado Modelo probabilístico Métodos stepwise Bayesian networks Directed acyclic graph Probabilistic model Stepwise methods |
| description |
A Rede bayesiana é um método apresentado por Judea Pearl em 1985 que descreve um modelo probabilístico gráfico, representando um conjunto de variáveis e suas dependências condicio- nais por meio de um grafo acíclico direcionado. Os vértices (ou nós) representam proposições (ou variáveis), as arestas (ou arcos), quando são direcionadas, significam as dependências pro- babilísticas entre essas variáveis. O objetivo deste trabalho é avaliar o uso de redes bayesia- nas para seleção de variáveis em modelos de regressão. A técnica é comparada com métodos stepwise em alguns cenários de simulação que consideram diferentes tamanhos amostrais, cor- relações entre as variáveis (resposta e variáveis) e diferentes números de variáveis. Além do estudo de simulação, apresentamos uma aplicação prática das redes bayesianas nesse contexto. Para isso, foram usados dados de uma pesquisa realizada entre 2018 e 2019, com médicos ve- terinários de Minas Gerais, com o objetivo de identificar os fatores de risco mais importantes associados à exposição acidental às vacinas anti-Brucella abortus (Brucelose). Uma das res- postas de interesse no trabalho é a prevalência de brucelose entre esses profissionais, que foi estimada a partir de um modelo de regressão logístico. Ao utilizar Rede bayesiana, as variáveis detectadas como mais importantes associadas à exposição acidental às vacinas foram o conhe- cimento sobre os sintomas da brucelose, se o profissional realizou procedimentos de partos prematuros ou abortos nos últimos seis meses e a frequência que o profissional usa equipamen- tos de proteção individual. Todas as análises foram realizadas no software R utilizando o pacote bnlearn. Recomendamos a combinação de métodos stepwise com redes bayesianas, pois os mé- todos stepwise são eficazes para a seleção automática de variáveis, enquanto as redes bayesianas são excelentes para visualizar e entender associações indiretas entre variáveis. Essa combinação enriquece a análise, oferecendo uma visão mais completa e detalhada dos resultados. |
| publishDate |
2024 |
| dc.date.submitted.none.fl_str_mv |
2024-06-20 |
| dc.date.accessioned.fl_str_mv |
2024-10-23T19:58:28Z |
| dc.date.available.fl_str_mv |
2024-10-23T19:58:28Z |
| dc.date.issued.fl_str_mv |
2024-10-23 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
MELO, Roger Almeida Pereira. Seleção de variáveis em modelos de regressão: uma avaliação do uso de redes de probabilidades condicionais. 2024. 167 p. Tese (Doutorado em Estatística e Experimentação Agropecuária) - Universidade Federal de Lavras, Lavras, 2024. |
| dc.identifier.uri.fl_str_mv |
https://repositorio.ufla.br/handle/1/59596 |
| identifier_str_mv |
MELO, Roger Almeida Pereira. Seleção de variáveis em modelos de regressão: uma avaliação do uso de redes de probabilidades condicionais. 2024. 167 p. Tese (Doutorado em Estatística e Experimentação Agropecuária) - Universidade Federal de Lavras, Lavras, 2024. |
| url |
https://repositorio.ufla.br/handle/1/59596 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
Attribution 4.0 International http://creativecommons.org/licenses/by/4.0/ info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Attribution 4.0 International http://creativecommons.org/licenses/by/4.0/ |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal de Lavras |
| dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Estatística e Experimentação Agropecuária |
| dc.publisher.initials.fl_str_mv |
UFLA |
| dc.publisher.country.fl_str_mv |
brasil |
| dc.publisher.department.fl_str_mv |
Instituto de Ciências Exatas e Tecnológicas – ICET |
| publisher.none.fl_str_mv |
Universidade Federal de Lavras |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFLA instname:Universidade Federal de Lavras (UFLA) instacron:UFLA |
| instname_str |
Universidade Federal de Lavras (UFLA) |
| instacron_str |
UFLA |
| institution |
UFLA |
| reponame_str |
Repositório Institucional da UFLA |
| collection |
Repositório Institucional da UFLA |
| bitstream.url.fl_str_mv |
https://repositorio.ufla.br/bitstreams/ca01fffd-58af-422e-8301-57c25d6916f0/download https://repositorio.ufla.br/bitstreams/805243b5-29b7-42ac-b6e3-be95dd880f9c/download https://repositorio.ufla.br/bitstreams/10ea71bc-bedf-4531-b57d-7dbe9b826ceb/download https://repositorio.ufla.br/bitstreams/0486c19e-ccf3-4117-9491-216d5b9678b9/download https://repositorio.ufla.br/bitstreams/5d28f792-2b9c-4d94-b02d-1454f41c148b/download |
| bitstream.checksum.fl_str_mv |
c17b484a3c1d583b6200d9890497e7c9 c07b6daef3dbee864bf87e6aa836cde2 5ea4a165b7202cbf475be400d2e16893 8cb2e503732fbe67cb82479da5768f16 f8272e675c6f240bcd10f0e5d04456f4 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFLA - Universidade Federal de Lavras (UFLA) |
| repository.mail.fl_str_mv |
nivaldo@ufla.br || repositorio.biblioteca@ufla.br |
| _version_ |
1854947697565368320 |