Testes estatísticos em regressão logística sob a condição de separabilidade

Detalhes bibliográficos
Ano de defesa: 2010
Autor(a) principal: Souza, André Oliveira
Orientador(a): Martins Filho, Sebastião lattes
Banca de defesa: Loschi, Rosângela Helena lattes, Ribeiro Junior, José Ivo lattes
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Viçosa
Programa de Pós-Graduação: Mestrado em Estatística Aplicada e Biometria
Departamento: Estatística Aplicada e Biometria
País: BR
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: http://locus.ufv.br/handle/123456789/4032
Resumo: Logistic regression is the statistical method of analysis used when the objective is to verify the relationship between one dichotomic response variable and explicative variables of interest. Usually, the model parameters are estimated through the genuine maximum likelihood method, and tests about these parameters are built assuming approximated distributions for the estimators. This means that large samples become necessary to obtain trustable results. In studies involving binary data is common the occurrence of one response variable whose success has low probability, in other words, a rare event that can generate a sparse data sample. In such cases, the data are under separability condition, and this situation is frequently associated to the presence of one categorical co-variable, what means that the maximum likelihood estimators do not exist to one parameter at least. In the separability condition it is recommended to use the Penalized Maximum Likelihood method, proposed by Firth (1993). The main objective of this study was to verify the powers of the Likelihood Ratio Test (LRT) and Wald Test obtained through PML under separability condition by Monte Carlo simulation. The presented methodology has been applied to two real data sets. Monte Carlo simulation with one explicative variable in the model made possible to obtain indicatives that the LRT is most powerful than the Wald test.
id UFV_678dde16141b21ba9a60b8f80312597d
oai_identifier_str oai:locus.ufv.br:123456789/4032
network_acronym_str UFV
network_name_str LOCUS Repositório Institucional da UFV
repository_id_str
spelling Souza, André Oliveirahttp://lattes.cnpq.br/5802669165872867Colosimo, Enrico Antôniohttp://lattes.cnpq.br/8074052644801438Silva, Fabyano Fonseca ehttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2Martins Filho, Sebastiãohttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282T5Loschi, Rosângela Helenahttp://lattes.cnpq.br/8443300958745785Ribeiro Junior, José Ivohttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282Y62015-03-26T13:32:09Z2011-02-242015-03-26T13:32:09Z2010-02-25SOUZA, André Oliveira. Statistical tests in logistic regression under separability condition. 2010. 77 f. Dissertação (Mestrado em Estatística Aplicada e Biometria) - Universidade Federal de Viçosa, Viçosa, 2010.http://locus.ufv.br/handle/123456789/4032Logistic regression is the statistical method of analysis used when the objective is to verify the relationship between one dichotomic response variable and explicative variables of interest. Usually, the model parameters are estimated through the genuine maximum likelihood method, and tests about these parameters are built assuming approximated distributions for the estimators. This means that large samples become necessary to obtain trustable results. In studies involving binary data is common the occurrence of one response variable whose success has low probability, in other words, a rare event that can generate a sparse data sample. In such cases, the data are under separability condition, and this situation is frequently associated to the presence of one categorical co-variable, what means that the maximum likelihood estimators do not exist to one parameter at least. In the separability condition it is recommended to use the Penalized Maximum Likelihood method, proposed by Firth (1993). The main objective of this study was to verify the powers of the Likelihood Ratio Test (LRT) and Wald Test obtained through PML under separability condition by Monte Carlo simulation. The presented methodology has been applied to two real data sets. Monte Carlo simulation with one explicative variable in the model made possible to obtain indicatives that the LRT is most powerful than the Wald test.A regressão logística é o método estatístico usual de análise utilizado quando o objetivo é verificar a relação entre uma variável resposta dicotômica e variáveis explicativas de interesse. Usualmente, os parâmetros deste modelo são estimados pelo método de máxima verossimilhança genuína, e testes sobre estes parâmetros são construídos considerando as distribuições aproximadas dos estimadores. Isto significa que amostras grandes tornam-se necessárias para obter resultados mais confiáveis. Em estudos envolvendo dados binários, é frequente a presença de uma variável resposta cujo sucesso é pouco provável, ou seja, tem-se um evento raro, o que pode gerar uma amostra de dados esparsos. Nestes casos, diz-se que os dados podem estar sob a condição de separabilidade, e esta situação está frequentemente associada à presença de uma covariável categórica, podendo os estimadores de máxima verossimilhança, para pelo menos um parâmetro, não existir. Na situação de separabilidade recomenda-se utilizar o método de máxima verossimilhança penalizada proposto por Firth (1993). O objetivo principal deste trabalho foi verificar por meio de simulação Monte Carlo os poderes dos testes da razão de verossimilhanças (TRV) e de Wald obtido via máxima verossimilhança penalizada na condição de separabilidade. A metodologia apresentada neste trabalho foi aplicada a dois conjuntos de dados reais. A simulação Monte Carlo com uma variável explicativa no modelo possibilitou obter indicativos que o TRV tem maior poder que o teste de Wald.application/pdfporUniversidade Federal de ViçosaMestrado em Estatística Aplicada e BiometriaUFVBREstatística Aplicada e BiometriaMáxima Verossimilhança PenalizadaSimulaçãoTeste da Razão de VerossimilhançaTeste de WaldPenalizmmed Maximum LikelihoodSimulationLikelihood Ratio TestWald testCNPQ::CIENCIAS AGRARIASTestes estatísticos em regressão logística sob a condição de separabilidadeStatistical tests in logistic regression under separability conditioninfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:LOCUS Repositório Institucional da UFVinstname:Universidade Federal de Viçosa (UFV)instacron:UFVORIGINALtexto completo.pdfapplication/pdf1038031https://locus.ufv.br//bitstream/123456789/4032/1/texto%20completo.pdf240d96ef94e9240b2d1dabb639823f07MD51TEXTtexto completo.pdf.txttexto completo.pdf.txtExtracted texttext/plain122684https://locus.ufv.br//bitstream/123456789/4032/2/texto%20completo.pdf.txt8c8c0653f59eb38671f243001b4b4944MD52THUMBNAILtexto completo.pdf.jpgtexto completo.pdf.jpgIM Thumbnailimage/jpeg3576https://locus.ufv.br//bitstream/123456789/4032/3/texto%20completo.pdf.jpgb078e9d3d43c080bd8b1d02f852c4f0aMD53123456789/40322016-04-09 23:17:27.653oai:locus.ufv.br:123456789/4032Repositório InstitucionalPUBhttps://www.locus.ufv.br/oai/requestfabiojreis@ufv.bropendoar:21452016-04-10T02:17:27LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV)false
dc.title.por.fl_str_mv Testes estatísticos em regressão logística sob a condição de separabilidade
dc.title.alternative.eng.fl_str_mv Statistical tests in logistic regression under separability condition
title Testes estatísticos em regressão logística sob a condição de separabilidade
spellingShingle Testes estatísticos em regressão logística sob a condição de separabilidade
Souza, André Oliveira
Máxima Verossimilhança Penalizada
Simulação
Teste da Razão de Verossimilhança
Teste de Wald
Penalizmmed Maximum Likelihood
Simulation
Likelihood Ratio Test
Wald test
CNPQ::CIENCIAS AGRARIAS
title_short Testes estatísticos em regressão logística sob a condição de separabilidade
title_full Testes estatísticos em regressão logística sob a condição de separabilidade
title_fullStr Testes estatísticos em regressão logística sob a condição de separabilidade
title_full_unstemmed Testes estatísticos em regressão logística sob a condição de separabilidade
title_sort Testes estatísticos em regressão logística sob a condição de separabilidade
author Souza, André Oliveira
author_facet Souza, André Oliveira
author_role author
dc.contributor.authorLattes.por.fl_str_mv http://lattes.cnpq.br/5802669165872867
dc.contributor.author.fl_str_mv Souza, André Oliveira
dc.contributor.advisor-co1.fl_str_mv Colosimo, Enrico Antônio
dc.contributor.advisor-co1Lattes.fl_str_mv http://lattes.cnpq.br/8074052644801438
dc.contributor.advisor-co2.fl_str_mv Silva, Fabyano Fonseca e
dc.contributor.advisor-co2Lattes.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2
dc.contributor.advisor1.fl_str_mv Martins Filho, Sebastião
dc.contributor.advisor1Lattes.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282T5
dc.contributor.referee1.fl_str_mv Loschi, Rosângela Helena
dc.contributor.referee1Lattes.fl_str_mv http://lattes.cnpq.br/8443300958745785
dc.contributor.referee2.fl_str_mv Ribeiro Junior, José Ivo
dc.contributor.referee2Lattes.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282Y6
contributor_str_mv Colosimo, Enrico Antônio
Silva, Fabyano Fonseca e
Martins Filho, Sebastião
Loschi, Rosângela Helena
Ribeiro Junior, José Ivo
dc.subject.por.fl_str_mv Máxima Verossimilhança Penalizada
Simulação
Teste da Razão de Verossimilhança
Teste de Wald
topic Máxima Verossimilhança Penalizada
Simulação
Teste da Razão de Verossimilhança
Teste de Wald
Penalizmmed Maximum Likelihood
Simulation
Likelihood Ratio Test
Wald test
CNPQ::CIENCIAS AGRARIAS
dc.subject.eng.fl_str_mv Penalizmmed Maximum Likelihood
Simulation
Likelihood Ratio Test
Wald test
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS AGRARIAS
description Logistic regression is the statistical method of analysis used when the objective is to verify the relationship between one dichotomic response variable and explicative variables of interest. Usually, the model parameters are estimated through the genuine maximum likelihood method, and tests about these parameters are built assuming approximated distributions for the estimators. This means that large samples become necessary to obtain trustable results. In studies involving binary data is common the occurrence of one response variable whose success has low probability, in other words, a rare event that can generate a sparse data sample. In such cases, the data are under separability condition, and this situation is frequently associated to the presence of one categorical co-variable, what means that the maximum likelihood estimators do not exist to one parameter at least. In the separability condition it is recommended to use the Penalized Maximum Likelihood method, proposed by Firth (1993). The main objective of this study was to verify the powers of the Likelihood Ratio Test (LRT) and Wald Test obtained through PML under separability condition by Monte Carlo simulation. The presented methodology has been applied to two real data sets. Monte Carlo simulation with one explicative variable in the model made possible to obtain indicatives that the LRT is most powerful than the Wald test.
publishDate 2010
dc.date.issued.fl_str_mv 2010-02-25
dc.date.available.fl_str_mv 2011-02-24
2015-03-26T13:32:09Z
dc.date.accessioned.fl_str_mv 2015-03-26T13:32:09Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv SOUZA, André Oliveira. Statistical tests in logistic regression under separability condition. 2010. 77 f. Dissertação (Mestrado em Estatística Aplicada e Biometria) - Universidade Federal de Viçosa, Viçosa, 2010.
dc.identifier.uri.fl_str_mv http://locus.ufv.br/handle/123456789/4032
identifier_str_mv SOUZA, André Oliveira. Statistical tests in logistic regression under separability condition. 2010. 77 f. Dissertação (Mestrado em Estatística Aplicada e Biometria) - Universidade Federal de Viçosa, Viçosa, 2010.
url http://locus.ufv.br/handle/123456789/4032
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Viçosa
dc.publisher.program.fl_str_mv Mestrado em Estatística Aplicada e Biometria
dc.publisher.initials.fl_str_mv UFV
dc.publisher.country.fl_str_mv BR
dc.publisher.department.fl_str_mv Estatística Aplicada e Biometria
publisher.none.fl_str_mv Universidade Federal de Viçosa
dc.source.none.fl_str_mv reponame:LOCUS Repositório Institucional da UFV
instname:Universidade Federal de Viçosa (UFV)
instacron:UFV
instname_str Universidade Federal de Viçosa (UFV)
instacron_str UFV
institution UFV
reponame_str LOCUS Repositório Institucional da UFV
collection LOCUS Repositório Institucional da UFV
bitstream.url.fl_str_mv https://locus.ufv.br//bitstream/123456789/4032/1/texto%20completo.pdf
https://locus.ufv.br//bitstream/123456789/4032/2/texto%20completo.pdf.txt
https://locus.ufv.br//bitstream/123456789/4032/3/texto%20completo.pdf.jpg
bitstream.checksum.fl_str_mv 240d96ef94e9240b2d1dabb639823f07
8c8c0653f59eb38671f243001b4b4944
b078e9d3d43c080bd8b1d02f852c4f0a
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV)
repository.mail.fl_str_mv fabiojreis@ufv.br
_version_ 1794528701611769856