Presença de dados missing em modelos de regressão logística

Detalhes bibliográficos
Ano de defesa: 2008
Autor(a) principal: Ferreira, Natália Manduca
Orientador(a): Diniz, Carlos Alberto Ribeiro lattes
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de São Carlos
Programa de Pós-Graduação: Programa de Pós-Graduação em Estatística - PPGEs
Departamento: Não Informado pela instituição
País: BR
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.ufscar.br/handle/20.500.14289/4526
Resumo: In this work we present a detailed study of the logistic regression model with missing data in the independent variables. Several techniques are considered such as Complete Case, Mean Imputation and Corrected Complete Case. We present a new estimator, denoted EMVGM, given by the combination between the Complete Case estimator and the ML-estimator with the use of Gaussian quadrature. A simulation study is carried out to evaluate the performance of the ML-estimators obtained in each technique above mentioned. In general, the alternative estimador, EMVGM, presents a better performance taking into account the variance, the bias and the mean quadratic error.
id SCAR_15946c7bbd5c3d182cece5f98c8ebc80
oai_identifier_str oai:repositorio.ufscar.br:20.500.14289/4526
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str
spelling Ferreira, Natália ManducaDiniz, Carlos Alberto Ribeirohttp://lattes.cnpq.br/3277371897783194http://lattes.cnpq.br/2557890621383548e8a5ff40-3e17-4f82-8f5b-99c3fa4359302016-06-02T20:06:02Z2009-07-142016-06-02T20:06:02Z2008-09-05FERREIRA, Natália Manduca. Presença de dados missing em modelos de regressão logística. 2008. 104 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2008.https://repositorio.ufscar.br/handle/20.500.14289/4526In this work we present a detailed study of the logistic regression model with missing data in the independent variables. Several techniques are considered such as Complete Case, Mean Imputation and Corrected Complete Case. We present a new estimator, denoted EMVGM, given by the combination between the Complete Case estimator and the ML-estimator with the use of Gaussian quadrature. A simulation study is carried out to evaluate the performance of the ML-estimators obtained in each technique above mentioned. In general, the alternative estimador, EMVGM, presents a better performance taking into account the variance, the bias and the mean quadratic error.Neste trabalho apresentamos um estudo detalhado do modelo de regressão logística na presença de valores missing nas covariáveis considerando as técnicas Caso Completo, Imputação pela Média e Caso Completo Corrigido. Um novo método, denotado EMVGM, dado pela combinação entre os estimadores de Caso Completo e os estimadores obtidos via Máxima Verossimilhança com uso da Quadratura Gaussiana, é sugerido. No desenvolvimento do estudo são realizadas simulações para a verificação do desempenho dos estimadores de máxima verossimilhança obtidos em cada técnica citada acima. A avaliação mostra que a qualidade dos parâmetros estimados obtidos por meio de cada técnica varia de acordo com o tamanho da amostra e com o número de dados missing e que, em geral, o estimador sugerido, EMVGM, apresenta os melhores estimadores levando em conta as métricas variância estimada, vício estimado e erro quadrático médio estimado.application/pdfporUniversidade Federal de São CarlosPrograma de Pós-Graduação em Estatística - PPGEsUFSCarBRRegressão logísticaAusência de dados (Estatística)EstimadoresCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICAPresença de dados missing em modelos de regressão logísticainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis84611362-11c0-4efd-b118-a7df9999df87info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARTEXT2299.pdf.txt2299.pdf.txtExtracted texttext/plain104377https://repositorio.ufscar.br/bitstreams/f6acda47-81a7-4251-aa61-33336f9d32ac/download32575ba37dbcf0db2fe30d0e5187c551MD53falseAnonymousREADORIGINAL2299.pdfapplication/pdf552812https://repositorio.ufscar.br/bitstreams/568e12f7-3613-424d-b5c5-d17d45835b36/download2850eae9547732d0f7921feb333884a5MD51trueAnonymousREADTHUMBNAIL2299.pdf.jpg2299.pdf.jpgIM Thumbnailimage/jpeg6772https://repositorio.ufscar.br/bitstreams/369c479c-9482-480f-bba8-a23798ff5315/download2d983ad93baab0a619945a6fdb14a028MD52falseAnonymousREAD20.500.14289/45262025-02-06 05:01:48.679open.accessoai:repositorio.ufscar.br:20.500.14289/4526https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-02-06T08:01:48Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv Presença de dados missing em modelos de regressão logística
title Presença de dados missing em modelos de regressão logística
spellingShingle Presença de dados missing em modelos de regressão logística
Ferreira, Natália Manduca
Regressão logística
Ausência de dados (Estatística)
Estimadores
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA
title_short Presença de dados missing em modelos de regressão logística
title_full Presença de dados missing em modelos de regressão logística
title_fullStr Presença de dados missing em modelos de regressão logística
title_full_unstemmed Presença de dados missing em modelos de regressão logística
title_sort Presença de dados missing em modelos de regressão logística
author Ferreira, Natália Manduca
author_facet Ferreira, Natália Manduca
author_role author
dc.contributor.authorlattes.por.fl_str_mv http://lattes.cnpq.br/2557890621383548
dc.contributor.author.fl_str_mv Ferreira, Natália Manduca
dc.contributor.advisor1.fl_str_mv Diniz, Carlos Alberto Ribeiro
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/3277371897783194
dc.contributor.authorID.fl_str_mv e8a5ff40-3e17-4f82-8f5b-99c3fa435930
contributor_str_mv Diniz, Carlos Alberto Ribeiro
dc.subject.por.fl_str_mv Regressão logística
Ausência de dados (Estatística)
Estimadores
topic Regressão logística
Ausência de dados (Estatística)
Estimadores
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA
description In this work we present a detailed study of the logistic regression model with missing data in the independent variables. Several techniques are considered such as Complete Case, Mean Imputation and Corrected Complete Case. We present a new estimator, denoted EMVGM, given by the combination between the Complete Case estimator and the ML-estimator with the use of Gaussian quadrature. A simulation study is carried out to evaluate the performance of the ML-estimators obtained in each technique above mentioned. In general, the alternative estimador, EMVGM, presents a better performance taking into account the variance, the bias and the mean quadratic error.
publishDate 2008
dc.date.issued.fl_str_mv 2008-09-05
dc.date.available.fl_str_mv 2009-07-14
2016-06-02T20:06:02Z
dc.date.accessioned.fl_str_mv 2016-06-02T20:06:02Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv FERREIRA, Natália Manduca. Presença de dados missing em modelos de regressão logística. 2008. 104 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2008.
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/20.500.14289/4526
identifier_str_mv FERREIRA, Natália Manduca. Presença de dados missing em modelos de regressão logística. 2008. 104 f. Dissertação (Mestrado em Ciências Exatas e da Terra) - Universidade Federal de São Carlos, São Carlos, 2008.
url https://repositorio.ufscar.br/handle/20.500.14289/4526
dc.language.iso.fl_str_mv por
language por
dc.relation.authority.fl_str_mv 84611362-11c0-4efd-b118-a7df9999df87
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Estatística - PPGEs
dc.publisher.initials.fl_str_mv UFSCar
dc.publisher.country.fl_str_mv BR
publisher.none.fl_str_mv Universidade Federal de São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstreams/f6acda47-81a7-4251-aa61-33336f9d32ac/download
https://repositorio.ufscar.br/bitstreams/568e12f7-3613-424d-b5c5-d17d45835b36/download
https://repositorio.ufscar.br/bitstreams/369c479c-9482-480f-bba8-a23798ff5315/download
bitstream.checksum.fl_str_mv 32575ba37dbcf0db2fe30d0e5187c551
2850eae9547732d0f7921feb333884a5
2d983ad93baab0a619945a6fdb14a028
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv repositorio.sibi@ufscar.br
_version_ 1851688934437814272