Distribuições discretas zero-modificadas para modelar dados de contagem zeros faltantes

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Mascarin, Isis Fernanda
Orientador(a): Conceição, Katiane Silva lattes
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de São Carlos
Câmpus São Carlos
Programa de Pós-Graduação: Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.ufscar.br/handle/20.500.14289/12241
Resumo: The analysis of count data takes an important place in applied statistics, since many real problems are expressed in terms of counts. Frequently, count data sets have discrepancies in the frequency of the zero observation, which may be high or low, and in these cases the set is referred as zero-inflated or zero-deflated, respectively. Besides, there are situations where the zero observation does not occur in the data set, and often zero-truncated models are inadequately considered, since there is a positive probability (and not a null one) for such event, although it has not occurred. The main aim of this dissertation is to present the procedure for parameter estimation of the zero-modified distributions in situations where the frequency of zero observation in the data set is zero and the occurrence probability of this same value is positive (zero-deflated). The proposed methodology considers the estimation of missing zeros in the data set consisting only of positive observations, such that the increased data set (with the estimated zeros included) can be explained by a traditional distribution. Moments and maximum likelihood methods are considered for the estimation procedure using the estimation-maximization algorithm. Simulation and artificial data studies are used to evaluate the properties of the estimators and estimates obtained. Real data sets with different cases of zero-modification are also analyzed.
id SCAR_6e27dddb48881936089265cb30a11766
oai_identifier_str oai:repositorio.ufscar.br:20.500.14289/12241
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str
spelling Mascarin, Isis FernandaConceição, Katiane Silvahttp://lattes.cnpq.br/5789619620619667http://lattes.cnpq.br/201901053744652504860ae6-9cdd-40ce-b17d-53be670846952020-02-13T12:00:15Z2020-02-13T12:00:15Z2020-01-24MASCARIN, Isis Fernanda. Distribuições discretas zero-modificadas para modelar dados de contagem zeros faltantes. 2020. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2020. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/12241.https://repositorio.ufscar.br/handle/20.500.14289/12241The analysis of count data takes an important place in applied statistics, since many real problems are expressed in terms of counts. Frequently, count data sets have discrepancies in the frequency of the zero observation, which may be high or low, and in these cases the set is referred as zero-inflated or zero-deflated, respectively. Besides, there are situations where the zero observation does not occur in the data set, and often zero-truncated models are inadequately considered, since there is a positive probability (and not a null one) for such event, although it has not occurred. The main aim of this dissertation is to present the procedure for parameter estimation of the zero-modified distributions in situations where the frequency of zero observation in the data set is zero and the occurrence probability of this same value is positive (zero-deflated). The proposed methodology considers the estimation of missing zeros in the data set consisting only of positive observations, such that the increased data set (with the estimated zeros included) can be explained by a traditional distribution. Moments and maximum likelihood methods are considered for the estimation procedure using the estimation-maximization algorithm. Simulation and artificial data studies are used to evaluate the properties of the estimators and estimates obtained. Real data sets with different cases of zero-modification are also analyzed.A análise de dados de contagem ocupa um importante lugar dentro da estatística aplicada, uma vez que muitos problemas reais são expressos em termos de enumerações. Frequentemente, conjuntos de dados de contagem apresentam discrepâncias na frequência da observação zero, que pode ser alta ou baixa, e assim refere-se ao conjunto de dados como zero-inflacionado ou zero-deflacionado, respectivamente. Além disso, existem situações onde a observação zero não ocorre nos conjuntos de dados e, muitas vezes, modelos zero-truncados são inadequadamente considerados, visto que há uma probabilidade positiva (e não nula) para ocorrência de tal evento, embora este não tenha ocorrido. Esta dissertação tem como objetivo principal apresentar o procedimento de estimação dos parâmetros das distribuições zero-modificadas em situações em que a frequência da observação zero nos conjuntos de dados é nula e a probabilidade de ocorrência de tal valor é positiva (zero-deflacionada). A metodologia proposta considera a estimação de zeros faltantes no conjunto de dados formado apenas pelas observações positivas, tal que o conjunto de dados aumentados (adicionando-se os zeros estimados) pode ser explicado por uma distribuição tradicional. Métodos dos momentos e da máxima verossimilhança são considerados para o procedimento de estimação por meio do algoritmo de estimação-maximização. Estudos de simulação e com dados artificiais são utilizados para avaliação das propriedades dos estimadores e estimativas obtidas. Conjuntos de dados reais que apresentam diferentes casos de zero-modificação também são analisados.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)CAPES: Código de Financiamento 001porUniversidade Federal de São CarlosCâmpus São CarlosPrograma Interinstitucional de Pós-Graduação em Estatística - PIPGEsUFSCarAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessDistribuições zero-modificadasDados zero-deflacionadosZeros faltantesEstimador de máxima verossimilhançaAlgoritmo EMZero-modified distributionsZero-deflated dataMissing zerosMaximum likelihood estimatorEM algorithmCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICADistribuições discretas zero-modificadas para modelar dados de contagem zeros faltantesZero-modified discrete distributions for modeling missing zeros count datainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis600600611dd836-5536-4200-84b0-ddce35f2140creponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALDissertacaoVersaoFinalRevisada-OK.pdfDissertacaoVersaoFinalRevisada-OK.pdfDissertação de Mestradoapplication/pdf2223230https://repositorio.ufscar.br/bitstreams/f518f044-d59e-4ca9-be5d-e99431a736a4/downloadb73e4c61018645b4ac485e77c123bbb9MD51trueAnonymousREADcartacomprovantepipges-preenchida.pdfcartacomprovantepipges-preenchida.pdfCarta Comprovanteapplication/pdf816126https://repositorio.ufscar.br/bitstreams/75111d16-14bd-4267-b166-b3344b67faab/download602e196060423ca6814048ba91f9bae3MD52falseAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufscar.br/bitstreams/53760c1a-948b-4642-a002-cd34daab7fae/downloade39d27027a6cc9cb039ad269a5db8e34MD53falseAnonymousREADTEXTDissertacaoVersaoFinalRevisada-OK.pdf.txtDissertacaoVersaoFinalRevisada-OK.pdf.txtExtracted texttext/plain243916https://repositorio.ufscar.br/bitstreams/c0770b77-2fb3-456e-8a51-6a18ae969b5e/download33475d4d9e9e91ad935a69c1c4950eefMD58falseAnonymousREADcartacomprovantepipges-preenchida.pdf.txtcartacomprovantepipges-preenchida.pdf.txtExtracted texttext/plain1271https://repositorio.ufscar.br/bitstreams/16bead31-ea18-49a5-949b-a6402541ed78/download3f0c59a0523aa360af98b845d657a591MD510falseAnonymousREADTHUMBNAILDissertacaoVersaoFinalRevisada-OK.pdf.jpgDissertacaoVersaoFinalRevisada-OK.pdf.jpgIM Thumbnailimage/jpeg12553https://repositorio.ufscar.br/bitstreams/feb1324f-08cb-455c-8d52-377f2c9f0e0f/downloadd09364d9da774aca8a5a028d4cdfee28MD59falseAnonymousREADcartacomprovantepipges-preenchida.pdf.jpgcartacomprovantepipges-preenchida.pdf.jpgIM Thumbnailimage/jpeg8701https://repositorio.ufscar.br/bitstreams/15a14627-1505-45c7-9805-5f96cbe0b140/downloadcf6add9e08340951e27061be92a49b75MD511falseAnonymousREAD20.500.14289/122412025-02-05 18:22:01.063http://creativecommons.org/licenses/by-nc-nd/3.0/br/Attribution-NonCommercial-NoDerivs 3.0 Brazilopen.accessoai:repositorio.ufscar.br:20.500.14289/12241https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-02-05T21:22:01Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv Distribuições discretas zero-modificadas para modelar dados de contagem zeros faltantes
dc.title.alternative.eng.fl_str_mv Zero-modified discrete distributions for modeling missing zeros count data
title Distribuições discretas zero-modificadas para modelar dados de contagem zeros faltantes
spellingShingle Distribuições discretas zero-modificadas para modelar dados de contagem zeros faltantes
Mascarin, Isis Fernanda
Distribuições zero-modificadas
Dados zero-deflacionados
Zeros faltantes
Estimador de máxima verossimilhança
Algoritmo EM
Zero-modified distributions
Zero-deflated data
Missing zeros
Maximum likelihood estimator
EM algorithm
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA
title_short Distribuições discretas zero-modificadas para modelar dados de contagem zeros faltantes
title_full Distribuições discretas zero-modificadas para modelar dados de contagem zeros faltantes
title_fullStr Distribuições discretas zero-modificadas para modelar dados de contagem zeros faltantes
title_full_unstemmed Distribuições discretas zero-modificadas para modelar dados de contagem zeros faltantes
title_sort Distribuições discretas zero-modificadas para modelar dados de contagem zeros faltantes
author Mascarin, Isis Fernanda
author_facet Mascarin, Isis Fernanda
author_role author
dc.contributor.authorlattes.por.fl_str_mv http://lattes.cnpq.br/2019010537446525
dc.contributor.author.fl_str_mv Mascarin, Isis Fernanda
dc.contributor.advisor1.fl_str_mv Conceição, Katiane Silva
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/5789619620619667
dc.contributor.authorID.fl_str_mv 04860ae6-9cdd-40ce-b17d-53be67084695
contributor_str_mv Conceição, Katiane Silva
dc.subject.por.fl_str_mv Distribuições zero-modificadas
Dados zero-deflacionados
Zeros faltantes
Estimador de máxima verossimilhança
Algoritmo EM
topic Distribuições zero-modificadas
Dados zero-deflacionados
Zeros faltantes
Estimador de máxima verossimilhança
Algoritmo EM
Zero-modified distributions
Zero-deflated data
Missing zeros
Maximum likelihood estimator
EM algorithm
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA
dc.subject.eng.fl_str_mv Zero-modified distributions
Zero-deflated data
Missing zeros
Maximum likelihood estimator
EM algorithm
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA
description The analysis of count data takes an important place in applied statistics, since many real problems are expressed in terms of counts. Frequently, count data sets have discrepancies in the frequency of the zero observation, which may be high or low, and in these cases the set is referred as zero-inflated or zero-deflated, respectively. Besides, there are situations where the zero observation does not occur in the data set, and often zero-truncated models are inadequately considered, since there is a positive probability (and not a null one) for such event, although it has not occurred. The main aim of this dissertation is to present the procedure for parameter estimation of the zero-modified distributions in situations where the frequency of zero observation in the data set is zero and the occurrence probability of this same value is positive (zero-deflated). The proposed methodology considers the estimation of missing zeros in the data set consisting only of positive observations, such that the increased data set (with the estimated zeros included) can be explained by a traditional distribution. Moments and maximum likelihood methods are considered for the estimation procedure using the estimation-maximization algorithm. Simulation and artificial data studies are used to evaluate the properties of the estimators and estimates obtained. Real data sets with different cases of zero-modification are also analyzed.
publishDate 2020
dc.date.accessioned.fl_str_mv 2020-02-13T12:00:15Z
dc.date.available.fl_str_mv 2020-02-13T12:00:15Z
dc.date.issued.fl_str_mv 2020-01-24
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv MASCARIN, Isis Fernanda. Distribuições discretas zero-modificadas para modelar dados de contagem zeros faltantes. 2020. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2020. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/12241.
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/20.500.14289/12241
identifier_str_mv MASCARIN, Isis Fernanda. Distribuições discretas zero-modificadas para modelar dados de contagem zeros faltantes. 2020. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2020. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/12241.
url https://repositorio.ufscar.br/handle/20.500.14289/12241
dc.language.iso.fl_str_mv por
language por
dc.relation.confidence.fl_str_mv 600
600
dc.relation.authority.fl_str_mv 611dd836-5536-4200-84b0-ddce35f2140c
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.publisher.program.fl_str_mv Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs
dc.publisher.initials.fl_str_mv UFSCar
publisher.none.fl_str_mv Universidade Federal de São Carlos
Câmpus São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstreams/f518f044-d59e-4ca9-be5d-e99431a736a4/download
https://repositorio.ufscar.br/bitstreams/75111d16-14bd-4267-b166-b3344b67faab/download
https://repositorio.ufscar.br/bitstreams/53760c1a-948b-4642-a002-cd34daab7fae/download
https://repositorio.ufscar.br/bitstreams/c0770b77-2fb3-456e-8a51-6a18ae969b5e/download
https://repositorio.ufscar.br/bitstreams/16bead31-ea18-49a5-949b-a6402541ed78/download
https://repositorio.ufscar.br/bitstreams/feb1324f-08cb-455c-8d52-377f2c9f0e0f/download
https://repositorio.ufscar.br/bitstreams/15a14627-1505-45c7-9805-5f96cbe0b140/download
bitstream.checksum.fl_str_mv b73e4c61018645b4ac485e77c123bbb9
602e196060423ca6814048ba91f9bae3
e39d27027a6cc9cb039ad269a5db8e34
33475d4d9e9e91ad935a69c1c4950eef
3f0c59a0523aa360af98b845d657a591
d09364d9da774aca8a5a028d4cdfee28
cf6add9e08340951e27061be92a49b75
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv repositorio.sibi@ufscar.br
_version_ 1851688827045806080