Distribuições discretas zero-modificadas para modelar dados de contagem zeros faltantes
| Ano de defesa: | 2020 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de São Carlos
Câmpus São Carlos |
| Programa de Pós-Graduação: |
Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Palavras-chave em Inglês: | |
| Área do conhecimento CNPq: | |
| Link de acesso: | https://repositorio.ufscar.br/handle/20.500.14289/12241 |
Resumo: | The analysis of count data takes an important place in applied statistics, since many real problems are expressed in terms of counts. Frequently, count data sets have discrepancies in the frequency of the zero observation, which may be high or low, and in these cases the set is referred as zero-inflated or zero-deflated, respectively. Besides, there are situations where the zero observation does not occur in the data set, and often zero-truncated models are inadequately considered, since there is a positive probability (and not a null one) for such event, although it has not occurred. The main aim of this dissertation is to present the procedure for parameter estimation of the zero-modified distributions in situations where the frequency of zero observation in the data set is zero and the occurrence probability of this same value is positive (zero-deflated). The proposed methodology considers the estimation of missing zeros in the data set consisting only of positive observations, such that the increased data set (with the estimated zeros included) can be explained by a traditional distribution. Moments and maximum likelihood methods are considered for the estimation procedure using the estimation-maximization algorithm. Simulation and artificial data studies are used to evaluate the properties of the estimators and estimates obtained. Real data sets with different cases of zero-modification are also analyzed. |
| id |
SCAR_6e27dddb48881936089265cb30a11766 |
|---|---|
| oai_identifier_str |
oai:repositorio.ufscar.br:20.500.14289/12241 |
| network_acronym_str |
SCAR |
| network_name_str |
Repositório Institucional da UFSCAR |
| repository_id_str |
|
| spelling |
Mascarin, Isis FernandaConceição, Katiane Silvahttp://lattes.cnpq.br/5789619620619667http://lattes.cnpq.br/201901053744652504860ae6-9cdd-40ce-b17d-53be670846952020-02-13T12:00:15Z2020-02-13T12:00:15Z2020-01-24MASCARIN, Isis Fernanda. Distribuições discretas zero-modificadas para modelar dados de contagem zeros faltantes. 2020. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2020. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/12241.https://repositorio.ufscar.br/handle/20.500.14289/12241The analysis of count data takes an important place in applied statistics, since many real problems are expressed in terms of counts. Frequently, count data sets have discrepancies in the frequency of the zero observation, which may be high or low, and in these cases the set is referred as zero-inflated or zero-deflated, respectively. Besides, there are situations where the zero observation does not occur in the data set, and often zero-truncated models are inadequately considered, since there is a positive probability (and not a null one) for such event, although it has not occurred. The main aim of this dissertation is to present the procedure for parameter estimation of the zero-modified distributions in situations where the frequency of zero observation in the data set is zero and the occurrence probability of this same value is positive (zero-deflated). The proposed methodology considers the estimation of missing zeros in the data set consisting only of positive observations, such that the increased data set (with the estimated zeros included) can be explained by a traditional distribution. Moments and maximum likelihood methods are considered for the estimation procedure using the estimation-maximization algorithm. Simulation and artificial data studies are used to evaluate the properties of the estimators and estimates obtained. Real data sets with different cases of zero-modification are also analyzed.A análise de dados de contagem ocupa um importante lugar dentro da estatística aplicada, uma vez que muitos problemas reais são expressos em termos de enumerações. Frequentemente, conjuntos de dados de contagem apresentam discrepâncias na frequência da observação zero, que pode ser alta ou baixa, e assim refere-se ao conjunto de dados como zero-inflacionado ou zero-deflacionado, respectivamente. Além disso, existem situações onde a observação zero não ocorre nos conjuntos de dados e, muitas vezes, modelos zero-truncados são inadequadamente considerados, visto que há uma probabilidade positiva (e não nula) para ocorrência de tal evento, embora este não tenha ocorrido. Esta dissertação tem como objetivo principal apresentar o procedimento de estimação dos parâmetros das distribuições zero-modificadas em situações em que a frequência da observação zero nos conjuntos de dados é nula e a probabilidade de ocorrência de tal valor é positiva (zero-deflacionada). A metodologia proposta considera a estimação de zeros faltantes no conjunto de dados formado apenas pelas observações positivas, tal que o conjunto de dados aumentados (adicionando-se os zeros estimados) pode ser explicado por uma distribuição tradicional. Métodos dos momentos e da máxima verossimilhança são considerados para o procedimento de estimação por meio do algoritmo de estimação-maximização. Estudos de simulação e com dados artificiais são utilizados para avaliação das propriedades dos estimadores e estimativas obtidas. Conjuntos de dados reais que apresentam diferentes casos de zero-modificação também são analisados.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)CAPES: Código de Financiamento 001porUniversidade Federal de São CarlosCâmpus São CarlosPrograma Interinstitucional de Pós-Graduação em Estatística - PIPGEsUFSCarAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessDistribuições zero-modificadasDados zero-deflacionadosZeros faltantesEstimador de máxima verossimilhançaAlgoritmo EMZero-modified distributionsZero-deflated dataMissing zerosMaximum likelihood estimatorEM algorithmCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICADistribuições discretas zero-modificadas para modelar dados de contagem zeros faltantesZero-modified discrete distributions for modeling missing zeros count datainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis600600611dd836-5536-4200-84b0-ddce35f2140creponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINALDissertacaoVersaoFinalRevisada-OK.pdfDissertacaoVersaoFinalRevisada-OK.pdfDissertação de Mestradoapplication/pdf2223230https://repositorio.ufscar.br/bitstreams/f518f044-d59e-4ca9-be5d-e99431a736a4/downloadb73e4c61018645b4ac485e77c123bbb9MD51trueAnonymousREADcartacomprovantepipges-preenchida.pdfcartacomprovantepipges-preenchida.pdfCarta Comprovanteapplication/pdf816126https://repositorio.ufscar.br/bitstreams/75111d16-14bd-4267-b166-b3344b67faab/download602e196060423ca6814048ba91f9bae3MD52falseAnonymousREADCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufscar.br/bitstreams/53760c1a-948b-4642-a002-cd34daab7fae/downloade39d27027a6cc9cb039ad269a5db8e34MD53falseAnonymousREADTEXTDissertacaoVersaoFinalRevisada-OK.pdf.txtDissertacaoVersaoFinalRevisada-OK.pdf.txtExtracted texttext/plain243916https://repositorio.ufscar.br/bitstreams/c0770b77-2fb3-456e-8a51-6a18ae969b5e/download33475d4d9e9e91ad935a69c1c4950eefMD58falseAnonymousREADcartacomprovantepipges-preenchida.pdf.txtcartacomprovantepipges-preenchida.pdf.txtExtracted texttext/plain1271https://repositorio.ufscar.br/bitstreams/16bead31-ea18-49a5-949b-a6402541ed78/download3f0c59a0523aa360af98b845d657a591MD510falseAnonymousREADTHUMBNAILDissertacaoVersaoFinalRevisada-OK.pdf.jpgDissertacaoVersaoFinalRevisada-OK.pdf.jpgIM Thumbnailimage/jpeg12553https://repositorio.ufscar.br/bitstreams/feb1324f-08cb-455c-8d52-377f2c9f0e0f/downloadd09364d9da774aca8a5a028d4cdfee28MD59falseAnonymousREADcartacomprovantepipges-preenchida.pdf.jpgcartacomprovantepipges-preenchida.pdf.jpgIM Thumbnailimage/jpeg8701https://repositorio.ufscar.br/bitstreams/15a14627-1505-45c7-9805-5f96cbe0b140/downloadcf6add9e08340951e27061be92a49b75MD511falseAnonymousREAD20.500.14289/122412025-02-05 18:22:01.063http://creativecommons.org/licenses/by-nc-nd/3.0/br/Attribution-NonCommercial-NoDerivs 3.0 Brazilopen.accessoai:repositorio.ufscar.br:20.500.14289/12241https://repositorio.ufscar.brRepositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestrepositorio.sibi@ufscar.bropendoar:43222025-02-05T21:22:01Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false |
| dc.title.por.fl_str_mv |
Distribuições discretas zero-modificadas para modelar dados de contagem zeros faltantes |
| dc.title.alternative.eng.fl_str_mv |
Zero-modified discrete distributions for modeling missing zeros count data |
| title |
Distribuições discretas zero-modificadas para modelar dados de contagem zeros faltantes |
| spellingShingle |
Distribuições discretas zero-modificadas para modelar dados de contagem zeros faltantes Mascarin, Isis Fernanda Distribuições zero-modificadas Dados zero-deflacionados Zeros faltantes Estimador de máxima verossimilhança Algoritmo EM Zero-modified distributions Zero-deflated data Missing zeros Maximum likelihood estimator EM algorithm CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA |
| title_short |
Distribuições discretas zero-modificadas para modelar dados de contagem zeros faltantes |
| title_full |
Distribuições discretas zero-modificadas para modelar dados de contagem zeros faltantes |
| title_fullStr |
Distribuições discretas zero-modificadas para modelar dados de contagem zeros faltantes |
| title_full_unstemmed |
Distribuições discretas zero-modificadas para modelar dados de contagem zeros faltantes |
| title_sort |
Distribuições discretas zero-modificadas para modelar dados de contagem zeros faltantes |
| author |
Mascarin, Isis Fernanda |
| author_facet |
Mascarin, Isis Fernanda |
| author_role |
author |
| dc.contributor.authorlattes.por.fl_str_mv |
http://lattes.cnpq.br/2019010537446525 |
| dc.contributor.author.fl_str_mv |
Mascarin, Isis Fernanda |
| dc.contributor.advisor1.fl_str_mv |
Conceição, Katiane Silva |
| dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/5789619620619667 |
| dc.contributor.authorID.fl_str_mv |
04860ae6-9cdd-40ce-b17d-53be67084695 |
| contributor_str_mv |
Conceição, Katiane Silva |
| dc.subject.por.fl_str_mv |
Distribuições zero-modificadas Dados zero-deflacionados Zeros faltantes Estimador de máxima verossimilhança Algoritmo EM |
| topic |
Distribuições zero-modificadas Dados zero-deflacionados Zeros faltantes Estimador de máxima verossimilhança Algoritmo EM Zero-modified distributions Zero-deflated data Missing zeros Maximum likelihood estimator EM algorithm CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA |
| dc.subject.eng.fl_str_mv |
Zero-modified distributions Zero-deflated data Missing zeros Maximum likelihood estimator EM algorithm |
| dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA |
| description |
The analysis of count data takes an important place in applied statistics, since many real problems are expressed in terms of counts. Frequently, count data sets have discrepancies in the frequency of the zero observation, which may be high or low, and in these cases the set is referred as zero-inflated or zero-deflated, respectively. Besides, there are situations where the zero observation does not occur in the data set, and often zero-truncated models are inadequately considered, since there is a positive probability (and not a null one) for such event, although it has not occurred. The main aim of this dissertation is to present the procedure for parameter estimation of the zero-modified distributions in situations where the frequency of zero observation in the data set is zero and the occurrence probability of this same value is positive (zero-deflated). The proposed methodology considers the estimation of missing zeros in the data set consisting only of positive observations, such that the increased data set (with the estimated zeros included) can be explained by a traditional distribution. Moments and maximum likelihood methods are considered for the estimation procedure using the estimation-maximization algorithm. Simulation and artificial data studies are used to evaluate the properties of the estimators and estimates obtained. Real data sets with different cases of zero-modification are also analyzed. |
| publishDate |
2020 |
| dc.date.accessioned.fl_str_mv |
2020-02-13T12:00:15Z |
| dc.date.available.fl_str_mv |
2020-02-13T12:00:15Z |
| dc.date.issued.fl_str_mv |
2020-01-24 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
MASCARIN, Isis Fernanda. Distribuições discretas zero-modificadas para modelar dados de contagem zeros faltantes. 2020. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2020. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/12241. |
| dc.identifier.uri.fl_str_mv |
https://repositorio.ufscar.br/handle/20.500.14289/12241 |
| identifier_str_mv |
MASCARIN, Isis Fernanda. Distribuições discretas zero-modificadas para modelar dados de contagem zeros faltantes. 2020. Dissertação (Mestrado em Estatística) – Universidade Federal de São Carlos, São Carlos, 2020. Disponível em: https://repositorio.ufscar.br/handle/20.500.14289/12241. |
| url |
https://repositorio.ufscar.br/handle/20.500.14289/12241 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.confidence.fl_str_mv |
600 600 |
| dc.relation.authority.fl_str_mv |
611dd836-5536-4200-84b0-ddce35f2140c |
| dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
| dc.publisher.program.fl_str_mv |
Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs |
| dc.publisher.initials.fl_str_mv |
UFSCar |
| publisher.none.fl_str_mv |
Universidade Federal de São Carlos Câmpus São Carlos |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFSCAR instname:Universidade Federal de São Carlos (UFSCAR) instacron:UFSCAR |
| instname_str |
Universidade Federal de São Carlos (UFSCAR) |
| instacron_str |
UFSCAR |
| institution |
UFSCAR |
| reponame_str |
Repositório Institucional da UFSCAR |
| collection |
Repositório Institucional da UFSCAR |
| bitstream.url.fl_str_mv |
https://repositorio.ufscar.br/bitstreams/f518f044-d59e-4ca9-be5d-e99431a736a4/download https://repositorio.ufscar.br/bitstreams/75111d16-14bd-4267-b166-b3344b67faab/download https://repositorio.ufscar.br/bitstreams/53760c1a-948b-4642-a002-cd34daab7fae/download https://repositorio.ufscar.br/bitstreams/c0770b77-2fb3-456e-8a51-6a18ae969b5e/download https://repositorio.ufscar.br/bitstreams/16bead31-ea18-49a5-949b-a6402541ed78/download https://repositorio.ufscar.br/bitstreams/feb1324f-08cb-455c-8d52-377f2c9f0e0f/download https://repositorio.ufscar.br/bitstreams/15a14627-1505-45c7-9805-5f96cbe0b140/download |
| bitstream.checksum.fl_str_mv |
b73e4c61018645b4ac485e77c123bbb9 602e196060423ca6814048ba91f9bae3 e39d27027a6cc9cb039ad269a5db8e34 33475d4d9e9e91ad935a69c1c4950eef 3f0c59a0523aa360af98b845d657a591 d09364d9da774aca8a5a028d4cdfee28 cf6add9e08340951e27061be92a49b75 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR) |
| repository.mail.fl_str_mv |
repositorio.sibi@ufscar.br |
| _version_ |
1851688827045806080 |