Symmetric generalized Heckman models

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: Cordeiro, Shayane dos Santos
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.unb.br/handle/10482/44283
Resumo: Dissertação (mestrado) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2022.
id UNB_6e68ba4b72134bc9abcd5bdbd9253cdd
oai_identifier_str oai:repositorio.unb.br:10482/44283
network_acronym_str UNB
network_name_str Repositório Institucional da UnB
repository_id_str
spelling Symmetric generalized Heckman modelsModelos de HeckmanDistribuições simétricasDispersão variávelCorrelação variávelDissertação (mestrado) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2022.O problema de viés de seleção amostral surge quando uma variável de interesse está correlacionada com uma variável latente, e envolve situações em que a variável de interesse tem parte das suas observações censuradas. A censura é uma espécie de limitação na amostra em que determinadas observações da variável resposta não são verificadas, não por sua ausência, mas por vezes porque o objeto de estudo não sofreu o evento de interesse, porém outras informações que ajudam a explicar o evento foram obtidas. Esse problema ocorre, em diversas áreas da Economia, Ciências Políticas, Estatística, Sociologia entre outras. Para evitar problemas de seleção amostral o recomendado é utilizar toda a amostra de dados, uma vez que as variáveis explicativas foram observadas e a variável resposta censurada pode transmitir informação sobre todo o conjunto de dados. Uma forma de verificar se a variável de interesse censurada transmite informação é utilizar uma covariável que capture o viés ao se considerar uma amostra, em que apenas as variáveis dependentes foram observadas. Caso esse viés seja significativo, deve-se trabalhar com a base de dados completa O matemático e economista James Joseph Heckman foi o primeiro a estudar dados com de viés de seleção amostral e em 1976 propôs um modelo de seleção amostral baseado na distribuição normal bivariada que considera tanto a variável de interesse quanto a variável latente, apesar do seu empenho o método utilizava a estimação por máxima verossimilhança e foi bastante criticado devido a dificuldade de sua implementação e suposições do modelo, o que o levou a propor um modelo alternativo mais simples denominado método dos dois passos, também conhecido como modelo Tobit tipo 2, na literatura econométrica. Estudos propostos, tais como Nelson (1984), Paarsch (1984), Manning, Duan, and Rogers (1987), Stolzenberg and Relles (1990) and Leung and Yu (1996) sugerem que o modelo pode reduzir ou eliminar o viés de seleção quando seus pressupostos são atendidos. Contudo o desvio de normalidade pode ocasionar uma distorção nos resultados ou mesmo inviabilizar o ajuste. A suposição de normalidade tem sido relaxada por modelos mais flexíveis, ao sugerir o uso de outras distribuições bivariadas em substituição a distribuição normal tais como a Student-t aplicada por Marchenko and Genton (2012) and Lachos, Prates, and Dey (2021) que apresenta caudas mais pesadas e permite ajustes mais robustos, Skew-normal (Ogundimu and Hutton, 2016), abordagem Bayesiana Ding (2014) e baseada em cópulas Lee (1983). Abordagens semiparamétricas (Ahn and Powell, 1993) e não-paramétricas (M. Das and Vella, 2003) também foram consideradas, contudo as abordagens paramétricas permitem identificar o intercepto do modelo o que pode ser útil em análises com predições. No modelo de Heckman Clássico os erros são normalmente distribuídos, com parâmetros de dispersão e correlação constantes, a generalização do modelo clássico consiste em introduzir covariáveis aos parâmetros de dispersão e correlação, a fim de modelar dados reais que frequentemente apresentam dispersão variável, possibilitando a identificação de covariáveis responsáveis pela variabilidade dos dados e o viés de seleção. Nesse sentido este trabalho tem como objetivo propor modelos de seleção amostral Heckman generalizados baseados nas distribuições simétricas (Fang, Kotz, and Ng, 1990). Trata-se de uma nova classe de modelo de seleção amostral em que são acrescidas covariáveis aos parâmetros de dispersão e de correlação, que possibilitam explicar a heterocedasticidade e o viés de seleção amostral respectivamente. Neste estudo, na seção 1.2 introduzimos o modelo de Heckman generalizado simétrico, obtendo sua função densidade de probabilidade, que apresenta dois componentes um discreto e outro contínuo, que é utilizada para a estimação dos parâmetros do modelo através da função de log-verossimilhança. Na seção 1.3 derivamos o modelo de Heckman-Student-t generalizado que é um caso especial do modelo de Heckman generalizado simétrico, obtendo a função densidade de probabilidade e estimando os parâmetros do modelo. Na seção 1.4, um estudo de simulação de Monte Carlo realizado para avaliar o comportamento do método de estimação de parâmetros dos modelos de Heckman-normal generalizado e Heckman-Student-t utilizando o viés e o Erro Quadrático Médio (EQM), considerando quatro cenários mostrou bons resultados, na presença de altas/baixas taxas de censura e correlação. Dois conjuntos de dados reais, gastos ambulatoriais da base Medical Expenditure Panel Survey (MEPS) de 2001, também utilizados por Cameron and Trivedi (2009), Marchenko and Genton (2012), M. Zhelonkin and Ronchetti (2016) e Bastos and Barreto-Souza (2020), disponível no software R via pacote ssmrob de M. Zhelonkin et al. (2016) e as bases públicas dos governos dos Estados de São Paulo e Minas Gerais, com covariáveis que explicam o Investimento em Educação (IE) no ano de 2018, são analisados, na seção 1.5, para ilustrar a abordagem proposta e revelaram o bom ajuste do modelo de Heckman-t generalizado comparado com o modelo normal generalizado, além estimação dos parâmetros, também foram obtidos os resíduos do tipo-martingale (MT) e o ajuste dos respectivos quantis favoreceram o modelo proposto no estudo que se ajusta melhor a dados com valores extremos.The sample selection bias problem arises when a variable of interest is correlated with a latent variable, and involves situations in which the response variable had part of its observations censored. Heckman (1976) proposed a sample selection model based on the bivariate normal distribution that fits both the variable of interest and the latent variable. Recently, this assumption of normality has been relaxed by more flexible models such as the Student-t distribution (Marchenko and Genton, 2012; Lachos, Prates, and Dey, 2021). The aim of this work is to propose generalized Heckman sample selection models based on symmetric distributions (Fang, Kotz, and Ng, 1990). This is a new class of sample selection models, in which variables are added to the dispersion and correlation parameters. A Monte Carlo simulation study is performed to assess the behavior of the parameter estimation method. Two real data sets are analyzed to illustrate the proposed approach.Instituto de Ciências Exatas (IE)Departamento de Estatística (IE EST)Programa de Pós-Graduação em EstatísticaSantos, Helton Saulo Bezerra dosshayane.cordeiro@gmail.comCordeiro, Shayane dos Santos2022-07-19T21:44:01Z2022-07-19T21:44:01Z2022-07-192022-04-25info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfCORDEIRO, Shayane dos Santos. Symmetric generalized Heckman models. 2022. xii, 27 f., il. Dissertação (Mestrado em Estatística) — Universidade de Brasília, Brasília, 2022.https://repositorio.unb.br/handle/10482/44283engA concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UnBinstname:Universidade de Brasília (UnB)instacron:UNB2025-03-19T15:56:35Zoai:repositorio.unb.br:10482/44283Repositório InstitucionalPUBhttps://repositorio.unb.br/oai/requestrepositorio@unb.bropendoar:2025-03-19T15:56:35Repositório Institucional da UnB - Universidade de Brasília (UnB)false
dc.title.none.fl_str_mv Symmetric generalized Heckman models
title Symmetric generalized Heckman models
spellingShingle Symmetric generalized Heckman models
Cordeiro, Shayane dos Santos
Modelos de Heckman
Distribuições simétricas
Dispersão variável
Correlação variável
title_short Symmetric generalized Heckman models
title_full Symmetric generalized Heckman models
title_fullStr Symmetric generalized Heckman models
title_full_unstemmed Symmetric generalized Heckman models
title_sort Symmetric generalized Heckman models
author Cordeiro, Shayane dos Santos
author_facet Cordeiro, Shayane dos Santos
author_role author
dc.contributor.none.fl_str_mv Santos, Helton Saulo Bezerra dos
shayane.cordeiro@gmail.com
dc.contributor.author.fl_str_mv Cordeiro, Shayane dos Santos
dc.subject.por.fl_str_mv Modelos de Heckman
Distribuições simétricas
Dispersão variável
Correlação variável
topic Modelos de Heckman
Distribuições simétricas
Dispersão variável
Correlação variável
description Dissertação (mestrado) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2022.
publishDate 2022
dc.date.none.fl_str_mv 2022-07-19T21:44:01Z
2022-07-19T21:44:01Z
2022-07-19
2022-04-25
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv CORDEIRO, Shayane dos Santos. Symmetric generalized Heckman models. 2022. xii, 27 f., il. Dissertação (Mestrado em Estatística) — Universidade de Brasília, Brasília, 2022.
https://repositorio.unb.br/handle/10482/44283
identifier_str_mv CORDEIRO, Shayane dos Santos. Symmetric generalized Heckman models. 2022. xii, 27 f., il. Dissertação (Mestrado em Estatística) — Universidade de Brasília, Brasília, 2022.
url https://repositorio.unb.br/handle/10482/44283
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Repositório Institucional da UnB
collection Repositório Institucional da UnB
repository.name.fl_str_mv Repositório Institucional da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv repositorio@unb.br
_version_ 1839083993095471104