Modelos não lineares truncados mistos para locação e escala

Detalhes bibliográficos
Ano de defesa: 2015
Autor(a) principal: Paraiba, Carolina Costa Mota
Orientador(a): Diniz, Carlos Alberto Ribeiro lattes
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso embargado
Idioma: por
Instituição de defesa: Universidade Federal de São Carlos
Programa de Pós-Graduação: Programa de Pós-Graduação em Estatística - PPGEs
Departamento: Não Informado pela instituição
País: BR
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.ufscar.br/handle/ufscar/4497
Resumo: We present a class of nonlinear truncated mixed-effects models where the truncation nature of the data is incorporated into the statistical model by assuming that the variable of interest, namely the truncated variable, follows a truncated distribution which, in turn, corresponds to a conditional distribution obtained by restricting the support of a given probability distribution function. The family of nonlinear truncated mixed-effects models for location and scale is constructed based on the perspective of nonlinear generalized mixed-effects models and by assuming that the distribution of response variable belongs to a truncated class of distributions indexed by a location and a scale parameter. The location parameter of the response variable is assumed to be associated with a continuous nonlinear function of covariates and unknown parameters and with unobserved random effects, and the scale parameter of the responses is assumed to be characterized by a continuous function of the covariates and unknown parameters. The proposed truncated nonlinear mixed-effects models are constructed assuming both random truncation limits; however, truncated nonlinear mixed-effects models with fixed known limits are readily obtained as particular cases of these models. For models constructed under the assumption of random truncation limits, the likelihood function of the observed data shall be a function both of the parameters of the truncated distribution of the truncated variable and of the parameters of the distribution of the truncation variables. For the particular case of fixed known truncation limits, the likelihood function of the observed data is a function only of the parameters of the truncated distribution assumed for the variable of interest. The likelihood equation resulting from the proposed truncated nonlinear regression models do not have analytical solutions and thus, under the frequentist inferential perspective, the model parameters are estimated by direct maximization of the log-likelihood using an iterative procedure. We also consider diagnostic analysis to check for model misspecification, outliers and influential observations using standardized residuals, and global and local influence metrics. Under the Bayesian perspective of statistical inference, parameter estimates are computed based on draws from the posterior distribution of parameters obtained using an Markov Chain Monte Carlo procedure. Posterior predictive checks, Bayesian standardized residuals and a Bayesian influence measures are considered to check for model adequacy, outliers and influential observations. As Bayesian model selection criteria, we consider the sum of log -CPO and a Bayesian model selection procedure using a Bayesian mixture model framework. To illustrate the proposed methodology, we analyze soil-water retention, which are used to construct soil-water characteristic curves and which are subject to truncation since soil-water content (the proportion of water in soil samples) is limited by the residual soil-water content and the saturated soil-water content.
id SCAR_1b601f2e0ca443f19d3e41c30e933ba3
oai_identifier_str oai:repositorio.ufscar.br:ufscar/4497
network_acronym_str SCAR
network_name_str Repositório Institucional da UFSCAR
repository_id_str
spelling Paraiba, Carolina Costa MotaDiniz, Carlos Alberto Ribeirohttp://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4781846J4&dataRevisao=nullhttp://lattes.cnpq.br/0125762088465949c38ba33e-3a49-4d6d-aecb-620d8330b54f2016-06-02T20:04:53Z2015-05-052016-06-02T20:04:53Z2015-01-14https://repositorio.ufscar.br/handle/ufscar/4497We present a class of nonlinear truncated mixed-effects models where the truncation nature of the data is incorporated into the statistical model by assuming that the variable of interest, namely the truncated variable, follows a truncated distribution which, in turn, corresponds to a conditional distribution obtained by restricting the support of a given probability distribution function. The family of nonlinear truncated mixed-effects models for location and scale is constructed based on the perspective of nonlinear generalized mixed-effects models and by assuming that the distribution of response variable belongs to a truncated class of distributions indexed by a location and a scale parameter. The location parameter of the response variable is assumed to be associated with a continuous nonlinear function of covariates and unknown parameters and with unobserved random effects, and the scale parameter of the responses is assumed to be characterized by a continuous function of the covariates and unknown parameters. The proposed truncated nonlinear mixed-effects models are constructed assuming both random truncation limits; however, truncated nonlinear mixed-effects models with fixed known limits are readily obtained as particular cases of these models. For models constructed under the assumption of random truncation limits, the likelihood function of the observed data shall be a function both of the parameters of the truncated distribution of the truncated variable and of the parameters of the distribution of the truncation variables. For the particular case of fixed known truncation limits, the likelihood function of the observed data is a function only of the parameters of the truncated distribution assumed for the variable of interest. The likelihood equation resulting from the proposed truncated nonlinear regression models do not have analytical solutions and thus, under the frequentist inferential perspective, the model parameters are estimated by direct maximization of the log-likelihood using an iterative procedure. We also consider diagnostic analysis to check for model misspecification, outliers and influential observations using standardized residuals, and global and local influence metrics. Under the Bayesian perspective of statistical inference, parameter estimates are computed based on draws from the posterior distribution of parameters obtained using an Markov Chain Monte Carlo procedure. Posterior predictive checks, Bayesian standardized residuals and a Bayesian influence measures are considered to check for model adequacy, outliers and influential observations. As Bayesian model selection criteria, we consider the sum of log -CPO and a Bayesian model selection procedure using a Bayesian mixture model framework. To illustrate the proposed methodology, we analyze soil-water retention, which are used to construct soil-water characteristic curves and which are subject to truncation since soil-water content (the proportion of water in soil samples) is limited by the residual soil-water content and the saturated soil-water content.Neste trabalho, apresentamos uma classe de modelos não lineares truncados mistos onde a característica de truncamento dos dados é incorporada ao modelo estatístico assumindo-se que a variável de interesse, isto é, a variável truncada, possui uma função de distribuição truncada que, por sua vez, corresponde a uma função de distribuição condicional obtida ao se restringir o suporte de alguma função de distribuição de probabilidade. A família de modelos não lineares truncados mistos para locação e escala é construída sob a perspectiva de modelos não lineares generalizados mistos e considerando uma classe de distribuições indexadas por parâmetros de locação e escala. Assumimos que o parâmetro de locação da variável resposta é associado a uma função não linear contínua de um conjunto de covariáveis e parâmetros desconhecidos e a efeitos aleatórios não observáveis, e que o parâmetro de escala das respostas pode ser caracterizado por uma função contínua das covariáveis e de parâmetros desconhecidos. Os modelos não lineares truncados mistos para locação e escala, aqui apresentados, são construídos supondo limites de truncamento aleatórios, porém, modelos não lineares truncados mistos com limites fixos e conhecidos são prontamente obtidos como casos particulares desses modelos. Nos modelos construídos sob a suposição de limites de truncamentos aleatórios, a função de verossimilhança é escrita em função dos parâmetros da distribuição da variável resposta truncada e dos parâmetros das distribuições das variáveis de truncamento. Para o caso particular de limites fixos e conhecidos, a função de verossimilhança será apenas uma função dos parâmetros da distribuição truncada assumida para a variável resposta de interesse. As equações de verossimilhança dos modelos, aqui propostos, não possuem soluções analíticas e, sob a perspectiva frequentista de inferência estatística, os parâmetros do modelo são estimados pela maximização direta da função de log-verossimilhança via um procedimento iterativo. Consideramos, também, uma análise de diagnóstico para verificar a adequação do modelo, observações discrepantes e/ou influentes, usando resíduos padronizados e medidas de influência global e influência local. Sob a perspectiva Bayesiana de inferência estatística, as estimativas dos parâmetros dos modelos propostos são definidas como as médias a posteriori de amostras obtidas via um algoritmo do tipo cadeia de Markov Monte Carlo das distribuições a posteriori dos parâmetros. Para a análise de diagnóstico Bayesiano do modelo, consideramos métricas de avaliação preditiva a posteriori, resíduos Bayesianos padronizados e a calibração de casos para diagnóstico de influência. Como critérios Bayesianos de seleção de modelos, consideramos a soma de log -CPO e um critério de seleção de modelos baseada na abordagem Bayesiana de mistura de modelos. Para ilustrar a metodologia proposta, analisamos dados de retenção de água em solo, que são usados para construir curvas de retenção de água em solo e que estão sujeitos a truncamento pois as medições de umidade de água (a proporção de água presente em amostras de solos) são limitadas pela umidade residual e pela umidade saturada do solo amostrado.Financiadora de Estudos e Projetosapplication/pdfporUniversidade Federal de São CarlosPrograma de Pós-Graduação em Estatística - PPGEsUFSCarBREstatísticaModelos não lineares mistosMáxima verossimilhança iterativaAnálise de diagnósticoAnálise bayesianaDiagnóstico bayesianoDistribuições truncadasAlgoritmo ECMAnálise BayesianaTruncated distributionsNonlinear mixed-effects modelsMaximum likelihoodECM algorithmBayesian analysisMCMCBayesian diagnosticsCIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICAModelos não lineares truncados mistos para locação e escalainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesis-1-184611362-11c0-4efd-b118-a7df9999df87info:eu-repo/semantics/embargoedAccessreponame:Repositório Institucional da UFSCARinstname:Universidade Federal de São Carlos (UFSCAR)instacron:UFSCARORIGINAL6714.pdfapplication/pdf1130315https://repositorio.ufscar.br/bitstream/ufscar/4497/1/6714.pdf4ce881df9c6c0f6451cae6908855d277MD51TEXT6714.pdf.txt6714.pdf.txtExtracted texttext/plain0https://repositorio.ufscar.br/bitstream/ufscar/4497/2/6714.pdf.txtd41d8cd98f00b204e9800998ecf8427eMD52THUMBNAIL6714.pdf.jpg6714.pdf.jpgIM Thumbnailimage/jpeg5320https://repositorio.ufscar.br/bitstream/ufscar/4497/3/6714.pdf.jpg46818709f760c84d235847053cfae503MD53ufscar/44972023-09-18 18:31:34.548oai:repositorio.ufscar.br:ufscar/4497Repositório InstitucionalPUBhttps://repositorio.ufscar.br/oai/requestopendoar:43222023-09-18T18:31:34Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)false
dc.title.por.fl_str_mv Modelos não lineares truncados mistos para locação e escala
title Modelos não lineares truncados mistos para locação e escala
spellingShingle Modelos não lineares truncados mistos para locação e escala
Paraiba, Carolina Costa Mota
Estatística
Modelos não lineares mistos
Máxima verossimilhança iterativa
Análise de diagnóstico
Análise bayesiana
Diagnóstico bayesiano
Distribuições truncadas
Algoritmo ECM
Análise Bayesiana
Truncated distributions
Nonlinear mixed-effects models
Maximum likelihood
ECM algorithm
Bayesian analysis
MCMC
Bayesian diagnostics
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA
title_short Modelos não lineares truncados mistos para locação e escala
title_full Modelos não lineares truncados mistos para locação e escala
title_fullStr Modelos não lineares truncados mistos para locação e escala
title_full_unstemmed Modelos não lineares truncados mistos para locação e escala
title_sort Modelos não lineares truncados mistos para locação e escala
author Paraiba, Carolina Costa Mota
author_facet Paraiba, Carolina Costa Mota
author_role author
dc.contributor.authorlattes.por.fl_str_mv http://lattes.cnpq.br/0125762088465949
dc.contributor.author.fl_str_mv Paraiba, Carolina Costa Mota
dc.contributor.advisor1.fl_str_mv Diniz, Carlos Alberto Ribeiro
dc.contributor.advisor1Lattes.fl_str_mv http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4781846J4&dataRevisao=null
dc.contributor.authorID.fl_str_mv c38ba33e-3a49-4d6d-aecb-620d8330b54f
contributor_str_mv Diniz, Carlos Alberto Ribeiro
dc.subject.por.fl_str_mv Estatística
Modelos não lineares mistos
Máxima verossimilhança iterativa
Análise de diagnóstico
Análise bayesiana
Diagnóstico bayesiano
Distribuições truncadas
Algoritmo ECM
Análise Bayesiana
topic Estatística
Modelos não lineares mistos
Máxima verossimilhança iterativa
Análise de diagnóstico
Análise bayesiana
Diagnóstico bayesiano
Distribuições truncadas
Algoritmo ECM
Análise Bayesiana
Truncated distributions
Nonlinear mixed-effects models
Maximum likelihood
ECM algorithm
Bayesian analysis
MCMC
Bayesian diagnostics
CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA
dc.subject.eng.fl_str_mv Truncated distributions
Nonlinear mixed-effects models
Maximum likelihood
ECM algorithm
Bayesian analysis
MCMC
Bayesian diagnostics
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA
description We present a class of nonlinear truncated mixed-effects models where the truncation nature of the data is incorporated into the statistical model by assuming that the variable of interest, namely the truncated variable, follows a truncated distribution which, in turn, corresponds to a conditional distribution obtained by restricting the support of a given probability distribution function. The family of nonlinear truncated mixed-effects models for location and scale is constructed based on the perspective of nonlinear generalized mixed-effects models and by assuming that the distribution of response variable belongs to a truncated class of distributions indexed by a location and a scale parameter. The location parameter of the response variable is assumed to be associated with a continuous nonlinear function of covariates and unknown parameters and with unobserved random effects, and the scale parameter of the responses is assumed to be characterized by a continuous function of the covariates and unknown parameters. The proposed truncated nonlinear mixed-effects models are constructed assuming both random truncation limits; however, truncated nonlinear mixed-effects models with fixed known limits are readily obtained as particular cases of these models. For models constructed under the assumption of random truncation limits, the likelihood function of the observed data shall be a function both of the parameters of the truncated distribution of the truncated variable and of the parameters of the distribution of the truncation variables. For the particular case of fixed known truncation limits, the likelihood function of the observed data is a function only of the parameters of the truncated distribution assumed for the variable of interest. The likelihood equation resulting from the proposed truncated nonlinear regression models do not have analytical solutions and thus, under the frequentist inferential perspective, the model parameters are estimated by direct maximization of the log-likelihood using an iterative procedure. We also consider diagnostic analysis to check for model misspecification, outliers and influential observations using standardized residuals, and global and local influence metrics. Under the Bayesian perspective of statistical inference, parameter estimates are computed based on draws from the posterior distribution of parameters obtained using an Markov Chain Monte Carlo procedure. Posterior predictive checks, Bayesian standardized residuals and a Bayesian influence measures are considered to check for model adequacy, outliers and influential observations. As Bayesian model selection criteria, we consider the sum of log -CPO and a Bayesian model selection procedure using a Bayesian mixture model framework. To illustrate the proposed methodology, we analyze soil-water retention, which are used to construct soil-water characteristic curves and which are subject to truncation since soil-water content (the proportion of water in soil samples) is limited by the residual soil-water content and the saturated soil-water content.
publishDate 2015
dc.date.available.fl_str_mv 2015-05-05
2016-06-02T20:04:53Z
dc.date.issued.fl_str_mv 2015-01-14
dc.date.accessioned.fl_str_mv 2016-06-02T20:04:53Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufscar.br/handle/ufscar/4497
url https://repositorio.ufscar.br/handle/ufscar/4497
dc.language.iso.fl_str_mv por
language por
dc.relation.confidence.fl_str_mv -1
-1
dc.relation.authority.fl_str_mv 84611362-11c0-4efd-b118-a7df9999df87
dc.rights.driver.fl_str_mv info:eu-repo/semantics/embargoedAccess
eu_rights_str_mv embargoedAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de São Carlos
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Estatística - PPGEs
dc.publisher.initials.fl_str_mv UFSCar
dc.publisher.country.fl_str_mv BR
publisher.none.fl_str_mv Universidade Federal de São Carlos
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSCAR
instname:Universidade Federal de São Carlos (UFSCAR)
instacron:UFSCAR
instname_str Universidade Federal de São Carlos (UFSCAR)
instacron_str UFSCAR
institution UFSCAR
reponame_str Repositório Institucional da UFSCAR
collection Repositório Institucional da UFSCAR
bitstream.url.fl_str_mv https://repositorio.ufscar.br/bitstream/ufscar/4497/1/6714.pdf
https://repositorio.ufscar.br/bitstream/ufscar/4497/2/6714.pdf.txt
https://repositorio.ufscar.br/bitstream/ufscar/4497/3/6714.pdf.jpg
bitstream.checksum.fl_str_mv 4ce881df9c6c0f6451cae6908855d277
d41d8cd98f00b204e9800998ecf8427e
46818709f760c84d235847053cfae503
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSCAR - Universidade Federal de São Carlos (UFSCAR)
repository.mail.fl_str_mv
_version_ 1802136491541921792