Teoria da informação aplicada a modelos Arma: testes para identificação e quantificação de Overfitting

Detalhes bibliográficos
Ano de defesa: 2016
Autor(a) principal: ALMEIDA JÚNIOR, Pedro Monteiro de
Orientador(a): NASCIMENTO, Abraão David Costa do
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
Programa de Pós-Graduação: Programa de Pos Graduacao em Estatistica
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/17302
Resumo: Dados registrados sequencialmente sobre um determinado período são frequentes em várias aplicações; tais como, em reconhecimento padrão (ISHI et al., 1998) e em processamento de imagens de radar (DUTRA, 1989). Diferentemente de contextos suportados pela independência das observações, dados desta natureza impõem uma estrutura de correlação que deve ser considerada nos modelos. Apresentamos inicialmente um estudo de desempenho via simulação de Monte Carlo para três métodos de estimação na classe de modelos ARMA: Máxima Verossimilhança Condicional, Não Condicional e Mínimos Quadrados Não Condicional. Vários estudos têm sido feitos neste sentido (vê, por exemplo, YU, 2004). Entretanto, faltam estudos que trabalhem sobre uma discretização razoável da região de estabilidade e que avaliem a influência da estimação sobre densidades ajustadas dos processos ARMA. Para vários pontos paramétricos da região de estabilidade, os três métodos são comparados à luz de medidas da Teoria da Informação, a saber as divergências de Kullback-Leibler, Jensen-Shannon, Battacharyya e Hellinger. Adicionalmente, as medidas utilizadas para quantificação do desempenho dos métodos de estimação são entendidas como elementos na classe (h, ) de divergências proposta por Salicrú et al. (1994) e cinco novos testes de hipótese bilaterais (caso em que não há testes uniformemente mais poderosos) para identificação de modelos ARMA são propostos e comparados com o teste da razão entre verossimilhanças. Além disso, vários trabalhos têm avançado quanto à proposta de critérios para seleção de modelos na classe ARMA. McQuarrie e Tsai (1998) utilizaram a probabilidade de overfitting (isto é, escolher o modelo com ordem maior dado que o modelo verdadeiro tem ordem menor) como critério de comparação. A ideia de quantificar o erro da escolha entre modelos de probabilidade também foi estudada por Shannon (1948) que propôs os conceitos de informação, entropia e divergência. Nesta dissertação, propomos novos critérios para seleção de modelos em séries temporais baseados em medidas de distância. O desempenho dos novos critérios quantificados em termos da probabilidade de overfitting é comparado com outros métodos da literatura. Finalmente, as medidas derivadas são utilizadas como classificadores em imagens PolSAR.
id UFPE_8dbfea4ecdd029ffde9d8ed38c0c6e40
oai_identifier_str oai:repositorio.ufpe.br:123456789/17302
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str
spelling ALMEIDA JÚNIOR, Pedro Monteiro deNASCIMENTO, Abraão David Costa do2016-07-08T18:20:15Z2016-07-08T18:20:15Z2016-02-26https://repositorio.ufpe.br/handle/123456789/17302Dados registrados sequencialmente sobre um determinado período são frequentes em várias aplicações; tais como, em reconhecimento padrão (ISHI et al., 1998) e em processamento de imagens de radar (DUTRA, 1989). Diferentemente de contextos suportados pela independência das observações, dados desta natureza impõem uma estrutura de correlação que deve ser considerada nos modelos. Apresentamos inicialmente um estudo de desempenho via simulação de Monte Carlo para três métodos de estimação na classe de modelos ARMA: Máxima Verossimilhança Condicional, Não Condicional e Mínimos Quadrados Não Condicional. Vários estudos têm sido feitos neste sentido (vê, por exemplo, YU, 2004). Entretanto, faltam estudos que trabalhem sobre uma discretização razoável da região de estabilidade e que avaliem a influência da estimação sobre densidades ajustadas dos processos ARMA. Para vários pontos paramétricos da região de estabilidade, os três métodos são comparados à luz de medidas da Teoria da Informação, a saber as divergências de Kullback-Leibler, Jensen-Shannon, Battacharyya e Hellinger. Adicionalmente, as medidas utilizadas para quantificação do desempenho dos métodos de estimação são entendidas como elementos na classe (h, ) de divergências proposta por Salicrú et al. (1994) e cinco novos testes de hipótese bilaterais (caso em que não há testes uniformemente mais poderosos) para identificação de modelos ARMA são propostos e comparados com o teste da razão entre verossimilhanças. Além disso, vários trabalhos têm avançado quanto à proposta de critérios para seleção de modelos na classe ARMA. McQuarrie e Tsai (1998) utilizaram a probabilidade de overfitting (isto é, escolher o modelo com ordem maior dado que o modelo verdadeiro tem ordem menor) como critério de comparação. A ideia de quantificar o erro da escolha entre modelos de probabilidade também foi estudada por Shannon (1948) que propôs os conceitos de informação, entropia e divergência. Nesta dissertação, propomos novos critérios para seleção de modelos em séries temporais baseados em medidas de distância. O desempenho dos novos critérios quantificados em termos da probabilidade de overfitting é comparado com outros métodos da literatura. Finalmente, as medidas derivadas são utilizadas como classificadores em imagens PolSAR.CAPESData recorded sequentially on a given period are common on several applications; such as in pattern recognition (ISHI et al., 1998) and in radar image processing (DUTRA, 1989). Unlike contexts supported by independence assumption, data of this nature impose correlation patterns that should be considered in used models. In this dissertation, we first present a performance study of three estimation methods in the ARMA class: Conditional and Non-Conditional Maximum Likelihood and Least Squares. Several works have addressed the quantification of the performance on ARMA estimation methods. However, they neither present studies on several points of stability regions nor consider the effect of estimation procedures on ARMA process densities. These methods are compared by means of the Information Theory measures, say Kullback-Leibler, Jensen-Shannon, Battacharyya and Hellinger divergences. Further, the measures used to quantify the performance of the estimation methods are understood within the class (h, )–divergences proposed by Salicrú et al. (1994) and five new bilateral hypothesis tests (case on which there are not uniformly most powerful tests) for ARMA identification are proposed and compared with the likelihood ratio test. McQuarrie e Tsai (1998) considered the overfitting (to study and the performance of those methods) probability as a comparison criterion. The idea of quantifying the error of the model choose was introduced by Shannon (1948) who proposed the concepts of information, entropy and divergence. In this dissertation, we propose new selection criteria for time series models. The proposals are formulated taken into account distance measures between probability distributions. The performance of new criteria are quantified in terms of the overfitting probability and compared to those due to literature methods. Finally, the derived measures are employed as classifiers on PolSAR images.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em EstatisticaUFPEBrasilAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessEstatística aplicadaTeoria da informação - DivergênciaProcessamento de imagensTeoria da informação aplicada a modelos Arma: testes para identificação e quantificação de Overfittinginfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesismestradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPETHUMBNAILDissertacao_Versao_Digital.pdf.jpgDissertacao_Versao_Digital.pdf.jpgGenerated Thumbnailimage/jpeg1409https://repositorio.ufpe.br/bitstream/123456789/17302/5/Dissertacao_Versao_Digital.pdf.jpge1084813d604c5581e1e2af56cf5250fMD55ORIGINALDissertacao_Versao_Digital.pdfDissertacao_Versao_Digital.pdfapplication/pdf3769752https://repositorio.ufpe.br/bitstream/123456789/17302/1/Dissertacao_Versao_Digital.pdf03891a74bed6d1446c1f5738946e6cefMD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-81232https://repositorio.ufpe.br/bitstream/123456789/17302/2/license_rdf66e71c371cc565284e70f40736c94386MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82311https://repositorio.ufpe.br/bitstream/123456789/17302/3/license.txt4b8a02c7f2818eaf00dcf2260dd5eb08MD53TEXTDissertacao_Versao_Digital.pdf.txtDissertacao_Versao_Digital.pdf.txtExtracted texttext/plain450428https://repositorio.ufpe.br/bitstream/123456789/17302/4/Dissertacao_Versao_Digital.pdf.txt7caaeff4067e4a2fa6b304562864859bMD54123456789/173022019-10-25 06:10:43.463oai:repositorio.ufpe.br:123456789/17302TGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKClRvZG8gZGVwb3NpdGFudGUgZGUgbWF0ZXJpYWwgbm8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgKFJJKSBkZXZlIGNvbmNlZGVyLCDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIChVRlBFKSwgdW1hIExpY2Vuw6dhIGRlIERpc3RyaWJ1acOnw6NvIE7Do28gRXhjbHVzaXZhIHBhcmEgbWFudGVyIGUgdG9ybmFyIGFjZXNzw612ZWlzIG9zIHNldXMgZG9jdW1lbnRvcywgZW0gZm9ybWF0byBkaWdpdGFsLCBuZXN0ZSByZXBvc2l0w7NyaW8uCgpDb20gYSBjb25jZXNzw6NvIGRlc3RhIGxpY2Vuw6dhIG7Do28gZXhjbHVzaXZhLCBvIGRlcG9zaXRhbnRlIG1hbnTDqW0gdG9kb3Mgb3MgZGlyZWl0b3MgZGUgYXV0b3IuCl9fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fXwoKTGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKCkFvIGNvbmNvcmRhciBjb20gZXN0YSBsaWNlbsOnYSBlIGFjZWl0w6EtbGEsIHZvY8OqIChhdXRvciBvdSBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMpOgoKYSkgRGVjbGFyYSBxdWUgY29uaGVjZSBhIHBvbMOtdGljYSBkZSBjb3B5cmlnaHQgZGEgZWRpdG9yYSBkbyBzZXUgZG9jdW1lbnRvOwpiKSBEZWNsYXJhIHF1ZSBjb25oZWNlIGUgYWNlaXRhIGFzIERpcmV0cml6ZXMgcGFyYSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGUEU7CmMpIENvbmNlZGUgw6AgVUZQRSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZGUgYXJxdWl2YXIsIHJlcHJvZHV6aXIsIGNvbnZlcnRlciAoY29tbyBkZWZpbmlkbyBhIHNlZ3VpciksIGNvbXVuaWNhciBlL291IGRpc3RyaWJ1aXIsIG5vIFJJLCBvIGRvY3VtZW50byBlbnRyZWd1ZSAoaW5jbHVpbmRvIG8gcmVzdW1vL2Fic3RyYWN0KSBlbSBmb3JtYXRvIGRpZ2l0YWwgb3UgcG9yIG91dHJvIG1laW87CmQpIERlY2xhcmEgcXVlIGF1dG9yaXphIGEgVUZQRSBhIGFycXVpdmFyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXN0ZSBkb2N1bWVudG8gZSBjb252ZXJ0w6otbG8sIHNlbSBhbHRlcmFyIG8gc2V1IGNvbnRlw7pkbywgcGFyYSBxdWFscXVlciBmb3JtYXRvIGRlIGZpY2hlaXJvLCBtZWlvIG91IHN1cG9ydGUsIHBhcmEgZWZlaXRvcyBkZSBzZWd1cmFuw6dhLCBwcmVzZXJ2YcOnw6NvIChiYWNrdXApIGUgYWNlc3NvOwplKSBEZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBzdWJtZXRpZG8gw6kgbyBzZXUgdHJhYmFsaG8gb3JpZ2luYWwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBhIHRlcmNlaXJvcyBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2Ugb3MgZGlyZWl0b3MgZGUgb3V0cmEgcGVzc29hIG91IGVudGlkYWRlOwpmKSBEZWNsYXJhIHF1ZSwgbm8gY2FzbyBkbyBkb2N1bWVudG8gc3VibWV0aWRvIGNvbnRlciBtYXRlcmlhbCBkbyBxdWFsIG7Do28gZGV0w6ltIG9zIGRpcmVpdG9zIGRlCmF1dG9yLCBvYnRldmUgYSBhdXRvcml6YcOnw6NvIGlycmVzdHJpdGEgZG8gcmVzcGVjdGl2byBkZXRlbnRvciBkZXNzZXMgZGlyZWl0b3MgcGFyYSBjZWRlciDDoApVRlBFIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgTGljZW7Dp2EgZSBhdXRvcml6YXIgYSB1bml2ZXJzaWRhZGUgYSB1dGlsaXrDoS1sb3MgbGVnYWxtZW50ZS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBlc3NlIG1hdGVyaWFsIGN1am9zIGRpcmVpdG9zIHPDo28gZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvIGRvIGRvY3VtZW50byBlbnRyZWd1ZTsKZykgU2UgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgYmFzZWFkbyBlbSB0cmFiYWxobyBmaW5hbmNpYWRvIG91IGFwb2lhZG8gcG9yIG91dHJhIGluc3RpdHVpw6fDo28gcXVlIG7Do28gYSBVRlBFLMKgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIgb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gcmVzcGVjdGl2byBjb250cmF0byBvdSBhY29yZG8uCgpBIFVGUEUgaWRlbnRpZmljYXLDoSBjbGFyYW1lbnRlIG8ocykgbm9tZShzKSBkbyhzKSBhdXRvciAoZXMpIGRvcyBkaXJlaXRvcyBkbyBkb2N1bWVudG8gZW50cmVndWUgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBwYXJhIGFsw6ltIGRvIHByZXZpc3RvIG5hIGFsw61uZWEgYykuCg==Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212019-10-25T09:10:43Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.pt_BR.fl_str_mv Teoria da informação aplicada a modelos Arma: testes para identificação e quantificação de Overfitting
title Teoria da informação aplicada a modelos Arma: testes para identificação e quantificação de Overfitting
spellingShingle Teoria da informação aplicada a modelos Arma: testes para identificação e quantificação de Overfitting
ALMEIDA JÚNIOR, Pedro Monteiro de
Estatística aplicada
Teoria da informação - Divergência
Processamento de imagens
title_short Teoria da informação aplicada a modelos Arma: testes para identificação e quantificação de Overfitting
title_full Teoria da informação aplicada a modelos Arma: testes para identificação e quantificação de Overfitting
title_fullStr Teoria da informação aplicada a modelos Arma: testes para identificação e quantificação de Overfitting
title_full_unstemmed Teoria da informação aplicada a modelos Arma: testes para identificação e quantificação de Overfitting
title_sort Teoria da informação aplicada a modelos Arma: testes para identificação e quantificação de Overfitting
author ALMEIDA JÚNIOR, Pedro Monteiro de
author_facet ALMEIDA JÚNIOR, Pedro Monteiro de
author_role author
dc.contributor.author.fl_str_mv ALMEIDA JÚNIOR, Pedro Monteiro de
dc.contributor.advisor1.fl_str_mv NASCIMENTO, Abraão David Costa do
contributor_str_mv NASCIMENTO, Abraão David Costa do
dc.subject.por.fl_str_mv Estatística aplicada
Teoria da informação - Divergência
Processamento de imagens
topic Estatística aplicada
Teoria da informação - Divergência
Processamento de imagens
description Dados registrados sequencialmente sobre um determinado período são frequentes em várias aplicações; tais como, em reconhecimento padrão (ISHI et al., 1998) e em processamento de imagens de radar (DUTRA, 1989). Diferentemente de contextos suportados pela independência das observações, dados desta natureza impõem uma estrutura de correlação que deve ser considerada nos modelos. Apresentamos inicialmente um estudo de desempenho via simulação de Monte Carlo para três métodos de estimação na classe de modelos ARMA: Máxima Verossimilhança Condicional, Não Condicional e Mínimos Quadrados Não Condicional. Vários estudos têm sido feitos neste sentido (vê, por exemplo, YU, 2004). Entretanto, faltam estudos que trabalhem sobre uma discretização razoável da região de estabilidade e que avaliem a influência da estimação sobre densidades ajustadas dos processos ARMA. Para vários pontos paramétricos da região de estabilidade, os três métodos são comparados à luz de medidas da Teoria da Informação, a saber as divergências de Kullback-Leibler, Jensen-Shannon, Battacharyya e Hellinger. Adicionalmente, as medidas utilizadas para quantificação do desempenho dos métodos de estimação são entendidas como elementos na classe (h, ) de divergências proposta por Salicrú et al. (1994) e cinco novos testes de hipótese bilaterais (caso em que não há testes uniformemente mais poderosos) para identificação de modelos ARMA são propostos e comparados com o teste da razão entre verossimilhanças. Além disso, vários trabalhos têm avançado quanto à proposta de critérios para seleção de modelos na classe ARMA. McQuarrie e Tsai (1998) utilizaram a probabilidade de overfitting (isto é, escolher o modelo com ordem maior dado que o modelo verdadeiro tem ordem menor) como critério de comparação. A ideia de quantificar o erro da escolha entre modelos de probabilidade também foi estudada por Shannon (1948) que propôs os conceitos de informação, entropia e divergência. Nesta dissertação, propomos novos critérios para seleção de modelos em séries temporais baseados em medidas de distância. O desempenho dos novos critérios quantificados em termos da probabilidade de overfitting é comparado com outros métodos da literatura. Finalmente, as medidas derivadas são utilizadas como classificadores em imagens PolSAR.
publishDate 2016
dc.date.accessioned.fl_str_mv 2016-07-08T18:20:15Z
dc.date.available.fl_str_mv 2016-07-08T18:20:15Z
dc.date.issued.fl_str_mv 2016-02-26
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufpe.br/handle/123456789/17302
url https://repositorio.ufpe.br/handle/123456789/17302
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.publisher.program.fl_str_mv Programa de Pos Graduacao em Estatistica
dc.publisher.initials.fl_str_mv UFPE
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
bitstream.url.fl_str_mv https://repositorio.ufpe.br/bitstream/123456789/17302/5/Dissertacao_Versao_Digital.pdf.jpg
https://repositorio.ufpe.br/bitstream/123456789/17302/1/Dissertacao_Versao_Digital.pdf
https://repositorio.ufpe.br/bitstream/123456789/17302/2/license_rdf
https://repositorio.ufpe.br/bitstream/123456789/17302/3/license.txt
https://repositorio.ufpe.br/bitstream/123456789/17302/4/Dissertacao_Versao_Digital.pdf.txt
bitstream.checksum.fl_str_mv e1084813d604c5581e1e2af56cf5250f
03891a74bed6d1446c1f5738946e6cef
66e71c371cc565284e70f40736c94386
4b8a02c7f2818eaf00dcf2260dd5eb08
7caaeff4067e4a2fa6b304562864859b
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1802311160176836608