Análise de dados categorizados: modelos log-lineares e independência em tabelas de contingência

Detalhes bibliográficos
Ano de defesa: 1984
Autor(a) principal: Ogliari, Paulo José
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://teses.usp.br/teses/disponiveis/11/11134/tde-20231122-100648/
Resumo: O objetivo deste trabalho é o de fazer-se um estudo exploratório sobre os problemas causados pela aproximação assintótica dos testes utilizados em tabelas de contingência, objetivando determinar as condições práticas pelas quais se obtenham testes de hipóteses e estimativas confiáveis dos parâmetros do modelo multinomial. Para esse estudo foram analisadas tabelas de contingência do tipo CxDxF obtidas por meio de simulação de dados de populações com tamanhos variados. São também objetivos deste trabalho a elaboração de um programa de análise em linguagem BASIC para o ajustamento de modelos log-lineares aos dados de tabelas de contingência do tipo CxDxF e a determinação de estruturas de independência para os dados dessas tabelas. A metodologia utilizada é a de GRIZZLE, STARMER e KOCH (1969) que descrevem como modelos lineares e quadrados mínimos ponderados podem ser utilizados na análise de dados dispostos em uma tabela de contingencia. Pelos resultados obtidos observa-se que com tamanhos de amostras pequenos (N = 200, N = 250 e N = 300), os testes estatísticos mostram-se rigorosos em não rejeitar a estrutura de independência estabelecida para as tabelas de contingência; porém, os modelos ajustados aos dados nem sempre correspondem exatamente aos que se estão testando. Para tamanhos de amostras maiores (N = 1000 e N = 1500), os testes estatísticos comportam-se de modo excelente e os modelos que explicam as relações entre as diversas variáveis em estudo ficam bem ajustados. Conclui-se também que o procedimento de BERKS0N (1955) para tabelas com frequências nulas produz bons resultados, assim como, de um modo geral, o método GSK. Ao contrário das considerações feitas por GOODMAN (1971b) o método GSK mostra-se de um modo geral de fácil aplicação.
id USP_81ffacc1e8a6e015dd49b3ea46442eac
oai_identifier_str oai:teses.usp.br:tde-20231122-100648
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Análise de dados categorizados: modelos log-lineares e independência em tabelas de contingênciaCategorical data analysis: log linear models and independence in contingency tablesANÁLISE DE DADOS CATEGORIZADOSO objetivo deste trabalho é o de fazer-se um estudo exploratório sobre os problemas causados pela aproximação assintótica dos testes utilizados em tabelas de contingência, objetivando determinar as condições práticas pelas quais se obtenham testes de hipóteses e estimativas confiáveis dos parâmetros do modelo multinomial. Para esse estudo foram analisadas tabelas de contingência do tipo CxDxF obtidas por meio de simulação de dados de populações com tamanhos variados. São também objetivos deste trabalho a elaboração de um programa de análise em linguagem BASIC para o ajustamento de modelos log-lineares aos dados de tabelas de contingência do tipo CxDxF e a determinação de estruturas de independência para os dados dessas tabelas. A metodologia utilizada é a de GRIZZLE, STARMER e KOCH (1969) que descrevem como modelos lineares e quadrados mínimos ponderados podem ser utilizados na análise de dados dispostos em uma tabela de contingencia. Pelos resultados obtidos observa-se que com tamanhos de amostras pequenos (N = 200, N = 250 e N = 300), os testes estatísticos mostram-se rigorosos em não rejeitar a estrutura de independência estabelecida para as tabelas de contingência; porém, os modelos ajustados aos dados nem sempre correspondem exatamente aos que se estão testando. Para tamanhos de amostras maiores (N = 1000 e N = 1500), os testes estatísticos comportam-se de modo excelente e os modelos que explicam as relações entre as diversas variáveis em estudo ficam bem ajustados. Conclui-se também que o procedimento de BERKS0N (1955) para tabelas com frequências nulas produz bons resultados, assim como, de um modo geral, o método GSK. Ao contrário das considerações feitas por GOODMAN (1971b) o método GSK mostra-se de um modo geral de fácil aplicação.The first objective of this work is to explore the problems caused by the asymptotic approximation of χ2 tests commonly used in contingency tables and to obtain practical rules under which good properties of the tests can be reached and confidence on the parameters estimation of the multinomial model. For this purpose CxDxF tables are simulated on a computer for several types of probability structures with several sample sizes. A BASIC program is presented for adjusting log-linear models and variance analysis and contingency tables are presented to determine the dependence structure. The statistical method used is the one developed by GRIZZLE, STARMER and KOCH (1969) based on linear models and weighted least square that can be used to analyses contingency tables. The results showed that for samples as large as 200, 250 and 300, the statistical tests based on the GSK method are good to detect alternatives more complex than Hο. For sample sizes of 1000 and 1500 the GSK method detects exactly the probability structure. Berkson’s method for incomplete contingency tables showed good behavior in all cases studied. In opposition to GOODMAN (1971b) opinion, the GSK method generally is easy to perform.Biblioteca Digitais de Teses e Dissertações da USPGodoi, Cássio Roberto de MeloOgliari, Paulo José1984-07-30info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://teses.usp.br/teses/disponiveis/11/11134/tde-20231122-100648/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2023-11-24T21:03:03Zoai:teses.usp.br:tde-20231122-100648Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-11-24T21:03:03Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Análise de dados categorizados: modelos log-lineares e independência em tabelas de contingência
Categorical data analysis: log linear models and independence in contingency tables
title Análise de dados categorizados: modelos log-lineares e independência em tabelas de contingência
spellingShingle Análise de dados categorizados: modelos log-lineares e independência em tabelas de contingência
Ogliari, Paulo José
ANÁLISE DE DADOS CATEGORIZADOS
title_short Análise de dados categorizados: modelos log-lineares e independência em tabelas de contingência
title_full Análise de dados categorizados: modelos log-lineares e independência em tabelas de contingência
title_fullStr Análise de dados categorizados: modelos log-lineares e independência em tabelas de contingência
title_full_unstemmed Análise de dados categorizados: modelos log-lineares e independência em tabelas de contingência
title_sort Análise de dados categorizados: modelos log-lineares e independência em tabelas de contingência
author Ogliari, Paulo José
author_facet Ogliari, Paulo José
author_role author
dc.contributor.none.fl_str_mv Godoi, Cássio Roberto de Melo
dc.contributor.author.fl_str_mv Ogliari, Paulo José
dc.subject.por.fl_str_mv ANÁLISE DE DADOS CATEGORIZADOS
topic ANÁLISE DE DADOS CATEGORIZADOS
description O objetivo deste trabalho é o de fazer-se um estudo exploratório sobre os problemas causados pela aproximação assintótica dos testes utilizados em tabelas de contingência, objetivando determinar as condições práticas pelas quais se obtenham testes de hipóteses e estimativas confiáveis dos parâmetros do modelo multinomial. Para esse estudo foram analisadas tabelas de contingência do tipo CxDxF obtidas por meio de simulação de dados de populações com tamanhos variados. São também objetivos deste trabalho a elaboração de um programa de análise em linguagem BASIC para o ajustamento de modelos log-lineares aos dados de tabelas de contingência do tipo CxDxF e a determinação de estruturas de independência para os dados dessas tabelas. A metodologia utilizada é a de GRIZZLE, STARMER e KOCH (1969) que descrevem como modelos lineares e quadrados mínimos ponderados podem ser utilizados na análise de dados dispostos em uma tabela de contingencia. Pelos resultados obtidos observa-se que com tamanhos de amostras pequenos (N = 200, N = 250 e N = 300), os testes estatísticos mostram-se rigorosos em não rejeitar a estrutura de independência estabelecida para as tabelas de contingência; porém, os modelos ajustados aos dados nem sempre correspondem exatamente aos que se estão testando. Para tamanhos de amostras maiores (N = 1000 e N = 1500), os testes estatísticos comportam-se de modo excelente e os modelos que explicam as relações entre as diversas variáveis em estudo ficam bem ajustados. Conclui-se também que o procedimento de BERKS0N (1955) para tabelas com frequências nulas produz bons resultados, assim como, de um modo geral, o método GSK. Ao contrário das considerações feitas por GOODMAN (1971b) o método GSK mostra-se de um modo geral de fácil aplicação.
publishDate 1984
dc.date.none.fl_str_mv 1984-07-30
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://teses.usp.br/teses/disponiveis/11/11134/tde-20231122-100648/
url https://teses.usp.br/teses/disponiveis/11/11134/tde-20231122-100648/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1815258306144370688