Análise de dados categorizados: modelos log-lineares e independência em tabelas de contingência

Ogliari, Paulo José

Análise de dados categorizados: modelos log-lineares e independência em tabelas de contingência

Detalhes bibliográficos
Ano de defesa:	1984
Autor(a) principal:	Ogliari, Paulo José
Orientador(a):	Não Informado pela instituição
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Dissertação
Tipo de acesso:	Acesso aberto
Idioma:	por
Instituição de defesa:	Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação:	Não Informado pela instituição
Departamento:	Não Informado pela instituição
País:	Não Informado pela instituição
Palavras-chave em Português:	ANÁLISE DE DADOS CATEGORIZADOS
Link de acesso:	https://teses.usp.br/teses/disponiveis/11/11134/tde-20231122-100648/
Resumo:	O objetivo deste trabalho é o de fazer-se um estudo exploratório sobre os problemas causados pela aproximação assintótica dos testes utilizados em tabelas de contingência, objetivando determinar as condições práticas pelas quais se obtenham testes de hipóteses e estimativas confiáveis dos parâmetros do modelo multinomial. Para esse estudo foram analisadas tabelas de contingência do tipo CxDxF obtidas por meio de simulação de dados de populações com tamanhos variados. São também objetivos deste trabalho a elaboração de um programa de análise em linguagem BASIC para o ajustamento de modelos log-lineares aos dados de tabelas de contingência do tipo CxDxF e a determinação de estruturas de independência para os dados dessas tabelas. A metodologia utilizada é a de GRIZZLE, STARMER e KOCH (1969) que descrevem como modelos lineares e quadrados mínimos ponderados podem ser utilizados na análise de dados dispostos em uma tabela de contingencia. Pelos resultados obtidos observa-se que com tamanhos de amostras pequenos (N = 200, N = 250 e N = 300), os testes estatísticos mostram-se rigorosos em não rejeitar a estrutura de independência estabelecida para as tabelas de contingência; porém, os modelos ajustados aos dados nem sempre correspondem exatamente aos que se estão testando. Para tamanhos de amostras maiores (N = 1000 e N = 1500), os testes estatísticos comportam-se de modo excelente e os modelos que explicam as relações entre as diversas variáveis em estudo ficam bem ajustados. Conclui-se também que o procedimento de BERKS0N (1955) para tabelas com frequências nulas produz bons resultados, assim como, de um modo geral, o método GSK. Ao contrário das considerações feitas por GOODMAN (1971b) o método GSK mostra-se de um modo geral de fácil aplicação.

Metadados do item

id	USP_81ffacc1e8a6e015dd49b3ea46442eac
oai_identifier_str	oai:teses.usp.br:tde-20231122-100648
network_acronym_str	USP
network_name_str	Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling	Análise de dados categorizados: modelos log-lineares e independência em tabelas de contingênciaCategorical data analysis: log linear models and independence in contingency tablesANÁLISE DE DADOS CATEGORIZADOSO objetivo deste trabalho é o de fazer-se um estudo exploratório sobre os problemas causados pela aproximação assintótica dos testes utilizados em tabelas de contingência, objetivando determinar as condições práticas pelas quais se obtenham testes de hipóteses e estimativas confiáveis dos parâmetros do modelo multinomial. Para esse estudo foram analisadas tabelas de contingência do tipo CxDxF obtidas por meio de simulação de dados de populações com tamanhos variados. São também objetivos deste trabalho a elaboração de um programa de análise em linguagem BASIC para o ajustamento de modelos log-lineares aos dados de tabelas de contingência do tipo CxDxF e a determinação de estruturas de independência para os dados dessas tabelas. A metodologia utilizada é a de GRIZZLE, STARMER e KOCH (1969) que descrevem como modelos lineares e quadrados mínimos ponderados podem ser utilizados na análise de dados dispostos em uma tabela de contingencia. Pelos resultados obtidos observa-se que com tamanhos de amostras pequenos (N = 200, N = 250 e N = 300), os testes estatísticos mostram-se rigorosos em não rejeitar a estrutura de independência estabelecida para as tabelas de contingência; porém, os modelos ajustados aos dados nem sempre correspondem exatamente aos que se estão testando. Para tamanhos de amostras maiores (N = 1000 e N = 1500), os testes estatísticos comportam-se de modo excelente e os modelos que explicam as relações entre as diversas variáveis em estudo ficam bem ajustados. Conclui-se também que o procedimento de BERKS0N (1955) para tabelas com frequências nulas produz bons resultados, assim como, de um modo geral, o método GSK. Ao contrário das considerações feitas por GOODMAN (1971b) o método GSK mostra-se de um modo geral de fácil aplicação.The first objective of this work is to explore the problems caused by the asymptotic approximation of χ2 tests commonly used in contingency tables and to obtain practical rules under which good properties of the tests can be reached and confidence on the parameters estimation of the multinomial model. For this purpose CxDxF tables are simulated on a computer for several types of probability structures with several sample sizes. A BASIC program is presented for adjusting log-linear models and variance analysis and contingency tables are presented to determine the dependence structure. The statistical method used is the one developed by GRIZZLE, STARMER and KOCH (1969) based on linear models and weighted least square that can be used to analyses contingency tables. The results showed that for samples as large as 200, 250 and 300, the statistical tests based on the GSK method are good to detect alternatives more complex than Hο. For sample sizes of 1000 and 1500 the GSK method detects exactly the probability structure. Berksons method for incomplete contingency tables showed good behavior in all cases studied. In opposition to GOODMAN (1971b) opinion, the GSK method generally is easy to perform.Biblioteca Digitais de Teses e Dissertações da USPGodoi, Cássio Roberto de MeloOgliari, Paulo José1984-07-30info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://teses.usp.br/teses/disponiveis/11/11134/tde-20231122-100648/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2023-11-24T21:03:03Zoai:teses.usp.br:tde-20231122-100648Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.bropendoar:27212023-11-24T21:03:03Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv	Análise de dados categorizados: modelos log-lineares e independência em tabelas de contingência Categorical data analysis: log linear models and independence in contingency tables
title	Análise de dados categorizados: modelos log-lineares e independência em tabelas de contingência
spellingShingle	Análise de dados categorizados: modelos log-lineares e independência em tabelas de contingência Ogliari, Paulo José ANÁLISE DE DADOS CATEGORIZADOS
title_short	Análise de dados categorizados: modelos log-lineares e independência em tabelas de contingência
title_full	Análise de dados categorizados: modelos log-lineares e independência em tabelas de contingência
title_fullStr	Análise de dados categorizados: modelos log-lineares e independência em tabelas de contingência
title_full_unstemmed	Análise de dados categorizados: modelos log-lineares e independência em tabelas de contingência
title_sort	Análise de dados categorizados: modelos log-lineares e independência em tabelas de contingência
author	Ogliari, Paulo José
author_facet	Ogliari, Paulo José
author_role	author
dc.contributor.none.fl_str_mv	Godoi, Cássio Roberto de Melo
dc.contributor.author.fl_str_mv	Ogliari, Paulo José
dc.subject.por.fl_str_mv	ANÁLISE DE DADOS CATEGORIZADOS
topic	ANÁLISE DE DADOS CATEGORIZADOS
description	O objetivo deste trabalho é o de fazer-se um estudo exploratório sobre os problemas causados pela aproximação assintótica dos testes utilizados em tabelas de contingência, objetivando determinar as condições práticas pelas quais se obtenham testes de hipóteses e estimativas confiáveis dos parâmetros do modelo multinomial. Para esse estudo foram analisadas tabelas de contingência do tipo CxDxF obtidas por meio de simulação de dados de populações com tamanhos variados. São também objetivos deste trabalho a elaboração de um programa de análise em linguagem BASIC para o ajustamento de modelos log-lineares aos dados de tabelas de contingência do tipo CxDxF e a determinação de estruturas de independência para os dados dessas tabelas. A metodologia utilizada é a de GRIZZLE, STARMER e KOCH (1969) que descrevem como modelos lineares e quadrados mínimos ponderados podem ser utilizados na análise de dados dispostos em uma tabela de contingencia. Pelos resultados obtidos observa-se que com tamanhos de amostras pequenos (N = 200, N = 250 e N = 300), os testes estatísticos mostram-se rigorosos em não rejeitar a estrutura de independência estabelecida para as tabelas de contingência; porém, os modelos ajustados aos dados nem sempre correspondem exatamente aos que se estão testando. Para tamanhos de amostras maiores (N = 1000 e N = 1500), os testes estatísticos comportam-se de modo excelente e os modelos que explicam as relações entre as diversas variáveis em estudo ficam bem ajustados. Conclui-se também que o procedimento de BERKS0N (1955) para tabelas com frequências nulas produz bons resultados, assim como, de um modo geral, o método GSK. Ao contrário das considerações feitas por GOODMAN (1971b) o método GSK mostra-se de um modo geral de fácil aplicação.
publishDate	1984
dc.date.none.fl_str_mv	1984-07-30
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	https://teses.usp.br/teses/disponiveis/11/11134/tde-20231122-100648/
url	https://teses.usp.br/teses/disponiveis/11/11134/tde-20231122-100648/
dc.language.iso.fl_str_mv	por
language	por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv	Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess
rights_invalid_str_mv	Liberar o conteúdo para acesso público.
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP
instname_str	Universidade de São Paulo (USP)
instacron_str	USP
institution	USP
reponame_str	Biblioteca Digital de Teses e Dissertações da USP
collection	Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv	virginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.br
_version_	1815258306144370688

Análise de dados categorizados: modelos log-lineares e independência em tabelas de contingência

Registros relacionados