Verificação da eficiência do método de amostragem Haphazard na otimização de custos em pesquisas

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: Miguel, Miguel Gabriel Ribeiro
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
MLG
Link de acesso: https://www.teses.usp.br/teses/disponiveis/45/45133/tde-15092025-105729/
Resumo: Pesquisas exploratórias com entrevistas face a face baseadas em amostragem aleatória ou estratificada geralmente exigem grandes tamanhos de amostra e, portanto, altos custos de infraestrutura e pessoal de campo. Mesmo assim, esses experimentos não garantem o controle de covariáveis específicas e podem gerar inferências pouco precisas sobre os parâmetros populacionais. (Lauretto et al., 2017), (Lauretto et al., 2019) propôs o Método de Amostragem Semi-Intencional denominado de Haphazard, isto é um procedimento de alocação que combina técnicas de otimização com perturbações aleatórias. O peso da perturbação aleatória pode ser calibrado de tal forma que, por um lado, seja pequeno o suficiente para fornecer boas amostras representativas e, por outro lado, seja grande o suficiente para quebrar efeitos de confusão e evitar escolhas enviesadas. Em trabalhos anteriores, o Método Haphazard foi comparado ao método de Re-randomização proposto por (Morgan & Rubin, 2012) em problemas de alocação de benchmark, em que foi mostrado que o Método Haphazard fornece aos grupos de alocação um melhor equilíbrio e inferências consistentemente mais poderosas. Neste trabalho, serão discutidas as vantagens do Método Haphazard no contexto de amostragem a partir do Censo do IBGE, em que o objetivo é fornecer estimativas consistentemente mais próximas dos valores dos parâmetros e com maior precisão. Serão apresentados dois estudos de caso, sendo um para estimar a prevalência de SARS-CoV-2 em algumas cidades do Brasil e outro focado em avaliar a eficácia das vacinas na cidade de Serrana - SP. Em comparação com a Re-randomização e a alocação puramente aleatória, as amostras geradas pelo método Haphazard fornecem estimativas com erro quadrático médio menores para um determinado tamanho de amostra. O erro quadrático médio e o desvio padrão das estimativas para o parâmetro de interesse serão os indicadores utilizados para comparar os métodos de amostragem. O uso da Haphazard apresentou um grande potencial para contribuir nos esforços para medir e controlar a disseminação da pandemia COVID-19 no Brasil, já que sua performance em amostras pequenas se mostrou consideravelmente superior aos demais métodos. Os resultados dessa tese foram aceitos e publicados no 40º Workshop Internacional sobre Inferência Bayesiana e Métodos de Máxima Entropia em Ciência e Engenharia (MaxEnt 2020/2021) (Miguel et al., 2021) e na revista científica internacional Entropy (Miguel et al., 2022).
id USP_9ec12b87bde788bc9c75bb8151381535
oai_identifier_str oai:teses.usp.br:tde-15092025-105729
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Verificação da eficiência do método de amostragem Haphazard na otimização de custos em pesquisasVerification of the efficiency of the Haphazard sampling method in optimizing research costsAmostragem intencionalCOVID19Epicovid19HaphazardHaphazardIntentional samplingMLGOptimal sampling designPure randomizationRerandomizationPesquisas exploratórias com entrevistas face a face baseadas em amostragem aleatória ou estratificada geralmente exigem grandes tamanhos de amostra e, portanto, altos custos de infraestrutura e pessoal de campo. Mesmo assim, esses experimentos não garantem o controle de covariáveis específicas e podem gerar inferências pouco precisas sobre os parâmetros populacionais. (Lauretto et al., 2017), (Lauretto et al., 2019) propôs o Método de Amostragem Semi-Intencional denominado de Haphazard, isto é um procedimento de alocação que combina técnicas de otimização com perturbações aleatórias. O peso da perturbação aleatória pode ser calibrado de tal forma que, por um lado, seja pequeno o suficiente para fornecer boas amostras representativas e, por outro lado, seja grande o suficiente para quebrar efeitos de confusão e evitar escolhas enviesadas. Em trabalhos anteriores, o Método Haphazard foi comparado ao método de Re-randomização proposto por (Morgan & Rubin, 2012) em problemas de alocação de benchmark, em que foi mostrado que o Método Haphazard fornece aos grupos de alocação um melhor equilíbrio e inferências consistentemente mais poderosas. Neste trabalho, serão discutidas as vantagens do Método Haphazard no contexto de amostragem a partir do Censo do IBGE, em que o objetivo é fornecer estimativas consistentemente mais próximas dos valores dos parâmetros e com maior precisão. Serão apresentados dois estudos de caso, sendo um para estimar a prevalência de SARS-CoV-2 em algumas cidades do Brasil e outro focado em avaliar a eficácia das vacinas na cidade de Serrana - SP. Em comparação com a Re-randomização e a alocação puramente aleatória, as amostras geradas pelo método Haphazard fornecem estimativas com erro quadrático médio menores para um determinado tamanho de amostra. O erro quadrático médio e o desvio padrão das estimativas para o parâmetro de interesse serão os indicadores utilizados para comparar os métodos de amostragem. O uso da Haphazard apresentou um grande potencial para contribuir nos esforços para medir e controlar a disseminação da pandemia COVID-19 no Brasil, já que sua performance em amostras pequenas se mostrou consideravelmente superior aos demais métodos. Os resultados dessa tese foram aceitos e publicados no 40º Workshop Internacional sobre Inferência Bayesiana e Métodos de Máxima Entropia em Ciência e Engenharia (MaxEnt 2020/2021) (Miguel et al., 2021) e na revista científica internacional Entropy (Miguel et al., 2022).Exploratory surveys with face-to-face interviews based on random or stratified sampling usually demand large sample sizes, and therefore, high infrastructure and staff costs. Even then, these experiments do not guarantee control of specific covariates, and may yield wrong inferences about parameters of the model. Our research group (Lauretto et al., 2017), (Lauretto et al., 2019) has proposed the Haphazard Sampling Method, an allocation procedure that combines goal optimization techniques with random perturbations. The weight of the random perturbation can be calibrated in such a way that, on one hand, it is small enough to provide good representative samples and, on the other hand, it is large enough to break confounding effects and to avoid biased choices. In previous works, we compared the Haphazard Method with the Rerandomization method proposed by Morgan and Rubin (Morgan & Rubin, 2012) in benchmark allocation problems, and showed that the Haphazard Method provides allocation groups with a better balance and consistently more powerful inferences. In this work, the advantages of the Haphazard Method in the context of sampling from the Census of the Brazilian Institute of Geography and Statistics will be discussed, in which the objective is to provide estimates that are consistently closer to the parameter values and with greater precision. Two case studies will be presented, one to estimate the prevalence of SARS-CoV-2 in some cities in Brazil and another focused on evaluating the effectiveness of vaccines in the city of Serrana - SP. Compared to Rerandomization and purely random allocation, samples generated by the Haphazard method provide smaller mean square error estimates for a given sample size. The mean square error and the standard deviation of the estimates for the parameter of interest will be used as indicators to compare the sampling methods. The use of Haphazard sampling presented great potential to contribute to efforts to measure and control the spread of the COVID-19 pandemic in Brazil, as its performance in small samples proved to be considerably superior to other methods. The results of this thesis were accepted and published at the 40th International Workshop on Bayesian Inference and Maximum Entropy Methods in Science and Engineering (MaxEnt 2020/2021) (Miguel et al., 2021) and in the international scientific journal Entropy (Miguel et al., 2022).Biblioteca Digitais de Teses e Dissertações da USPStern, Julio MichaelMiguel, Miguel Gabriel Ribeiro2022-10-11info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/45/45133/tde-15092025-105729/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2026-03-12T13:23:21Zoai:teses.usp.br:tde-15092025-105729Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212026-03-12T13:23:21Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Verificação da eficiência do método de amostragem Haphazard na otimização de custos em pesquisas
Verification of the efficiency of the Haphazard sampling method in optimizing research costs
title Verificação da eficiência do método de amostragem Haphazard na otimização de custos em pesquisas
spellingShingle Verificação da eficiência do método de amostragem Haphazard na otimização de custos em pesquisas
Miguel, Miguel Gabriel Ribeiro
Amostragem intencional
COVID19
Epicovid19
Haphazard
Haphazard
Intentional sampling
MLG
Optimal sampling design
Pure randomization
Rerandomization
title_short Verificação da eficiência do método de amostragem Haphazard na otimização de custos em pesquisas
title_full Verificação da eficiência do método de amostragem Haphazard na otimização de custos em pesquisas
title_fullStr Verificação da eficiência do método de amostragem Haphazard na otimização de custos em pesquisas
title_full_unstemmed Verificação da eficiência do método de amostragem Haphazard na otimização de custos em pesquisas
title_sort Verificação da eficiência do método de amostragem Haphazard na otimização de custos em pesquisas
author Miguel, Miguel Gabriel Ribeiro
author_facet Miguel, Miguel Gabriel Ribeiro
author_role author
dc.contributor.none.fl_str_mv Stern, Julio Michael
dc.contributor.author.fl_str_mv Miguel, Miguel Gabriel Ribeiro
dc.subject.por.fl_str_mv Amostragem intencional
COVID19
Epicovid19
Haphazard
Haphazard
Intentional sampling
MLG
Optimal sampling design
Pure randomization
Rerandomization
topic Amostragem intencional
COVID19
Epicovid19
Haphazard
Haphazard
Intentional sampling
MLG
Optimal sampling design
Pure randomization
Rerandomization
description Pesquisas exploratórias com entrevistas face a face baseadas em amostragem aleatória ou estratificada geralmente exigem grandes tamanhos de amostra e, portanto, altos custos de infraestrutura e pessoal de campo. Mesmo assim, esses experimentos não garantem o controle de covariáveis específicas e podem gerar inferências pouco precisas sobre os parâmetros populacionais. (Lauretto et al., 2017), (Lauretto et al., 2019) propôs o Método de Amostragem Semi-Intencional denominado de Haphazard, isto é um procedimento de alocação que combina técnicas de otimização com perturbações aleatórias. O peso da perturbação aleatória pode ser calibrado de tal forma que, por um lado, seja pequeno o suficiente para fornecer boas amostras representativas e, por outro lado, seja grande o suficiente para quebrar efeitos de confusão e evitar escolhas enviesadas. Em trabalhos anteriores, o Método Haphazard foi comparado ao método de Re-randomização proposto por (Morgan & Rubin, 2012) em problemas de alocação de benchmark, em que foi mostrado que o Método Haphazard fornece aos grupos de alocação um melhor equilíbrio e inferências consistentemente mais poderosas. Neste trabalho, serão discutidas as vantagens do Método Haphazard no contexto de amostragem a partir do Censo do IBGE, em que o objetivo é fornecer estimativas consistentemente mais próximas dos valores dos parâmetros e com maior precisão. Serão apresentados dois estudos de caso, sendo um para estimar a prevalência de SARS-CoV-2 em algumas cidades do Brasil e outro focado em avaliar a eficácia das vacinas na cidade de Serrana - SP. Em comparação com a Re-randomização e a alocação puramente aleatória, as amostras geradas pelo método Haphazard fornecem estimativas com erro quadrático médio menores para um determinado tamanho de amostra. O erro quadrático médio e o desvio padrão das estimativas para o parâmetro de interesse serão os indicadores utilizados para comparar os métodos de amostragem. O uso da Haphazard apresentou um grande potencial para contribuir nos esforços para medir e controlar a disseminação da pandemia COVID-19 no Brasil, já que sua performance em amostras pequenas se mostrou consideravelmente superior aos demais métodos. Os resultados dessa tese foram aceitos e publicados no 40º Workshop Internacional sobre Inferência Bayesiana e Métodos de Máxima Entropia em Ciência e Engenharia (MaxEnt 2020/2021) (Miguel et al., 2021) e na revista científica internacional Entropy (Miguel et al., 2022).
publishDate 2022
dc.date.none.fl_str_mv 2022-10-11
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/45/45133/tde-15092025-105729/
url https://www.teses.usp.br/teses/disponiveis/45/45133/tde-15092025-105729/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1865492431226535936