Amostragem e estimação de médias de preços incorporando informações de Big data

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: BATISTA, Luciene Maria Torquato Cerqueira
Orientador(a): FERRAZ, Cristiano
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
Programa de Pós-Graduação: Programa de Pos Graduacao em Estatistica
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/63749
Resumo: Esta tese apresenta uma proposta de método de amostragem para coleta de dados, com o objetivo de gerar estimativas para médias de preços, levando em consideração informações disponíveis na web, relativas a uma população de “lojas virtuais”, através de algoritmos de web scraping, a fim de contribuir para construções de índices de preços voltados para esse tipo de comércio. Ainda que a capacidade computacional e tecnológica esteja em constante avanço, definir uma estratégia de amostragem probabilística para captura de dados de um universo Big data, como a web (W3), é de fundamental importância para a realização de inferência estatística adequada. Na composição de tal estratégia, esta tese propõe o uso de técnicas de amostragem em dois estágios, múltiplos cadastros, combinação de captura e recaptura com amostragem de Bernoulli e amostragem bidimensional. Parte da teoria proposta é ilustrada através de um experimento piloto para gerar estimativas de médias de preços de lojas virtuais para aparelhos celulares.
id UFPE_951cc593bbf366111ea734afb0596749
oai_identifier_str oai:repositorio.ufpe.br:123456789/63749
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str
spelling BATISTA, Luciene Maria Torquato Cerqueirahttp://lattes.cnpq.br/9778542861253715http://lattes.cnpq.br/1122718253481481http://lattes.cnpq.br/6357960802605841FERRAZ, CristianoMARTINEZ, Raydonal Ospina2025-06-11T16:07:03Z2025-06-11T16:07:03Z2025-02-27BATISTA, Luciene Maria Torquato Cerqueira. Amostragem e estimação de médias de preços incorporando informações de Big data. 2025. Tese (Doutorado em Estatística) - Universidade Federal de Pernambuco, Recife, 2025.https://repositorio.ufpe.br/handle/123456789/63749Esta tese apresenta uma proposta de método de amostragem para coleta de dados, com o objetivo de gerar estimativas para médias de preços, levando em consideração informações disponíveis na web, relativas a uma população de “lojas virtuais”, através de algoritmos de web scraping, a fim de contribuir para construções de índices de preços voltados para esse tipo de comércio. Ainda que a capacidade computacional e tecnológica esteja em constante avanço, definir uma estratégia de amostragem probabilística para captura de dados de um universo Big data, como a web (W3), é de fundamental importância para a realização de inferência estatística adequada. Na composição de tal estratégia, esta tese propõe o uso de técnicas de amostragem em dois estágios, múltiplos cadastros, combinação de captura e recaptura com amostragem de Bernoulli e amostragem bidimensional. Parte da teoria proposta é ilustrada através de um experimento piloto para gerar estimativas de médias de preços de lojas virtuais para aparelhos celulares.This thesis presents a proposed sampling method for data collection, aimed at generating estimates for average prices, considering information available on the web related to a population of “online stores”, through web scraping algorithms, to contribute to the development of price indices focused on this type of commerce. Even though computational and technological capacity is constantly advancing, defining a probabilistic sampling strategy to capture data from a Big data universe, such as the web (W3), is of fundamental importance for carrying out adequate statistical inference. In composing such a strategy, this thesis proposes the use of two-stage sampling techniques, multiple frames, combination of capture and recapture with Bernoulli sampling and bidimensional sampling. Part of the proposed theory is illustrated through a pilot experiment aimed at generating average price estimates for online stores selling mobile phones.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em EstatisticaUFPEBrasilhttps://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessMega dadosWeb ScrapingCadastros MúltiplosAmostragem de BernoulliAmostragem por Captura e RecapturaAmostragem e estimação de médias de preços incorporando informações de Big datainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisdoutoradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPEORIGINALTESE Luciene Maria Torquato Cerqueira Batista.pdfTESE Luciene Maria Torquato Cerqueira Batista.pdfapplication/pdf3624177https://repositorio.ufpe.br/bitstream/123456789/63749/1/TESE%20Luciene%20Maria%20Torquato%20Cerqueira%20Batista.pdfef14e0c4120157f832c583ea88afa27dMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-82362https://repositorio.ufpe.br/bitstream/123456789/63749/2/license.txt5e89a1613ddc8510c6576f4b23a78973MD52TEXTTESE Luciene Maria Torquato Cerqueira Batista.pdf.txtTESE Luciene Maria Torquato Cerqueira Batista.pdf.txtExtracted texttext/plain248384https://repositorio.ufpe.br/bitstream/123456789/63749/3/TESE%20Luciene%20Maria%20Torquato%20Cerqueira%20Batista.pdf.txt1d00f9cb347da2e1e41aae81b32b6d8aMD53THUMBNAILTESE Luciene Maria Torquato Cerqueira Batista.pdf.jpgTESE Luciene Maria Torquato Cerqueira Batista.pdf.jpgGenerated Thumbnailimage/jpeg1236https://repositorio.ufpe.br/bitstream/123456789/63749/4/TESE%20Luciene%20Maria%20Torquato%20Cerqueira%20Batista.pdf.jpg0ee9ce4680cab7a2e4def5281d539d23MD54123456789/637492025-06-15 14:33:27.956oai:repositorio.ufpe.br:123456789/63749VGVybW8gZGUgRGVww7NzaXRvIExlZ2FsIGUgQXV0b3JpemHDp8OjbyBwYXJhIFB1YmxpY2l6YcOnw6NvIGRlIERvY3VtZW50b3Mgbm8gUmVwb3NpdMOzcmlvIERpZ2l0YWwgZGEgVUZQRQoKCkRlY2xhcm8gZXN0YXIgY2llbnRlIGRlIHF1ZSBlc3RlIFRlcm1vIGRlIERlcMOzc2l0byBMZWdhbCBlIEF1dG9yaXphw6fDo28gdGVtIG8gb2JqZXRpdm8gZGUgZGl2dWxnYcOnw6NvIGRvcyBkb2N1bWVudG9zIGRlcG9zaXRhZG9zIG5vIFJlcG9zaXTDs3JpbyBEaWdpdGFsIGRhIFVGUEUgZSBkZWNsYXJvIHF1ZToKCkkgLSBvcyBkYWRvcyBwcmVlbmNoaWRvcyBubyBmb3JtdWzDoXJpbyBkZSBkZXDDs3NpdG8gc8OjbyB2ZXJkYWRlaXJvcyBlIGF1dMOqbnRpY29zOwoKSUkgLSAgbyBjb250ZcO6ZG8gZGlzcG9uaWJpbGl6YWRvIMOpIGRlIHJlc3BvbnNhYmlsaWRhZGUgZGUgc3VhIGF1dG9yaWE7CgpJSUkgLSBvIGNvbnRlw7pkbyDDqSBvcmlnaW5hbCwgZSBzZSBvIHRyYWJhbGhvIGUvb3UgcGFsYXZyYXMgZGUgb3V0cmFzIHBlc3NvYXMgZm9yYW0gdXRpbGl6YWRvcywgZXN0YXMgZm9yYW0gZGV2aWRhbWVudGUgcmVjb25oZWNpZGFzOwoKSVYgLSBxdWFuZG8gdHJhdGFyLXNlIGRlIG9icmEgY29sZXRpdmEgKG1haXMgZGUgdW0gYXV0b3IpOiB0b2RvcyBvcyBhdXRvcmVzIGVzdMOjbyBjaWVudGVzIGRvIGRlcMOzc2l0byBlIGRlIGFjb3JkbyBjb20gZXN0ZSB0ZXJtbzsKClYgLSBxdWFuZG8gdHJhdGFyLXNlIGRlIFRyYWJhbGhvIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28sIERpc3NlcnRhw6fDo28gb3UgVGVzZTogbyBhcnF1aXZvIGRlcG9zaXRhZG8gY29ycmVzcG9uZGUgw6AgdmVyc8OjbyBmaW5hbCBkbyB0cmFiYWxobzsKClZJIC0gcXVhbmRvIHRyYXRhci1zZSBkZSBUcmFiYWxobyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvLCBEaXNzZXJ0YcOnw6NvIG91IFRlc2U6IGVzdG91IGNpZW50ZSBkZSBxdWUgYSBhbHRlcmHDp8OjbyBkYSBtb2RhbGlkYWRlIGRlIGFjZXNzbyBhbyBkb2N1bWVudG8gYXDDs3MgbyBkZXDDs3NpdG8gZSBhbnRlcyBkZSBmaW5kYXIgbyBwZXLDrW9kbyBkZSBlbWJhcmdvLCBxdWFuZG8gZm9yIGVzY29saGlkbyBhY2Vzc28gcmVzdHJpdG8sIHNlcsOhIHBlcm1pdGlkYSBtZWRpYW50ZSBzb2xpY2l0YcOnw6NvIGRvIChhKSBhdXRvciAoYSkgYW8gU2lzdGVtYSBJbnRlZ3JhZG8gZGUgQmlibGlvdGVjYXMgZGEgVUZQRSAoU0lCL1VGUEUpLgoKIApQYXJhIHRyYWJhbGhvcyBlbSBBY2Vzc28gQWJlcnRvOgoKTmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRlIGF1dG9yIHF1ZSByZWNhZW0gc29icmUgZXN0ZSBkb2N1bWVudG8sIGZ1bmRhbWVudGFkbyBuYSBMZWkgZGUgRGlyZWl0byBBdXRvcmFsIG5vIDkuNjEwLCBkZSAxOSBkZSBmZXZlcmVpcm8gZGUgMTk5OCwgYXJ0LiAyOSwgaW5jaXNvIElJSSwgYXV0b3Jpem8gYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIGEgZGlzcG9uaWJpbGl6YXIgZ3JhdHVpdGFtZW50ZSwgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkIChhcXVpc2nDp8OjbykgYXRyYXbDqXMgZG8gc2l0ZSBkbyBSZXBvc2l0w7NyaW8gRGlnaXRhbCBkYSBVRlBFIG5vIGVuZGVyZcOnbyBodHRwOi8vd3d3LnJlcG9zaXRvcmlvLnVmcGUuYnIsIGEgcGFydGlyIGRhIGRhdGEgZGUgZGVww7NzaXRvLgoKIApQYXJhIHRyYWJhbGhvcyBlbSBBY2Vzc28gUmVzdHJpdG86CgpOYSBxdWFsaWRhZGUgZGUgdGl0dWxhciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGUgYXV0b3IgcXVlIHJlY2FlbSBzb2JyZSBlc3RlIGRvY3VtZW50bywgZnVuZGFtZW50YWRvIG5hIExlaSBkZSBEaXJlaXRvIEF1dG9yYWwgbm8gOS42MTAgZGUgMTkgZGUgZmV2ZXJlaXJvIGRlIDE5OTgsIGFydC4gMjksIGluY2lzbyBJSUksIGF1dG9yaXpvIGEgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgUGVybmFtYnVjbyBhIGRpc3BvbmliaWxpemFyIGdyYXR1aXRhbWVudGUsIHNlbSByZXNzYXJjaW1lbnRvIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgcGFyYSBmaW5zIGRlIGxlaXR1cmEsIGltcHJlc3PDo28gZS9vdSBkb3dubG9hZCAoYXF1aXNpw6fDo28pIGF0cmF2w6lzIGRvIHNpdGUgZG8gUmVwb3NpdMOzcmlvIERpZ2l0YWwgZGEgVUZQRSBubyBlbmRlcmXDp28gaHR0cDovL3d3dy5yZXBvc2l0b3Jpby51ZnBlLmJyLCBxdWFuZG8gZmluZGFyIG8gcGVyw61vZG8gZGUgZW1iYXJnbyBjb25kaXplbnRlIGFvIHRpcG8gZGUgZG9jdW1lbnRvLCBjb25mb3JtZSBpbmRpY2FkbyBubyBjYW1wbyBEYXRhIGRlIEVtYmFyZ28uCg==Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212025-06-15T17:33:27Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.pt_BR.fl_str_mv Amostragem e estimação de médias de preços incorporando informações de Big data
title Amostragem e estimação de médias de preços incorporando informações de Big data
spellingShingle Amostragem e estimação de médias de preços incorporando informações de Big data
BATISTA, Luciene Maria Torquato Cerqueira
Mega dados
Web Scraping
Cadastros Múltiplos
Amostragem de Bernoulli
Amostragem por Captura e Recaptura
title_short Amostragem e estimação de médias de preços incorporando informações de Big data
title_full Amostragem e estimação de médias de preços incorporando informações de Big data
title_fullStr Amostragem e estimação de médias de preços incorporando informações de Big data
title_full_unstemmed Amostragem e estimação de médias de preços incorporando informações de Big data
title_sort Amostragem e estimação de médias de preços incorporando informações de Big data
author BATISTA, Luciene Maria Torquato Cerqueira
author_facet BATISTA, Luciene Maria Torquato Cerqueira
author_role author
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/9778542861253715
dc.contributor.advisorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/1122718253481481
dc.contributor.advisor-coLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/6357960802605841
dc.contributor.author.fl_str_mv BATISTA, Luciene Maria Torquato Cerqueira
dc.contributor.advisor1.fl_str_mv FERRAZ, Cristiano
dc.contributor.advisor-co1.fl_str_mv MARTINEZ, Raydonal Ospina
contributor_str_mv FERRAZ, Cristiano
MARTINEZ, Raydonal Ospina
dc.subject.por.fl_str_mv Mega dados
Web Scraping
Cadastros Múltiplos
Amostragem de Bernoulli
Amostragem por Captura e Recaptura
topic Mega dados
Web Scraping
Cadastros Múltiplos
Amostragem de Bernoulli
Amostragem por Captura e Recaptura
description Esta tese apresenta uma proposta de método de amostragem para coleta de dados, com o objetivo de gerar estimativas para médias de preços, levando em consideração informações disponíveis na web, relativas a uma população de “lojas virtuais”, através de algoritmos de web scraping, a fim de contribuir para construções de índices de preços voltados para esse tipo de comércio. Ainda que a capacidade computacional e tecnológica esteja em constante avanço, definir uma estratégia de amostragem probabilística para captura de dados de um universo Big data, como a web (W3), é de fundamental importância para a realização de inferência estatística adequada. Na composição de tal estratégia, esta tese propõe o uso de técnicas de amostragem em dois estágios, múltiplos cadastros, combinação de captura e recaptura com amostragem de Bernoulli e amostragem bidimensional. Parte da teoria proposta é ilustrada através de um experimento piloto para gerar estimativas de médias de preços de lojas virtuais para aparelhos celulares.
publishDate 2025
dc.date.accessioned.fl_str_mv 2025-06-11T16:07:03Z
dc.date.available.fl_str_mv 2025-06-11T16:07:03Z
dc.date.issued.fl_str_mv 2025-02-27
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv BATISTA, Luciene Maria Torquato Cerqueira. Amostragem e estimação de médias de preços incorporando informações de Big data. 2025. Tese (Doutorado em Estatística) - Universidade Federal de Pernambuco, Recife, 2025.
dc.identifier.uri.fl_str_mv https://repositorio.ufpe.br/handle/123456789/63749
identifier_str_mv BATISTA, Luciene Maria Torquato Cerqueira. Amostragem e estimação de médias de preços incorporando informações de Big data. 2025. Tese (Doutorado em Estatística) - Universidade Federal de Pernambuco, Recife, 2025.
url https://repositorio.ufpe.br/handle/123456789/63749
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv https://creativecommons.org/licenses/by-nc-nd/4.0/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.publisher.program.fl_str_mv Programa de Pos Graduacao em Estatistica
dc.publisher.initials.fl_str_mv UFPE
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Federal de Pernambuco
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
bitstream.url.fl_str_mv https://repositorio.ufpe.br/bitstream/123456789/63749/1/TESE%20Luciene%20Maria%20Torquato%20Cerqueira%20Batista.pdf
https://repositorio.ufpe.br/bitstream/123456789/63749/2/license.txt
https://repositorio.ufpe.br/bitstream/123456789/63749/3/TESE%20Luciene%20Maria%20Torquato%20Cerqueira%20Batista.pdf.txt
https://repositorio.ufpe.br/bitstream/123456789/63749/4/TESE%20Luciene%20Maria%20Torquato%20Cerqueira%20Batista.pdf.jpg
bitstream.checksum.fl_str_mv ef14e0c4120157f832c583ea88afa27d
5e89a1613ddc8510c6576f4b23a78973
1d00f9cb347da2e1e41aae81b32b6d8a
0ee9ce4680cab7a2e4def5281d539d23
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1862741846702161920