Amostragem e estimação de médias de preços incorporando informações de Big data
| Ano de defesa: | 2025 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de Pernambuco
|
| Programa de Pós-Graduação: |
Programa de Pos Graduacao em Estatistica
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Brasil
|
| Palavras-chave em Português: | |
| Link de acesso: | https://repositorio.ufpe.br/handle/123456789/63749 |
Resumo: | Esta tese apresenta uma proposta de método de amostragem para coleta de dados, com o objetivo de gerar estimativas para médias de preços, levando em consideração informações disponíveis na web, relativas a uma população de “lojas virtuais”, através de algoritmos de web scraping, a fim de contribuir para construções de índices de preços voltados para esse tipo de comércio. Ainda que a capacidade computacional e tecnológica esteja em constante avanço, definir uma estratégia de amostragem probabilística para captura de dados de um universo Big data, como a web (W3), é de fundamental importância para a realização de inferência estatística adequada. Na composição de tal estratégia, esta tese propõe o uso de técnicas de amostragem em dois estágios, múltiplos cadastros, combinação de captura e recaptura com amostragem de Bernoulli e amostragem bidimensional. Parte da teoria proposta é ilustrada através de um experimento piloto para gerar estimativas de médias de preços de lojas virtuais para aparelhos celulares. |
| id |
UFPE_951cc593bbf366111ea734afb0596749 |
|---|---|
| oai_identifier_str |
oai:repositorio.ufpe.br:123456789/63749 |
| network_acronym_str |
UFPE |
| network_name_str |
Repositório Institucional da UFPE |
| repository_id_str |
|
| spelling |
BATISTA, Luciene Maria Torquato Cerqueirahttp://lattes.cnpq.br/9778542861253715http://lattes.cnpq.br/1122718253481481http://lattes.cnpq.br/6357960802605841FERRAZ, CristianoMARTINEZ, Raydonal Ospina2025-06-11T16:07:03Z2025-06-11T16:07:03Z2025-02-27BATISTA, Luciene Maria Torquato Cerqueira. Amostragem e estimação de médias de preços incorporando informações de Big data. 2025. Tese (Doutorado em Estatística) - Universidade Federal de Pernambuco, Recife, 2025.https://repositorio.ufpe.br/handle/123456789/63749Esta tese apresenta uma proposta de método de amostragem para coleta de dados, com o objetivo de gerar estimativas para médias de preços, levando em consideração informações disponíveis na web, relativas a uma população de “lojas virtuais”, através de algoritmos de web scraping, a fim de contribuir para construções de índices de preços voltados para esse tipo de comércio. Ainda que a capacidade computacional e tecnológica esteja em constante avanço, definir uma estratégia de amostragem probabilística para captura de dados de um universo Big data, como a web (W3), é de fundamental importância para a realização de inferência estatística adequada. Na composição de tal estratégia, esta tese propõe o uso de técnicas de amostragem em dois estágios, múltiplos cadastros, combinação de captura e recaptura com amostragem de Bernoulli e amostragem bidimensional. Parte da teoria proposta é ilustrada através de um experimento piloto para gerar estimativas de médias de preços de lojas virtuais para aparelhos celulares.This thesis presents a proposed sampling method for data collection, aimed at generating estimates for average prices, considering information available on the web related to a population of “online stores”, through web scraping algorithms, to contribute to the development of price indices focused on this type of commerce. Even though computational and technological capacity is constantly advancing, defining a probabilistic sampling strategy to capture data from a Big data universe, such as the web (W3), is of fundamental importance for carrying out adequate statistical inference. In composing such a strategy, this thesis proposes the use of two-stage sampling techniques, multiple frames, combination of capture and recapture with Bernoulli sampling and bidimensional sampling. Part of the proposed theory is illustrated through a pilot experiment aimed at generating average price estimates for online stores selling mobile phones.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em EstatisticaUFPEBrasilhttps://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessMega dadosWeb ScrapingCadastros MúltiplosAmostragem de BernoulliAmostragem por Captura e RecapturaAmostragem e estimação de médias de preços incorporando informações de Big datainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisdoutoradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPEORIGINALTESE Luciene Maria Torquato Cerqueira Batista.pdfTESE Luciene Maria Torquato Cerqueira Batista.pdfapplication/pdf3624177https://repositorio.ufpe.br/bitstream/123456789/63749/1/TESE%20Luciene%20Maria%20Torquato%20Cerqueira%20Batista.pdfef14e0c4120157f832c583ea88afa27dMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-82362https://repositorio.ufpe.br/bitstream/123456789/63749/2/license.txt5e89a1613ddc8510c6576f4b23a78973MD52TEXTTESE Luciene Maria Torquato Cerqueira Batista.pdf.txtTESE Luciene Maria Torquato Cerqueira Batista.pdf.txtExtracted texttext/plain248384https://repositorio.ufpe.br/bitstream/123456789/63749/3/TESE%20Luciene%20Maria%20Torquato%20Cerqueira%20Batista.pdf.txt1d00f9cb347da2e1e41aae81b32b6d8aMD53THUMBNAILTESE Luciene Maria Torquato Cerqueira Batista.pdf.jpgTESE Luciene Maria Torquato Cerqueira Batista.pdf.jpgGenerated Thumbnailimage/jpeg1236https://repositorio.ufpe.br/bitstream/123456789/63749/4/TESE%20Luciene%20Maria%20Torquato%20Cerqueira%20Batista.pdf.jpg0ee9ce4680cab7a2e4def5281d539d23MD54123456789/637492025-06-15 14:33:27.956oai:repositorio.ufpe.br:123456789/63749VGVybW8gZGUgRGVww7NzaXRvIExlZ2FsIGUgQXV0b3JpemHDp8OjbyBwYXJhIFB1YmxpY2l6YcOnw6NvIGRlIERvY3VtZW50b3Mgbm8gUmVwb3NpdMOzcmlvIERpZ2l0YWwgZGEgVUZQRQoKCkRlY2xhcm8gZXN0YXIgY2llbnRlIGRlIHF1ZSBlc3RlIFRlcm1vIGRlIERlcMOzc2l0byBMZWdhbCBlIEF1dG9yaXphw6fDo28gdGVtIG8gb2JqZXRpdm8gZGUgZGl2dWxnYcOnw6NvIGRvcyBkb2N1bWVudG9zIGRlcG9zaXRhZG9zIG5vIFJlcG9zaXTDs3JpbyBEaWdpdGFsIGRhIFVGUEUgZSBkZWNsYXJvIHF1ZToKCkkgLSBvcyBkYWRvcyBwcmVlbmNoaWRvcyBubyBmb3JtdWzDoXJpbyBkZSBkZXDDs3NpdG8gc8OjbyB2ZXJkYWRlaXJvcyBlIGF1dMOqbnRpY29zOwoKSUkgLSAgbyBjb250ZcO6ZG8gZGlzcG9uaWJpbGl6YWRvIMOpIGRlIHJlc3BvbnNhYmlsaWRhZGUgZGUgc3VhIGF1dG9yaWE7CgpJSUkgLSBvIGNvbnRlw7pkbyDDqSBvcmlnaW5hbCwgZSBzZSBvIHRyYWJhbGhvIGUvb3UgcGFsYXZyYXMgZGUgb3V0cmFzIHBlc3NvYXMgZm9yYW0gdXRpbGl6YWRvcywgZXN0YXMgZm9yYW0gZGV2aWRhbWVudGUgcmVjb25oZWNpZGFzOwoKSVYgLSBxdWFuZG8gdHJhdGFyLXNlIGRlIG9icmEgY29sZXRpdmEgKG1haXMgZGUgdW0gYXV0b3IpOiB0b2RvcyBvcyBhdXRvcmVzIGVzdMOjbyBjaWVudGVzIGRvIGRlcMOzc2l0byBlIGRlIGFjb3JkbyBjb20gZXN0ZSB0ZXJtbzsKClYgLSBxdWFuZG8gdHJhdGFyLXNlIGRlIFRyYWJhbGhvIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28sIERpc3NlcnRhw6fDo28gb3UgVGVzZTogbyBhcnF1aXZvIGRlcG9zaXRhZG8gY29ycmVzcG9uZGUgw6AgdmVyc8OjbyBmaW5hbCBkbyB0cmFiYWxobzsKClZJIC0gcXVhbmRvIHRyYXRhci1zZSBkZSBUcmFiYWxobyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvLCBEaXNzZXJ0YcOnw6NvIG91IFRlc2U6IGVzdG91IGNpZW50ZSBkZSBxdWUgYSBhbHRlcmHDp8OjbyBkYSBtb2RhbGlkYWRlIGRlIGFjZXNzbyBhbyBkb2N1bWVudG8gYXDDs3MgbyBkZXDDs3NpdG8gZSBhbnRlcyBkZSBmaW5kYXIgbyBwZXLDrW9kbyBkZSBlbWJhcmdvLCBxdWFuZG8gZm9yIGVzY29saGlkbyBhY2Vzc28gcmVzdHJpdG8sIHNlcsOhIHBlcm1pdGlkYSBtZWRpYW50ZSBzb2xpY2l0YcOnw6NvIGRvIChhKSBhdXRvciAoYSkgYW8gU2lzdGVtYSBJbnRlZ3JhZG8gZGUgQmlibGlvdGVjYXMgZGEgVUZQRSAoU0lCL1VGUEUpLgoKIApQYXJhIHRyYWJhbGhvcyBlbSBBY2Vzc28gQWJlcnRvOgoKTmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRlIGF1dG9yIHF1ZSByZWNhZW0gc29icmUgZXN0ZSBkb2N1bWVudG8sIGZ1bmRhbWVudGFkbyBuYSBMZWkgZGUgRGlyZWl0byBBdXRvcmFsIG5vIDkuNjEwLCBkZSAxOSBkZSBmZXZlcmVpcm8gZGUgMTk5OCwgYXJ0LiAyOSwgaW5jaXNvIElJSSwgYXV0b3Jpem8gYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIGEgZGlzcG9uaWJpbGl6YXIgZ3JhdHVpdGFtZW50ZSwgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkIChhcXVpc2nDp8OjbykgYXRyYXbDqXMgZG8gc2l0ZSBkbyBSZXBvc2l0w7NyaW8gRGlnaXRhbCBkYSBVRlBFIG5vIGVuZGVyZcOnbyBodHRwOi8vd3d3LnJlcG9zaXRvcmlvLnVmcGUuYnIsIGEgcGFydGlyIGRhIGRhdGEgZGUgZGVww7NzaXRvLgoKIApQYXJhIHRyYWJhbGhvcyBlbSBBY2Vzc28gUmVzdHJpdG86CgpOYSBxdWFsaWRhZGUgZGUgdGl0dWxhciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGUgYXV0b3IgcXVlIHJlY2FlbSBzb2JyZSBlc3RlIGRvY3VtZW50bywgZnVuZGFtZW50YWRvIG5hIExlaSBkZSBEaXJlaXRvIEF1dG9yYWwgbm8gOS42MTAgZGUgMTkgZGUgZmV2ZXJlaXJvIGRlIDE5OTgsIGFydC4gMjksIGluY2lzbyBJSUksIGF1dG9yaXpvIGEgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgUGVybmFtYnVjbyBhIGRpc3BvbmliaWxpemFyIGdyYXR1aXRhbWVudGUsIHNlbSByZXNzYXJjaW1lbnRvIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgcGFyYSBmaW5zIGRlIGxlaXR1cmEsIGltcHJlc3PDo28gZS9vdSBkb3dubG9hZCAoYXF1aXNpw6fDo28pIGF0cmF2w6lzIGRvIHNpdGUgZG8gUmVwb3NpdMOzcmlvIERpZ2l0YWwgZGEgVUZQRSBubyBlbmRlcmXDp28gaHR0cDovL3d3dy5yZXBvc2l0b3Jpby51ZnBlLmJyLCBxdWFuZG8gZmluZGFyIG8gcGVyw61vZG8gZGUgZW1iYXJnbyBjb25kaXplbnRlIGFvIHRpcG8gZGUgZG9jdW1lbnRvLCBjb25mb3JtZSBpbmRpY2FkbyBubyBjYW1wbyBEYXRhIGRlIEVtYmFyZ28uCg==Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212025-06-15T17:33:27Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false |
| dc.title.pt_BR.fl_str_mv |
Amostragem e estimação de médias de preços incorporando informações de Big data |
| title |
Amostragem e estimação de médias de preços incorporando informações de Big data |
| spellingShingle |
Amostragem e estimação de médias de preços incorporando informações de Big data BATISTA, Luciene Maria Torquato Cerqueira Mega dados Web Scraping Cadastros Múltiplos Amostragem de Bernoulli Amostragem por Captura e Recaptura |
| title_short |
Amostragem e estimação de médias de preços incorporando informações de Big data |
| title_full |
Amostragem e estimação de médias de preços incorporando informações de Big data |
| title_fullStr |
Amostragem e estimação de médias de preços incorporando informações de Big data |
| title_full_unstemmed |
Amostragem e estimação de médias de preços incorporando informações de Big data |
| title_sort |
Amostragem e estimação de médias de preços incorporando informações de Big data |
| author |
BATISTA, Luciene Maria Torquato Cerqueira |
| author_facet |
BATISTA, Luciene Maria Torquato Cerqueira |
| author_role |
author |
| dc.contributor.authorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/9778542861253715 |
| dc.contributor.advisorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/1122718253481481 |
| dc.contributor.advisor-coLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/6357960802605841 |
| dc.contributor.author.fl_str_mv |
BATISTA, Luciene Maria Torquato Cerqueira |
| dc.contributor.advisor1.fl_str_mv |
FERRAZ, Cristiano |
| dc.contributor.advisor-co1.fl_str_mv |
MARTINEZ, Raydonal Ospina |
| contributor_str_mv |
FERRAZ, Cristiano MARTINEZ, Raydonal Ospina |
| dc.subject.por.fl_str_mv |
Mega dados Web Scraping Cadastros Múltiplos Amostragem de Bernoulli Amostragem por Captura e Recaptura |
| topic |
Mega dados Web Scraping Cadastros Múltiplos Amostragem de Bernoulli Amostragem por Captura e Recaptura |
| description |
Esta tese apresenta uma proposta de método de amostragem para coleta de dados, com o objetivo de gerar estimativas para médias de preços, levando em consideração informações disponíveis na web, relativas a uma população de “lojas virtuais”, através de algoritmos de web scraping, a fim de contribuir para construções de índices de preços voltados para esse tipo de comércio. Ainda que a capacidade computacional e tecnológica esteja em constante avanço, definir uma estratégia de amostragem probabilística para captura de dados de um universo Big data, como a web (W3), é de fundamental importância para a realização de inferência estatística adequada. Na composição de tal estratégia, esta tese propõe o uso de técnicas de amostragem em dois estágios, múltiplos cadastros, combinação de captura e recaptura com amostragem de Bernoulli e amostragem bidimensional. Parte da teoria proposta é ilustrada através de um experimento piloto para gerar estimativas de médias de preços de lojas virtuais para aparelhos celulares. |
| publishDate |
2025 |
| dc.date.accessioned.fl_str_mv |
2025-06-11T16:07:03Z |
| dc.date.available.fl_str_mv |
2025-06-11T16:07:03Z |
| dc.date.issued.fl_str_mv |
2025-02-27 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
BATISTA, Luciene Maria Torquato Cerqueira. Amostragem e estimação de médias de preços incorporando informações de Big data. 2025. Tese (Doutorado em Estatística) - Universidade Federal de Pernambuco, Recife, 2025. |
| dc.identifier.uri.fl_str_mv |
https://repositorio.ufpe.br/handle/123456789/63749 |
| identifier_str_mv |
BATISTA, Luciene Maria Torquato Cerqueira. Amostragem e estimação de médias de preços incorporando informações de Big data. 2025. Tese (Doutorado em Estatística) - Universidade Federal de Pernambuco, Recife, 2025. |
| url |
https://repositorio.ufpe.br/handle/123456789/63749 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
https://creativecommons.org/licenses/by-nc-nd/4.0/ info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
https://creativecommons.org/licenses/by-nc-nd/4.0/ |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
| dc.publisher.program.fl_str_mv |
Programa de Pos Graduacao em Estatistica |
| dc.publisher.initials.fl_str_mv |
UFPE |
| dc.publisher.country.fl_str_mv |
Brasil |
| publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco (UFPE) instacron:UFPE |
| instname_str |
Universidade Federal de Pernambuco (UFPE) |
| instacron_str |
UFPE |
| institution |
UFPE |
| reponame_str |
Repositório Institucional da UFPE |
| collection |
Repositório Institucional da UFPE |
| bitstream.url.fl_str_mv |
https://repositorio.ufpe.br/bitstream/123456789/63749/1/TESE%20Luciene%20Maria%20Torquato%20Cerqueira%20Batista.pdf https://repositorio.ufpe.br/bitstream/123456789/63749/2/license.txt https://repositorio.ufpe.br/bitstream/123456789/63749/3/TESE%20Luciene%20Maria%20Torquato%20Cerqueira%20Batista.pdf.txt https://repositorio.ufpe.br/bitstream/123456789/63749/4/TESE%20Luciene%20Maria%20Torquato%20Cerqueira%20Batista.pdf.jpg |
| bitstream.checksum.fl_str_mv |
ef14e0c4120157f832c583ea88afa27d 5e89a1613ddc8510c6576f4b23a78973 1d00f9cb347da2e1e41aae81b32b6d8a 0ee9ce4680cab7a2e4def5281d539d23 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE) |
| repository.mail.fl_str_mv |
attena@ufpe.br |
| _version_ |
1862741846702161920 |