A MODEL-CENTRIC SEQUENTIAL APPROACH TO OUTLIER ENSEMBLES IN A MARKETING SCIENCE CONTEXT
Ano de defesa: | 2018 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | , |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | eng |
Instituição de defesa: |
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO
|
Programa de Pós-Graduação: |
PPG EM INFORMÁTICA
|
Departamento: |
Não Informado pela instituição
|
País: |
BR
|
Link de acesso: | https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=36998@1 https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=36998@2 |
Resumo: | O desenvolvimento visto nos últimos anos em dispositivos móveis tem tornado dramático o aumento na quantidade de dados e informações disponíveis para publicitários ao redor do mundo. Custo computacional e tempo disponível para processar dados e ser capaz de distinguir verdadeiros usuários de anomalias ou ruído têm crescido. Assim, a criação de um método para detecção de outliers poderia apoiar melhor os pesquisadores de Marketing e aumentar sua precisão na compreensão do comportamento digital. Estudos atuais mostram que, até o momento, o uso de meta-algoritmos tem sido pouco usado para detecção de outliers. Meta-algoritmos tendem a trazer benefícios porque reduzem a dependência que um único algoritmo pode gerar. Esta dissertação propõe um design de meta-algoritmo que utiliza diferentes algoritmos para obter resultados de detecção de outliers melhores do que aqueles obtidos por apenas um único algoritmo: centrado em modelo e sequencial. A novidade da abordagem consiste em (i) explorar a técnica sequencial, utilizando algoritmos que são aplicados sequencialmente, no qual um algoritmo impacta o próximo e o resultado final é uma combinação dos resultados obtidos; (ii) centralizar a performance no modelo e não nos dados, o que significa que o ensemble é aplicado a todo o conjunto de dados ao mesmo tempo e; (iii) apoiar pesquisadores de marketing que precisem operar ciência de dados de forma mais robusta e coerente. |
id |
PUC_RIO-1_571d8837f8d0e4ad694aebdbdfb73645 |
---|---|
oai_identifier_str |
oai:MAXWELL.puc-rio.br:36998 |
network_acronym_str |
PUC_RIO-1 |
network_name_str |
Repositório Institucional da PUC-RIO (Projeto Maxwell) |
repository_id_str |
|
spelling |
info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisA MODEL-CENTRIC SEQUENTIAL APPROACH TO OUTLIER ENSEMBLES IN A MARKETING SCIENCE CONTEXT ENSEMBLE SEQUENCIAL CENTRADO EM MODELOS PARA DETECÇÃO DE OUTLIERS NO CONTEXTO DE MARKETING SCIENCE 2018-09-06HELIO CORTES VIEIRA LOPES01080382704lattes.cnpq.br/9199970180870105HELIO CORTES VIEIRA LOPESGUSTAVO ROBICHEZ DE CARVALHOGUSTAVO ROBICHEZ DE CARVALHOGUSTAVO ROBICHEZ DE CARVALHOGUSTAVO ROBICHEZ DE CARVALHO10862925703lattes.cnpq.br/5362434031363681REBECCA PORPHIRIO DA COSTA DE AZEVEDOPONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIROPPG EM INFORMÁTICAPUC-RioBRO desenvolvimento visto nos últimos anos em dispositivos móveis tem tornado dramático o aumento na quantidade de dados e informações disponíveis para publicitários ao redor do mundo. Custo computacional e tempo disponível para processar dados e ser capaz de distinguir verdadeiros usuários de anomalias ou ruído têm crescido. Assim, a criação de um método para detecção de outliers poderia apoiar melhor os pesquisadores de Marketing e aumentar sua precisão na compreensão do comportamento digital. Estudos atuais mostram que, até o momento, o uso de meta-algoritmos tem sido pouco usado para detecção de outliers. Meta-algoritmos tendem a trazer benefícios porque reduzem a dependência que um único algoritmo pode gerar. Esta dissertação propõe um design de meta-algoritmo que utiliza diferentes algoritmos para obter resultados de detecção de outliers melhores do que aqueles obtidos por apenas um único algoritmo: centrado em modelo e sequencial. A novidade da abordagem consiste em (i) explorar a técnica sequencial, utilizando algoritmos que são aplicados sequencialmente, no qual um algoritmo impacta o próximo e o resultado final é uma combinação dos resultados obtidos; (ii) centralizar a performance no modelo e não nos dados, o que significa que o ensemble é aplicado a todo o conjunto de dados ao mesmo tempo e; (iii) apoiar pesquisadores de marketing que precisem operar ciência de dados de forma mais robusta e coerente.Latest years evolution in mobile devices has increased dramatically the amount of data and available information for advertisers around the world. Computational cost and available time to process data and be able to distinguish true users from anomalies or noise has only increased. Thus, the creation of a method to detect outliers could support Marketing researchers and increase their precision in understanding online behavior. Recent studies showthat, so far, meta-algorithms have not been used to detect outliers. Metaalgorithms tend to bring benefits because they reduce dependency that a single algorithm can generate. This work proposes a sequential model-centric ensemble design that uses different algorithms in outlier detection to obtain better results than those obtained by a single algorithm. The novelty in this approach consists in: (i) exploring the sequential technique, using algorithms that impact the next one and whose results are a combination of previously obtained results; (ii) centralizing performance around the model and not the data, which means the ensemble is applied in the whole dataset and not on different subsamples; (iii) support Marketing researchers that need to operate data Science in a more robust and coherent way.COORDENAÇÃO DE APERFEIÇOAMENTO DO PESSOAL DE ENSINO SUPERIORPROGRAMA DE EXCELENCIA ACADEMICAhttps://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=36998@1https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=36998@2engreponame:Repositório Institucional da PUC-RIO (Projeto Maxwell)instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO)instacron:PUC_RIOinfo:eu-repo/semantics/openAccess2023-06-26T09:56:30ZRepositório InstitucionalPRI |
dc.title.en.fl_str_mv |
A MODEL-CENTRIC SEQUENTIAL APPROACH TO OUTLIER ENSEMBLES IN A MARKETING SCIENCE CONTEXT |
dc.title.alternative.pt.fl_str_mv |
ENSEMBLE SEQUENCIAL CENTRADO EM MODELOS PARA DETECÇÃO DE OUTLIERS NO CONTEXTO DE MARKETING SCIENCE |
title |
A MODEL-CENTRIC SEQUENTIAL APPROACH TO OUTLIER ENSEMBLES IN A MARKETING SCIENCE CONTEXT |
spellingShingle |
A MODEL-CENTRIC SEQUENTIAL APPROACH TO OUTLIER ENSEMBLES IN A MARKETING SCIENCE CONTEXT REBECCA PORPHIRIO DA COSTA DE AZEVEDO |
title_short |
A MODEL-CENTRIC SEQUENTIAL APPROACH TO OUTLIER ENSEMBLES IN A MARKETING SCIENCE CONTEXT |
title_full |
A MODEL-CENTRIC SEQUENTIAL APPROACH TO OUTLIER ENSEMBLES IN A MARKETING SCIENCE CONTEXT |
title_fullStr |
A MODEL-CENTRIC SEQUENTIAL APPROACH TO OUTLIER ENSEMBLES IN A MARKETING SCIENCE CONTEXT |
title_full_unstemmed |
A MODEL-CENTRIC SEQUENTIAL APPROACH TO OUTLIER ENSEMBLES IN A MARKETING SCIENCE CONTEXT |
title_sort |
A MODEL-CENTRIC SEQUENTIAL APPROACH TO OUTLIER ENSEMBLES IN A MARKETING SCIENCE CONTEXT |
author |
REBECCA PORPHIRIO DA COSTA DE AZEVEDO |
author_facet |
REBECCA PORPHIRIO DA COSTA DE AZEVEDO |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
HELIO CORTES VIEIRA LOPES |
dc.contributor.advisor1ID.fl_str_mv |
01080382704 |
dc.contributor.advisor1Lattes.fl_str_mv |
lattes.cnpq.br/9199970180870105 |
dc.contributor.referee1.fl_str_mv |
HELIO CORTES VIEIRA LOPES |
dc.contributor.referee2.fl_str_mv |
GUSTAVO ROBICHEZ DE CARVALHO |
dc.contributor.referee3.fl_str_mv |
GUSTAVO ROBICHEZ DE CARVALHO |
dc.contributor.referee4.fl_str_mv |
GUSTAVO ROBICHEZ DE CARVALHO |
dc.contributor.referee5.fl_str_mv |
GUSTAVO ROBICHEZ DE CARVALHO |
dc.contributor.authorID.fl_str_mv |
10862925703 |
dc.contributor.authorLattes.fl_str_mv |
lattes.cnpq.br/5362434031363681 |
dc.contributor.author.fl_str_mv |
REBECCA PORPHIRIO DA COSTA DE AZEVEDO |
contributor_str_mv |
HELIO CORTES VIEIRA LOPES HELIO CORTES VIEIRA LOPES GUSTAVO ROBICHEZ DE CARVALHO GUSTAVO ROBICHEZ DE CARVALHO GUSTAVO ROBICHEZ DE CARVALHO GUSTAVO ROBICHEZ DE CARVALHO |
description |
O desenvolvimento visto nos últimos anos em dispositivos móveis tem tornado dramático o aumento na quantidade de dados e informações disponíveis para publicitários ao redor do mundo. Custo computacional e tempo disponível para processar dados e ser capaz de distinguir verdadeiros usuários de anomalias ou ruído têm crescido. Assim, a criação de um método para detecção de outliers poderia apoiar melhor os pesquisadores de Marketing e aumentar sua precisão na compreensão do comportamento digital. Estudos atuais mostram que, até o momento, o uso de meta-algoritmos tem sido pouco usado para detecção de outliers. Meta-algoritmos tendem a trazer benefícios porque reduzem a dependência que um único algoritmo pode gerar. Esta dissertação propõe um design de meta-algoritmo que utiliza diferentes algoritmos para obter resultados de detecção de outliers melhores do que aqueles obtidos por apenas um único algoritmo: centrado em modelo e sequencial. A novidade da abordagem consiste em (i) explorar a técnica sequencial, utilizando algoritmos que são aplicados sequencialmente, no qual um algoritmo impacta o próximo e o resultado final é uma combinação dos resultados obtidos; (ii) centralizar a performance no modelo e não nos dados, o que significa que o ensemble é aplicado a todo o conjunto de dados ao mesmo tempo e; (iii) apoiar pesquisadores de marketing que precisem operar ciência de dados de forma mais robusta e coerente. |
publishDate |
2018 |
dc.date.issued.fl_str_mv |
2018-09-06 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=36998@1 https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=36998@2 |
url |
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=36998@1 https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=36998@2 |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO |
dc.publisher.program.fl_str_mv |
PPG EM INFORMÁTICA |
dc.publisher.initials.fl_str_mv |
PUC-Rio |
dc.publisher.country.fl_str_mv |
BR |
publisher.none.fl_str_mv |
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO DE JANEIRO |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da PUC-RIO (Projeto Maxwell) instname:Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO) instacron:PUC_RIO |
instname_str |
Pontifícia Universidade Católica do Rio de Janeiro (PUC-RIO) |
instacron_str |
PUC_RIO |
institution |
PUC_RIO |
reponame_str |
Repositório Institucional da PUC-RIO (Projeto Maxwell) |
collection |
Repositório Institucional da PUC-RIO (Projeto Maxwell) |
repository.name.fl_str_mv |
|
repository.mail.fl_str_mv |
|
_version_ |
1776626343418527744 |