Aceleração da estimação do modelo de máquinas de vetores de suporte para bases de dados massivos : uma nova abordagem através da fusão de SVMs fracos e esféricos

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: PIMENTEL, Jonatha Sousa
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso embargado
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
UFPE
Brasil
Programa de Pos Graduacao em Estatistica
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/49575
Resumo: ARA, Anderson, também é conhecido em citações bibliográficas por: SOUZA, Anderson Luiz Ara.
id UFPE_980eb5a5b98e8aba15c0b3e0c7ce154f
oai_identifier_str oai:repositorio.ufpe.br:123456789/49575
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str
spelling Aceleração da estimação do modelo de máquinas de vetores de suporte para bases de dados massivos : uma nova abordagem através da fusão de SVMs fracos e esféricosEstatística aplicadaDados massivosARA, Anderson, também é conhecido em citações bibliográficas por: SOUZA, Anderson Luiz Ara.A capacidade de geração de dados nos últimos anos, atingiu níveis nunca antes vistos. Mais dados em apenas dois anos do que em 5 mil anos de história, aumento em 50 vezes do volume gerado em um período de 10 anos, termos como Big Data, Machine Learning e Inteligência Artificial cada vez mais comumente vistos e falados. Provocado por essa mudança, é necessária a utilização de técnicas capazes de analisar tal quantidade de dados, sejam elas estatísticas ou de aprendizado de máquina, onde se destaca a interseção entre as duas áreas. Dentre as diversas técnicas existentes e de destaque, a técnica a ser aqui trabalhada são as máquinas de vetores de suporte (SVM - do inglês Support Vector Machine), introduzida por Vapnik em 1995, que busca a separação e classificação de observações através da construção de hiperplano ótimo. Apesar do grande uso, os modelos SVM sofrem para serem estimados em bases de dados massivas, sendo necessária a utilização de técnicas para enfrentar tal problema. Frente a este problema, neste trabalho serão implementadas as técnicas Sphere SVM, Speed Up SVM para a classificação, além do modelo proposto Fusion SVM, para a utilização em dados massivos. Os resultados obtidos ao comparar os modelos para diferentes bases de dados simuladas e reais, apresentam modelos que permitem a manutenção da capacidade preditiva do modelo SVM, bem como a sua estimação em um décimo do tempo do modelo completo. Além disso, para bases de dados cada vez maiores, é possível observar o melhor desempenho do modelo Fusion SVM sobre os demais.CAPESThe data generation capacity in recent years has reached levels never seen before. More data in just two years than in 5,000 years of history, a 50-fold increase in the volume generated over a 10-year period, terms like Big Data, Machine Learning and Artificial Intelligence increasingly commonly seen and spoken. Caused by this change, it is necessary to use techniques capable of analyzing such an amount of data, whether statistics or machine learning, where the intersec- tion between the two areas stands out. Among the various existing and prominent techniques, the technique to be worked on here is the support vector machines (SVM), introduced by Vapnik in 1995, which seeks to separate and classify observations through the construction of an optimal hyperplane. Despite the wide use, the SVM models suffer to be estimated in massive databases, requiring the use of techniques to face this problem. Faced with this prob- lem, this work will implement the techniques Sphere SVM, Speed Up SVM for classification, in addition to the proposed model Fusion SVM, for use in massive data. The results obtained when comparing the models for different simulated and real databases, present models that allow the maintenance of the predictive capacity of the SVM model, as well as its estimation in one tenth of the time of the complete model. In addition, for increasingly larger databases, it is possible to observe the better performance of the Fusion SVM model over the others.Universidade Federal de PernambucoUFPEBrasilPrograma de Pos Graduacao em EstatisticaMARTÍNEZ, Raydonal OspinaARA, Andersonhttp://lattes.cnpq.br/5906035652176254http://lattes.cnpq.br/6357960802605841http://lattes.cnpq.br/8916772290938469PIMENTEL, Jonatha Sousa2023-04-04T12:27:47Z2023-04-04T12:27:47Z2023-02-10info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfPIMENTEL, Jonatha Sousa. Aceleração da estimação do modelo de máquinas de vetores de suporte para bases de dados massivos: uma nova abordagem através da fusão de SVMs fracos e esféricos. 2023. Dissertação (Mestrado em Estatística) – Universidade Federal de Pernambuco, Recife, 2023.https://repositorio.ufpe.br/handle/123456789/49575porhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/embargoedAccessreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPE2023-04-05T05:14:16Zoai:repositorio.ufpe.br:123456789/49575Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212023-04-05T05:14:16Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.none.fl_str_mv Aceleração da estimação do modelo de máquinas de vetores de suporte para bases de dados massivos : uma nova abordagem através da fusão de SVMs fracos e esféricos
title Aceleração da estimação do modelo de máquinas de vetores de suporte para bases de dados massivos : uma nova abordagem através da fusão de SVMs fracos e esféricos
spellingShingle Aceleração da estimação do modelo de máquinas de vetores de suporte para bases de dados massivos : uma nova abordagem através da fusão de SVMs fracos e esféricos
PIMENTEL, Jonatha Sousa
Estatística aplicada
Dados massivos
title_short Aceleração da estimação do modelo de máquinas de vetores de suporte para bases de dados massivos : uma nova abordagem através da fusão de SVMs fracos e esféricos
title_full Aceleração da estimação do modelo de máquinas de vetores de suporte para bases de dados massivos : uma nova abordagem através da fusão de SVMs fracos e esféricos
title_fullStr Aceleração da estimação do modelo de máquinas de vetores de suporte para bases de dados massivos : uma nova abordagem através da fusão de SVMs fracos e esféricos
title_full_unstemmed Aceleração da estimação do modelo de máquinas de vetores de suporte para bases de dados massivos : uma nova abordagem através da fusão de SVMs fracos e esféricos
title_sort Aceleração da estimação do modelo de máquinas de vetores de suporte para bases de dados massivos : uma nova abordagem através da fusão de SVMs fracos e esféricos
author PIMENTEL, Jonatha Sousa
author_facet PIMENTEL, Jonatha Sousa
author_role author
dc.contributor.none.fl_str_mv MARTÍNEZ, Raydonal Ospina
ARA, Anderson
http://lattes.cnpq.br/5906035652176254
http://lattes.cnpq.br/6357960802605841
http://lattes.cnpq.br/8916772290938469
dc.contributor.author.fl_str_mv PIMENTEL, Jonatha Sousa
dc.subject.por.fl_str_mv Estatística aplicada
Dados massivos
topic Estatística aplicada
Dados massivos
description ARA, Anderson, também é conhecido em citações bibliográficas por: SOUZA, Anderson Luiz Ara.
publishDate 2023
dc.date.none.fl_str_mv 2023-04-04T12:27:47Z
2023-04-04T12:27:47Z
2023-02-10
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv PIMENTEL, Jonatha Sousa. Aceleração da estimação do modelo de máquinas de vetores de suporte para bases de dados massivos: uma nova abordagem através da fusão de SVMs fracos e esféricos. 2023. Dissertação (Mestrado em Estatística) – Universidade Federal de Pernambuco, Recife, 2023.
https://repositorio.ufpe.br/handle/123456789/49575
identifier_str_mv PIMENTEL, Jonatha Sousa. Aceleração da estimação do modelo de máquinas de vetores de suporte para bases de dados massivos: uma nova abordagem através da fusão de SVMs fracos e esféricos. 2023. Dissertação (Mestrado em Estatística) – Universidade Federal de Pernambuco, Recife, 2023.
url https://repositorio.ufpe.br/handle/123456789/49575
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/embargoedAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv embargoedAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
UFPE
Brasil
Programa de Pos Graduacao em Estatistica
publisher.none.fl_str_mv Universidade Federal de Pernambuco
UFPE
Brasil
Programa de Pos Graduacao em Estatistica
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1856041863545356288