Aprendizagem semi-supervisionada aplicada à engenharia financeira

Detalhes bibliográficos
Ano de defesa: 2007
Autor(a) principal: Levi Henrique Santana de Lelis
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Minas Gerais
UFMG
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://hdl.handle.net/1843/BUOS-8CEE5L
Resumo: Semi-supervised learning had become, recently, a good alternative toimprove generalization capacity in machine learning models. The approach is generally used in problems that labeled samples are hard tobe obtained and unlabeled, in turn, are plenty and easily collected; the semisupervised training algorithm tries to generate the separation surface between the two classes based also on unlabeled data. A classic example is the web sites classification: give a trustworthy label to a sample is time consuming. Nonetheless, a crawler can quickly collect a great number of unlabeled samples. This work shows a different application of semi-supervised learning, because in this case, it is possessed a long labeled training set (financial time series can be easily downloaded from internet), however, the quality of this set is put under prove: the labels are trustworthy? Through the semi-supervisedapproach it was possible minimize the noise data from training set, improving the results obtained.
id UFMG_34248756b05e811a93301064d6626366
oai_identifier_str oai:repositorio.ufmg.br:1843/BUOS-8CEE5L
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
spelling Aprendizagem semi-supervisionada aplicada à engenharia financeiraEngenharia ElétricaEngenharia elétricaSemi-supervised learning had become, recently, a good alternative toimprove generalization capacity in machine learning models. The approach is generally used in problems that labeled samples are hard tobe obtained and unlabeled, in turn, are plenty and easily collected; the semisupervised training algorithm tries to generate the separation surface between the two classes based also on unlabeled data. A classic example is the web sites classification: give a trustworthy label to a sample is time consuming. Nonetheless, a crawler can quickly collect a great number of unlabeled samples. This work shows a different application of semi-supervised learning, because in this case, it is possessed a long labeled training set (financial time series can be easily downloaded from internet), however, the quality of this set is put under prove: the labels are trustworthy? Through the semi-supervisedapproach it was possible minimize the noise data from training set, improving the results obtained.A aprendizagem semi-supervisionada se tornou, recentemente, emuma boa alternativa para aumentar a capacidade de generalizaçãode modelos de aprendizagem de máquina. A abordagem é utilizada,geralmente, em problemas que as amostras rotuladas são difíceis de serem obtidas, e as sem rótulo, por sua vez, são abundantes e facilmente coletadas; o algoritmo de treinamento semi-supervisionado busca, então, gerar a superfície de separação entre as classes com base também nas amostras sem rótulo. Um exemplo clássico é o de classificação de sites na web: gasta-se muito tempo para se rotular uma amostra de forma confiável. Entretanto, um crawler é capaz de coletar inúmeras amostras sem rótulo rapidamente. Este trabalho mostra uma aplicação diferenciada do aprendizado semisupervisionado, pois nesse caso, possui-se um extenso conjunto de treinamento rotulado (séries temporais financeiras são facilmente encontradas para download na internet), no entanto, a qualidade desse conjunto é colocada emquestão: a rotulação é confiável? Através da abordagem semi-supervisionada foi possível minimizar os dados ruidosos do conjunto de treinamento, melhorando os resultados obtidos.Universidade Federal de Minas GeraisUFMGAntonio de Padua BragaLevi Henrique Santana de Lelis2019-08-13T19:23:50Z2019-08-13T19:23:50Z2007-06-06info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/1843/BUOS-8CEE5Linfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMG2019-11-14T17:08:21Zoai:repositorio.ufmg.br:1843/BUOS-8CEE5LRepositório InstitucionalPUBhttps://repositorio.ufmg.br/oairepositorio@ufmg.bropendoar:2019-11-14T17:08:21Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
dc.title.none.fl_str_mv Aprendizagem semi-supervisionada aplicada à engenharia financeira
title Aprendizagem semi-supervisionada aplicada à engenharia financeira
spellingShingle Aprendizagem semi-supervisionada aplicada à engenharia financeira
Levi Henrique Santana de Lelis
Engenharia Elétrica
Engenharia elétrica
title_short Aprendizagem semi-supervisionada aplicada à engenharia financeira
title_full Aprendizagem semi-supervisionada aplicada à engenharia financeira
title_fullStr Aprendizagem semi-supervisionada aplicada à engenharia financeira
title_full_unstemmed Aprendizagem semi-supervisionada aplicada à engenharia financeira
title_sort Aprendizagem semi-supervisionada aplicada à engenharia financeira
author Levi Henrique Santana de Lelis
author_facet Levi Henrique Santana de Lelis
author_role author
dc.contributor.none.fl_str_mv Antonio de Padua Braga
dc.contributor.author.fl_str_mv Levi Henrique Santana de Lelis
dc.subject.por.fl_str_mv Engenharia Elétrica
Engenharia elétrica
topic Engenharia Elétrica
Engenharia elétrica
description Semi-supervised learning had become, recently, a good alternative toimprove generalization capacity in machine learning models. The approach is generally used in problems that labeled samples are hard tobe obtained and unlabeled, in turn, are plenty and easily collected; the semisupervised training algorithm tries to generate the separation surface between the two classes based also on unlabeled data. A classic example is the web sites classification: give a trustworthy label to a sample is time consuming. Nonetheless, a crawler can quickly collect a great number of unlabeled samples. This work shows a different application of semi-supervised learning, because in this case, it is possessed a long labeled training set (financial time series can be easily downloaded from internet), however, the quality of this set is put under prove: the labels are trustworthy? Through the semi-supervisedapproach it was possible minimize the noise data from training set, improving the results obtained.
publishDate 2007
dc.date.none.fl_str_mv 2007-06-06
2019-08-13T19:23:50Z
2019-08-13T19:23:50Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1843/BUOS-8CEE5L
url http://hdl.handle.net/1843/BUOS-8CEE5L
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Minas Gerais
UFMG
publisher.none.fl_str_mv Universidade Federal de Minas Gerais
UFMG
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFMG
instname:Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
instname_str Universidade Federal de Minas Gerais (UFMG)
instacron_str UFMG
institution UFMG
reponame_str Repositório Institucional da UFMG
collection Repositório Institucional da UFMG
repository.name.fl_str_mv Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)
repository.mail.fl_str_mv repositorio@ufmg.br
_version_ 1835273029012160512