Aprendizado de máquina automático aplicado à predição da evasão no ensino superior

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: Barros, Bruno de Mattos lattes
Orientador(a): Nascimento, Hugo Alexandre Dantas do Nascimento lattes
Banca de defesa: Nascimento, Hugo Alexandre Dantas do, Ferreira, Deller James, Mello, Rafael Ferreira Leite de
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
dARK ID: ark:/38995/0013000004442
Idioma: por
Instituição de defesa: Universidade Federal de Goiás
Programa de Pós-Graduação: Programa de Pós-graduação em Ciência da Computação (INF)
Departamento: Instituto de Informática - INF (RG)
País: Brasil
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: http://repositorio.bc.ufg.br/tede/handle/tede/12454
Resumo: Academic dropout is a problem that affects many public and private university students in Brazil and around the world. Machine learning techniques have been used to mitigate the problem, but still require a lot of manual adjustments. We present in this work, a proposal of an automatic machine learning framework to predict academic dropout, with the goal of obtaining good results without the need for human intervention. This data processing framework includes the following stages: pre-processing, feature vector creation, data splitting into testing and training sets, clustering of data from different degrees for training, model selection, model parameter tunning and explainability. Additionally, we formalize temporal data splitting approaches for train and test datasets, as this task is not adequately addressed in most of the previous works.
id UFG-2_31da71f2ba60ac415cd050dd9fc3cbe2
oai_identifier_str oai:repositorio.bc.ufg.br:tede/12454
network_acronym_str UFG-2
network_name_str Repositório Institucional da UFG
repository_id_str
spelling Nascimento, Hugo Alexandre Dantas do Nascimentohttp://lattes.cnpq.br/2920005922426876Nascimento, Hugo Alexandre Dantas doFerreira, Deller JamesMello, Rafael Ferreira Leite dehttp://lattes.cnpq.br/8905238222960433Barros, Bruno de Mattos2022-11-25T13:38:12Z2022-11-25T13:38:12Z2022-10-20BARROS, B. M. Aprendizado de máquina automático aplicado à predição da evasão no ensino superior. 2022. 100 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Goiás, Goiânia, 2022.http://repositorio.bc.ufg.br/tede/handle/tede/12454ark:/38995/0013000004442Academic dropout is a problem that affects many public and private university students in Brazil and around the world. Machine learning techniques have been used to mitigate the problem, but still require a lot of manual adjustments. We present in this work, a proposal of an automatic machine learning framework to predict academic dropout, with the goal of obtaining good results without the need for human intervention. This data processing framework includes the following stages: pre-processing, feature vector creation, data splitting into testing and training sets, clustering of data from different degrees for training, model selection, model parameter tunning and explainability. Additionally, we formalize temporal data splitting approaches for train and test datasets, as this task is not adequately addressed in most of the previous works.A evasão acadêmica é um problema que atinge grande parte dos alunos de universidades públicas e privadas no Brasil e no mundo. Técnicas de aprendizado de máquina vem sendo utilizadas para mitigar o problema, mas ainda necessitam de muitos ajustes manuais. Apresentamos neste trabalho, uma proposta de aprendizado de máquina automático para prever a evasão acadêmica, obtendo bons resultados sem a necessidade de intervenção humana. O fluxo de processamento de dados desenvolvido contempla as seguintes etapas: pré-processamento, criação de vetor de características, divisão em teste e treinamento, agrupamento de dados de diferentes cursos para treino, seleção de modelos, parametrização de modelos e explicabilidade. Adicionalmente, formalizamos abordagens de segmentação temporal dos dados em treinamento e teste, já que esta questão não é tratada de forma adequada na maioria dos trabalhos anteriores.Fundação de Apoio à PesquisaporUniversidade Federal de GoiásPrograma de Pós-graduação em Ciência da Computação (INF)UFGBrasilInstituto de Informática - INF (RG)Attribution-NonCommercial-NoDerivatives 4.0 Internationalinfo:eu-repo/semantics/openAccessAprendizado de máquina automatizadoSegmentação temporal de dadosPredição da evasão acadêmicaMineração de dados educacionaisAutomated machine learningTemporal data splittingAcademic dropout predictionEducational data miningCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOAprendizado de máquina automático aplicado à predição da evasão no ensino superiorAutomatic machine learning applied to prediction of dropout in higher educationinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis20500500500500261842reponame:Repositório Institucional da UFGinstname:Universidade Federal de Goiás (UFG)instacron:UFGLICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://repositorio.bc.ufg.br/tede/bitstreams/bbb4db98-6465-4284-b174-9aeb621e3b9d/download8a4605be74aa9ea9d79846c1fba20a33MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8805http://repositorio.bc.ufg.br/tede/bitstreams/eb250342-072a-4701-91e2-82fbcc37552e/download4460e5956bc1d1639be9ae6146a50347MD52ORIGINALDissertação - Bruno de Mattos Barros - 2022.pdfDissertação - Bruno de Mattos Barros - 2022.pdfapplication/pdf1998675http://repositorio.bc.ufg.br/tede/bitstreams/82f9a7c4-ca61-444f-9de5-5bbf364b39a5/download67d33627ba91437f2c61ad02a8443474MD53tede/124542022-11-25 10:38:12.46http://creativecommons.org/licenses/by-nc-nd/4.0/Attribution-NonCommercial-NoDerivatives 4.0 Internationalopen.accessoai:repositorio.bc.ufg.br:tede/12454http://repositorio.bc.ufg.br/tedeRepositório InstitucionalPUBhttps://repositorio.bc.ufg.br/tedeserver/oai/requestgrt.bc@ufg.bropendoar:oai:repositorio.bc.ufg.br:tede/12342022-11-25T13:38:12Repositório Institucional da UFG - Universidade Federal de Goiás (UFG)falseTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
dc.title.pt_BR.fl_str_mv Aprendizado de máquina automático aplicado à predição da evasão no ensino superior
dc.title.alternative.eng.fl_str_mv Automatic machine learning applied to prediction of dropout in higher education
title Aprendizado de máquina automático aplicado à predição da evasão no ensino superior
spellingShingle Aprendizado de máquina automático aplicado à predição da evasão no ensino superior
Barros, Bruno de Mattos
Aprendizado de máquina automatizado
Segmentação temporal de dados
Predição da evasão acadêmica
Mineração de dados educacionais
Automated machine learning
Temporal data splitting
Academic dropout prediction
Educational data mining
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Aprendizado de máquina automático aplicado à predição da evasão no ensino superior
title_full Aprendizado de máquina automático aplicado à predição da evasão no ensino superior
title_fullStr Aprendizado de máquina automático aplicado à predição da evasão no ensino superior
title_full_unstemmed Aprendizado de máquina automático aplicado à predição da evasão no ensino superior
title_sort Aprendizado de máquina automático aplicado à predição da evasão no ensino superior
author Barros, Bruno de Mattos
author_facet Barros, Bruno de Mattos
author_role author
dc.contributor.advisor1.fl_str_mv Nascimento, Hugo Alexandre Dantas do Nascimento
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/2920005922426876
dc.contributor.referee1.fl_str_mv Nascimento, Hugo Alexandre Dantas do
dc.contributor.referee2.fl_str_mv Ferreira, Deller James
dc.contributor.referee3.fl_str_mv Mello, Rafael Ferreira Leite de
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/8905238222960433
dc.contributor.author.fl_str_mv Barros, Bruno de Mattos
contributor_str_mv Nascimento, Hugo Alexandre Dantas do Nascimento
Nascimento, Hugo Alexandre Dantas do
Ferreira, Deller James
Mello, Rafael Ferreira Leite de
dc.subject.por.fl_str_mv Aprendizado de máquina automatizado
Segmentação temporal de dados
Predição da evasão acadêmica
Mineração de dados educacionais
topic Aprendizado de máquina automatizado
Segmentação temporal de dados
Predição da evasão acadêmica
Mineração de dados educacionais
Automated machine learning
Temporal data splitting
Academic dropout prediction
Educational data mining
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.eng.fl_str_mv Automated machine learning
Temporal data splitting
Academic dropout prediction
Educational data mining
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description Academic dropout is a problem that affects many public and private university students in Brazil and around the world. Machine learning techniques have been used to mitigate the problem, but still require a lot of manual adjustments. We present in this work, a proposal of an automatic machine learning framework to predict academic dropout, with the goal of obtaining good results without the need for human intervention. This data processing framework includes the following stages: pre-processing, feature vector creation, data splitting into testing and training sets, clustering of data from different degrees for training, model selection, model parameter tunning and explainability. Additionally, we formalize temporal data splitting approaches for train and test datasets, as this task is not adequately addressed in most of the previous works.
publishDate 2022
dc.date.accessioned.fl_str_mv 2022-11-25T13:38:12Z
dc.date.available.fl_str_mv 2022-11-25T13:38:12Z
dc.date.issued.fl_str_mv 2022-10-20
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv BARROS, B. M. Aprendizado de máquina automático aplicado à predição da evasão no ensino superior. 2022. 100 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Goiás, Goiânia, 2022.
dc.identifier.uri.fl_str_mv http://repositorio.bc.ufg.br/tede/handle/tede/12454
dc.identifier.dark.fl_str_mv ark:/38995/0013000004442
identifier_str_mv BARROS, B. M. Aprendizado de máquina automático aplicado à predição da evasão no ensino superior. 2022. 100 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Goiás, Goiânia, 2022.
ark:/38995/0013000004442
url http://repositorio.bc.ufg.br/tede/handle/tede/12454
dc.language.iso.fl_str_mv por
language por
dc.relation.program.fl_str_mv 20
dc.relation.confidence.fl_str_mv 500
500
500
500
dc.relation.department.fl_str_mv 26
dc.relation.cnpq.fl_str_mv 184
dc.relation.sponsorship.fl_str_mv 2
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivatives 4.0 International
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivatives 4.0 International
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Goiás
dc.publisher.program.fl_str_mv Programa de Pós-graduação em Ciência da Computação (INF)
dc.publisher.initials.fl_str_mv UFG
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Instituto de Informática - INF (RG)
publisher.none.fl_str_mv Universidade Federal de Goiás
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFG
instname:Universidade Federal de Goiás (UFG)
instacron:UFG
instname_str Universidade Federal de Goiás (UFG)
instacron_str UFG
institution UFG
reponame_str Repositório Institucional da UFG
collection Repositório Institucional da UFG
bitstream.url.fl_str_mv http://repositorio.bc.ufg.br/tede/bitstreams/bbb4db98-6465-4284-b174-9aeb621e3b9d/download
http://repositorio.bc.ufg.br/tede/bitstreams/eb250342-072a-4701-91e2-82fbcc37552e/download
http://repositorio.bc.ufg.br/tede/bitstreams/82f9a7c4-ca61-444f-9de5-5bbf364b39a5/download
bitstream.checksum.fl_str_mv 8a4605be74aa9ea9d79846c1fba20a33
4460e5956bc1d1639be9ae6146a50347
67d33627ba91437f2c61ad02a8443474
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFG - Universidade Federal de Goiás (UFG)
repository.mail.fl_str_mv grt.bc@ufg.br
_version_ 1846536643735977984