Aprendizado de máquina automático aplicado à predição da evasão no ensino superior
| Ano de defesa: | 2022 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | , , |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| dARK ID: | ark:/38995/0013000004442 |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal de Goiás
|
| Programa de Pós-Graduação: |
Programa de Pós-graduação em Ciência da Computação (INF)
|
| Departamento: |
Instituto de Informática - INF (RG)
|
| País: |
Brasil
|
| Palavras-chave em Português: | |
| Palavras-chave em Inglês: | |
| Área do conhecimento CNPq: | |
| Link de acesso: | http://repositorio.bc.ufg.br/tede/handle/tede/12454 |
Resumo: | Academic dropout is a problem that affects many public and private university students in Brazil and around the world. Machine learning techniques have been used to mitigate the problem, but still require a lot of manual adjustments. We present in this work, a proposal of an automatic machine learning framework to predict academic dropout, with the goal of obtaining good results without the need for human intervention. This data processing framework includes the following stages: pre-processing, feature vector creation, data splitting into testing and training sets, clustering of data from different degrees for training, model selection, model parameter tunning and explainability. Additionally, we formalize temporal data splitting approaches for train and test datasets, as this task is not adequately addressed in most of the previous works. |
| id |
UFG-2_31da71f2ba60ac415cd050dd9fc3cbe2 |
|---|---|
| oai_identifier_str |
oai:repositorio.bc.ufg.br:tede/12454 |
| network_acronym_str |
UFG-2 |
| network_name_str |
Repositório Institucional da UFG |
| repository_id_str |
|
| spelling |
Nascimento, Hugo Alexandre Dantas do Nascimentohttp://lattes.cnpq.br/2920005922426876Nascimento, Hugo Alexandre Dantas doFerreira, Deller JamesMello, Rafael Ferreira Leite dehttp://lattes.cnpq.br/8905238222960433Barros, Bruno de Mattos2022-11-25T13:38:12Z2022-11-25T13:38:12Z2022-10-20BARROS, B. M. Aprendizado de máquina automático aplicado à predição da evasão no ensino superior. 2022. 100 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Goiás, Goiânia, 2022.http://repositorio.bc.ufg.br/tede/handle/tede/12454ark:/38995/0013000004442Academic dropout is a problem that affects many public and private university students in Brazil and around the world. Machine learning techniques have been used to mitigate the problem, but still require a lot of manual adjustments. We present in this work, a proposal of an automatic machine learning framework to predict academic dropout, with the goal of obtaining good results without the need for human intervention. This data processing framework includes the following stages: pre-processing, feature vector creation, data splitting into testing and training sets, clustering of data from different degrees for training, model selection, model parameter tunning and explainability. Additionally, we formalize temporal data splitting approaches for train and test datasets, as this task is not adequately addressed in most of the previous works.A evasão acadêmica é um problema que atinge grande parte dos alunos de universidades públicas e privadas no Brasil e no mundo. Técnicas de aprendizado de máquina vem sendo utilizadas para mitigar o problema, mas ainda necessitam de muitos ajustes manuais. Apresentamos neste trabalho, uma proposta de aprendizado de máquina automático para prever a evasão acadêmica, obtendo bons resultados sem a necessidade de intervenção humana. O fluxo de processamento de dados desenvolvido contempla as seguintes etapas: pré-processamento, criação de vetor de características, divisão em teste e treinamento, agrupamento de dados de diferentes cursos para treino, seleção de modelos, parametrização de modelos e explicabilidade. Adicionalmente, formalizamos abordagens de segmentação temporal dos dados em treinamento e teste, já que esta questão não é tratada de forma adequada na maioria dos trabalhos anteriores.Fundação de Apoio à PesquisaporUniversidade Federal de GoiásPrograma de Pós-graduação em Ciência da Computação (INF)UFGBrasilInstituto de Informática - INF (RG)Attribution-NonCommercial-NoDerivatives 4.0 Internationalinfo:eu-repo/semantics/openAccessAprendizado de máquina automatizadoSegmentação temporal de dadosPredição da evasão acadêmicaMineração de dados educacionaisAutomated machine learningTemporal data splittingAcademic dropout predictionEducational data miningCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOAprendizado de máquina automático aplicado à predição da evasão no ensino superiorAutomatic machine learning applied to prediction of dropout in higher educationinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis20500500500500261842reponame:Repositório Institucional da UFGinstname:Universidade Federal de Goiás (UFG)instacron:UFGLICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://repositorio.bc.ufg.br/tede/bitstreams/bbb4db98-6465-4284-b174-9aeb621e3b9d/download8a4605be74aa9ea9d79846c1fba20a33MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8805http://repositorio.bc.ufg.br/tede/bitstreams/eb250342-072a-4701-91e2-82fbcc37552e/download4460e5956bc1d1639be9ae6146a50347MD52ORIGINALDissertação - Bruno de Mattos Barros - 2022.pdfDissertação - Bruno de Mattos Barros - 2022.pdfapplication/pdf1998675http://repositorio.bc.ufg.br/tede/bitstreams/82f9a7c4-ca61-444f-9de5-5bbf364b39a5/download67d33627ba91437f2c61ad02a8443474MD53tede/124542022-11-25 10:38:12.46http://creativecommons.org/licenses/by-nc-nd/4.0/Attribution-NonCommercial-NoDerivatives 4.0 Internationalopen.accessoai:repositorio.bc.ufg.br:tede/12454http://repositorio.bc.ufg.br/tedeRepositório InstitucionalPUBhttps://repositorio.bc.ufg.br/tedeserver/oai/requestgrt.bc@ufg.bropendoar:oai:repositorio.bc.ufg.br:tede/12342022-11-25T13:38:12Repositório Institucional da UFG - Universidade Federal de Goiás (UFG)falseTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo= |
| dc.title.pt_BR.fl_str_mv |
Aprendizado de máquina automático aplicado à predição da evasão no ensino superior |
| dc.title.alternative.eng.fl_str_mv |
Automatic machine learning applied to prediction of dropout in higher education |
| title |
Aprendizado de máquina automático aplicado à predição da evasão no ensino superior |
| spellingShingle |
Aprendizado de máquina automático aplicado à predição da evasão no ensino superior Barros, Bruno de Mattos Aprendizado de máquina automatizado Segmentação temporal de dados Predição da evasão acadêmica Mineração de dados educacionais Automated machine learning Temporal data splitting Academic dropout prediction Educational data mining CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| title_short |
Aprendizado de máquina automático aplicado à predição da evasão no ensino superior |
| title_full |
Aprendizado de máquina automático aplicado à predição da evasão no ensino superior |
| title_fullStr |
Aprendizado de máquina automático aplicado à predição da evasão no ensino superior |
| title_full_unstemmed |
Aprendizado de máquina automático aplicado à predição da evasão no ensino superior |
| title_sort |
Aprendizado de máquina automático aplicado à predição da evasão no ensino superior |
| author |
Barros, Bruno de Mattos |
| author_facet |
Barros, Bruno de Mattos |
| author_role |
author |
| dc.contributor.advisor1.fl_str_mv |
Nascimento, Hugo Alexandre Dantas do Nascimento |
| dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/2920005922426876 |
| dc.contributor.referee1.fl_str_mv |
Nascimento, Hugo Alexandre Dantas do |
| dc.contributor.referee2.fl_str_mv |
Ferreira, Deller James |
| dc.contributor.referee3.fl_str_mv |
Mello, Rafael Ferreira Leite de |
| dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/8905238222960433 |
| dc.contributor.author.fl_str_mv |
Barros, Bruno de Mattos |
| contributor_str_mv |
Nascimento, Hugo Alexandre Dantas do Nascimento Nascimento, Hugo Alexandre Dantas do Ferreira, Deller James Mello, Rafael Ferreira Leite de |
| dc.subject.por.fl_str_mv |
Aprendizado de máquina automatizado Segmentação temporal de dados Predição da evasão acadêmica Mineração de dados educacionais |
| topic |
Aprendizado de máquina automatizado Segmentação temporal de dados Predição da evasão acadêmica Mineração de dados educacionais Automated machine learning Temporal data splitting Academic dropout prediction Educational data mining CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| dc.subject.eng.fl_str_mv |
Automated machine learning Temporal data splitting Academic dropout prediction Educational data mining |
| dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| description |
Academic dropout is a problem that affects many public and private university students in Brazil and around the world. Machine learning techniques have been used to mitigate the problem, but still require a lot of manual adjustments. We present in this work, a proposal of an automatic machine learning framework to predict academic dropout, with the goal of obtaining good results without the need for human intervention. This data processing framework includes the following stages: pre-processing, feature vector creation, data splitting into testing and training sets, clustering of data from different degrees for training, model selection, model parameter tunning and explainability. Additionally, we formalize temporal data splitting approaches for train and test datasets, as this task is not adequately addressed in most of the previous works. |
| publishDate |
2022 |
| dc.date.accessioned.fl_str_mv |
2022-11-25T13:38:12Z |
| dc.date.available.fl_str_mv |
2022-11-25T13:38:12Z |
| dc.date.issued.fl_str_mv |
2022-10-20 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
BARROS, B. M. Aprendizado de máquina automático aplicado à predição da evasão no ensino superior. 2022. 100 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Goiás, Goiânia, 2022. |
| dc.identifier.uri.fl_str_mv |
http://repositorio.bc.ufg.br/tede/handle/tede/12454 |
| dc.identifier.dark.fl_str_mv |
ark:/38995/0013000004442 |
| identifier_str_mv |
BARROS, B. M. Aprendizado de máquina automático aplicado à predição da evasão no ensino superior. 2022. 100 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Goiás, Goiânia, 2022. ark:/38995/0013000004442 |
| url |
http://repositorio.bc.ufg.br/tede/handle/tede/12454 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.program.fl_str_mv |
20 |
| dc.relation.confidence.fl_str_mv |
500 500 500 500 |
| dc.relation.department.fl_str_mv |
26 |
| dc.relation.cnpq.fl_str_mv |
184 |
| dc.relation.sponsorship.fl_str_mv |
2 |
| dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivatives 4.0 International info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivatives 4.0 International |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal de Goiás |
| dc.publisher.program.fl_str_mv |
Programa de Pós-graduação em Ciência da Computação (INF) |
| dc.publisher.initials.fl_str_mv |
UFG |
| dc.publisher.country.fl_str_mv |
Brasil |
| dc.publisher.department.fl_str_mv |
Instituto de Informática - INF (RG) |
| publisher.none.fl_str_mv |
Universidade Federal de Goiás |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFG instname:Universidade Federal de Goiás (UFG) instacron:UFG |
| instname_str |
Universidade Federal de Goiás (UFG) |
| instacron_str |
UFG |
| institution |
UFG |
| reponame_str |
Repositório Institucional da UFG |
| collection |
Repositório Institucional da UFG |
| bitstream.url.fl_str_mv |
http://repositorio.bc.ufg.br/tede/bitstreams/bbb4db98-6465-4284-b174-9aeb621e3b9d/download http://repositorio.bc.ufg.br/tede/bitstreams/eb250342-072a-4701-91e2-82fbcc37552e/download http://repositorio.bc.ufg.br/tede/bitstreams/82f9a7c4-ca61-444f-9de5-5bbf364b39a5/download |
| bitstream.checksum.fl_str_mv |
8a4605be74aa9ea9d79846c1fba20a33 4460e5956bc1d1639be9ae6146a50347 67d33627ba91437f2c61ad02a8443474 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFG - Universidade Federal de Goiás (UFG) |
| repository.mail.fl_str_mv |
grt.bc@ufg.br |
| _version_ |
1846536643735977984 |