Investigação da evasão estudantil por meio da mineração de dados e aprendizagem de máquina

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Jesus, Jeferson Andrade de
Orientador(a): Gusmão, Renê Pereira de
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Pós-Graduação em Ciência da Computação
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: https://ri.ufs.br/jspui/handle/riufs/22451
Resumo: A student dropout is a recurring problem in both schools and universities, posing detrimental effects on students’ learning experiences and causing financial losses for institutions, whether public or private. Studies employing data mining (DM) and machine learning (ML) techniques to investigate educational issues are on the rise, and student dropout is one such problem. Through these techniques, it becomes possible to identify patterns in individuals or groups that may be prone to discontinuing their studies. Predictions and insights gained through DM and ML techniques can aid in reducing student dropout rates by providing a better understanding of the phenomenon, thereby informing decision-making and problem resolution. This study aims to investigate university dropout using data from the Higher Education Census obtained from the INEP portal. It analyzes the classification of university student dropout using classical algorithms in building classification models. The investigation reveals that, based on the 2016 Census, 30% of university students end up abandoning their enrolled courses or discontinuing higher education altogether. Additionally, it highlights that existing studies utilizing dropout classifiers lack a standardized set of attributes for constructing their models, making it challenging to apply these models across different institutions. To address these issues, the study employs INEP data in constructing classification models during the experiments. The best result, with an accuracy metric of 0.979, was achieved by the model based on the Decision Tree algorithm in the distance education (Educação a Distância - EAD) modality and public administrative category.
id UFS-2_b373b2ca1674f70c6fe16b06414c4fc5
oai_identifier_str oai:oai:ri.ufs.br:repo_01:riufs/22451
network_acronym_str UFS-2
network_name_str Repositório Institucional da UFS
repository_id_str
spelling Jesus, Jeferson Andrade deGusmão, Renê Pereira de2025-06-16T19:51:56Z2025-06-16T19:51:56Z2024-02-28JESUS, Jeferson Andrade de. Investigação da evasão estudantil por meio da mineração de dados e aprendizagem de máquina. 2024. 259 f. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Sergipe, São Cristóvão, 2024.https://ri.ufs.br/jspui/handle/riufs/22451A student dropout is a recurring problem in both schools and universities, posing detrimental effects on students’ learning experiences and causing financial losses for institutions, whether public or private. Studies employing data mining (DM) and machine learning (ML) techniques to investigate educational issues are on the rise, and student dropout is one such problem. Through these techniques, it becomes possible to identify patterns in individuals or groups that may be prone to discontinuing their studies. Predictions and insights gained through DM and ML techniques can aid in reducing student dropout rates by providing a better understanding of the phenomenon, thereby informing decision-making and problem resolution. This study aims to investigate university dropout using data from the Higher Education Census obtained from the INEP portal. It analyzes the classification of university student dropout using classical algorithms in building classification models. The investigation reveals that, based on the 2016 Census, 30% of university students end up abandoning their enrolled courses or discontinuing higher education altogether. Additionally, it highlights that existing studies utilizing dropout classifiers lack a standardized set of attributes for constructing their models, making it challenging to apply these models across different institutions. To address these issues, the study employs INEP data in constructing classification models during the experiments. The best result, with an accuracy metric of 0.979, was achieved by the model based on the Decision Tree algorithm in the distance education (Educação a Distância - EAD) modality and public administrative category.A evasão dos alunos nas escolas e universidades é um problema recorrente na educação, tanto é danoso para o aluno em termos de aprendizagem, como gera prejuízos financeiros para as instituições, sejam públicas ou privadas. Estudos que usam técnicas de Mineração de Dados (MD) e Aprendizagem de Máquina (AM) para investigar problemas na educação estão em ascensão, e a evasão estudantil é um desses problemas, por meio dessas técnicas é possível identificar padrões em indivíduos ou grupos de indivíduos que possam vir a desistir dos estudos. Com essas predições e outras informações exploradas pelas técnicas de MD e AM é possível diminuir a evasão dos alunos nas instituições de ensino, pois, o estudo ajuda a entender melhor o fenômeno e a partir disso verificar ações que ajudam na tomada de decisão e consequentemente na resolução do problema. Esse trabalho tem como objetivo investigar a evasão universitária através de dados do Censo da Educação Superior obtidos no portal do Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP) e analisar a classificação de evasão de alunos do ensino superior utilizando algoritmos clássicos na construção dos modelos de classificação. A investigação mostra que com base no Censo de 2016, 30% dos alunos do ensino superior chegam a desistir do curso ao qual ingressou ou a desistir do ensino superior, também é possível evidenciar que todos os estudos que utiliza classificadores de evasão estudantil como uma maneira de minimizar esse problema não utilizam conjuntos de dados com os mesmos atributos utilizados por outras instituições na construção dos seus modelos, de maneira que não é possível reaproveitar esses modelos para outras instituições. Considerando essas informações foram utilizados os dados do INEP na construção dos modelos de classificação construídos nos experimentos deste trabalho, tendo como melhor resultado para a métrica de acurácia: 0.979, resultado obtido pelo modelo baseado no algoritmo Árvore de Decisão, na modalidade Educação a Distância (EAD) e categoria administrativa pública.São CristóvãoporPrediçãoClassificaçãoEvasão do estudanteAprendizagem de máquinaMineração de dadosPredictionClassificationStudent dropoutMachine learningData miningCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOInvestigação da evasão estudantil por meio da mineração de dados e aprendizagem de máquinainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisPós-Graduação em Ciência da ComputaçãoUniversidade Federal de Sergipe (UFS)reponame:Repositório Institucional da UFSinstname:Universidade Federal de Sergipe (UFS)instacron:UFSinfo:eu-repo/semantics/openAccessLICENSElicense.txtlicense.txttext/plain; charset=utf-81475https://ri.ufs.br/jspui/bitstream/riufs/22451/1/license.txt098cbbf65c2c15e1fb2e49c5d306a44cMD51ORIGINALJEFERSON_ANDRADE_JESUS.pdfJEFERSON_ANDRADE_JESUS.pdfapplication/pdf3173055https://ri.ufs.br/jspui/bitstream/riufs/22451/2/JEFERSON_ANDRADE_JESUS.pdf604b675f3305a3a9dfaa2a04cc074254MD52riufs/224512025-06-16 16:52:01.467oai:oai:ri.ufs.br:repo_01:riufs/22451TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvcihlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBTZXJnaXBlIG8gZGlyZWl0byBuw6NvLWV4Y2x1c2l2byBkZSByZXByb2R1emlyIHNldSB0cmFiYWxobyBubyBmb3JtYXRvIGVsZXRyw7RuaWNvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mgw6F1ZGlvIG91IHbDrWRlby4KClZvY8OqIGNvbmNvcmRhIHF1ZSBhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIFNlcmdpcGUgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIHRyYW5zcG9yIHNldSB0cmFiYWxobyBwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byBwYXJhIGZpbnMgZGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIHRhbWLDqW0gY29uY29yZGEgcXVlIGEgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgU2VyZ2lwZSBwb2RlIG1hbnRlciBtYWlzIGRlIHVtYSBjw7NwaWEgZGUgc2V1IHRyYWJhbGhvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIHNldSB0cmFiYWxobyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gVm9jw6ogdGFtYsOpbSBkZWNsYXJhIHF1ZSBvIGRlcMOzc2l0bywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgbsOjbyBpbmZyaW5nZSBkaXJlaXRvcyBhdXRvcmFpcyBkZSBuaW5ndcOpbS4KCkNhc28gbyB0cmFiYWxobyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgw6AgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgU2VyZ2lwZSBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvLgoKQSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBTZXJnaXBlIHNlIGNvbXByb21ldGUgYSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8gc2V1IG5vbWUocykgb3UgbyhzKSBub21lKHMpIGRvKHMpIApkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRvIHRyYWJhbGhvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzIGNvbmNlZGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EuIAo=Repositório InstitucionalPUBhttps://ri.ufs.br/oai/requestrepositorio@academico.ufs.bropendoar:2025-06-16T19:52:01Repositório Institucional da UFS - Universidade Federal de Sergipe (UFS)false
dc.title.pt_BR.fl_str_mv Investigação da evasão estudantil por meio da mineração de dados e aprendizagem de máquina
title Investigação da evasão estudantil por meio da mineração de dados e aprendizagem de máquina
spellingShingle Investigação da evasão estudantil por meio da mineração de dados e aprendizagem de máquina
Jesus, Jeferson Andrade de
Predição
Classificação
Evasão do estudante
Aprendizagem de máquina
Mineração de dados
Prediction
Classification
Student dropout
Machine learning
Data mining
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Investigação da evasão estudantil por meio da mineração de dados e aprendizagem de máquina
title_full Investigação da evasão estudantil por meio da mineração de dados e aprendizagem de máquina
title_fullStr Investigação da evasão estudantil por meio da mineração de dados e aprendizagem de máquina
title_full_unstemmed Investigação da evasão estudantil por meio da mineração de dados e aprendizagem de máquina
title_sort Investigação da evasão estudantil por meio da mineração de dados e aprendizagem de máquina
author Jesus, Jeferson Andrade de
author_facet Jesus, Jeferson Andrade de
author_role author
dc.contributor.author.fl_str_mv Jesus, Jeferson Andrade de
dc.contributor.advisor1.fl_str_mv Gusmão, Renê Pereira de
contributor_str_mv Gusmão, Renê Pereira de
dc.subject.por.fl_str_mv Predição
Classificação
Evasão do estudante
Aprendizagem de máquina
Mineração de dados
topic Predição
Classificação
Evasão do estudante
Aprendizagem de máquina
Mineração de dados
Prediction
Classification
Student dropout
Machine learning
Data mining
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.eng.fl_str_mv Prediction
Classification
Student dropout
Machine learning
Data mining
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description A student dropout is a recurring problem in both schools and universities, posing detrimental effects on students’ learning experiences and causing financial losses for institutions, whether public or private. Studies employing data mining (DM) and machine learning (ML) techniques to investigate educational issues are on the rise, and student dropout is one such problem. Through these techniques, it becomes possible to identify patterns in individuals or groups that may be prone to discontinuing their studies. Predictions and insights gained through DM and ML techniques can aid in reducing student dropout rates by providing a better understanding of the phenomenon, thereby informing decision-making and problem resolution. This study aims to investigate university dropout using data from the Higher Education Census obtained from the INEP portal. It analyzes the classification of university student dropout using classical algorithms in building classification models. The investigation reveals that, based on the 2016 Census, 30% of university students end up abandoning their enrolled courses or discontinuing higher education altogether. Additionally, it highlights that existing studies utilizing dropout classifiers lack a standardized set of attributes for constructing their models, making it challenging to apply these models across different institutions. To address these issues, the study employs INEP data in constructing classification models during the experiments. The best result, with an accuracy metric of 0.979, was achieved by the model based on the Decision Tree algorithm in the distance education (Educação a Distância - EAD) modality and public administrative category.
publishDate 2024
dc.date.issued.fl_str_mv 2024-02-28
dc.date.accessioned.fl_str_mv 2025-06-16T19:51:56Z
dc.date.available.fl_str_mv 2025-06-16T19:51:56Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv JESUS, Jeferson Andrade de. Investigação da evasão estudantil por meio da mineração de dados e aprendizagem de máquina. 2024. 259 f. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Sergipe, São Cristóvão, 2024.
dc.identifier.uri.fl_str_mv https://ri.ufs.br/jspui/handle/riufs/22451
identifier_str_mv JESUS, Jeferson Andrade de. Investigação da evasão estudantil por meio da mineração de dados e aprendizagem de máquina. 2024. 259 f. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Sergipe, São Cristóvão, 2024.
url https://ri.ufs.br/jspui/handle/riufs/22451
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.program.fl_str_mv Pós-Graduação em Ciência da Computação
dc.publisher.initials.fl_str_mv Universidade Federal de Sergipe (UFS)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFS
instname:Universidade Federal de Sergipe (UFS)
instacron:UFS
instname_str Universidade Federal de Sergipe (UFS)
instacron_str UFS
institution UFS
reponame_str Repositório Institucional da UFS
collection Repositório Institucional da UFS
bitstream.url.fl_str_mv https://ri.ufs.br/jspui/bitstream/riufs/22451/1/license.txt
https://ri.ufs.br/jspui/bitstream/riufs/22451/2/JEFERSON_ANDRADE_JESUS.pdf
bitstream.checksum.fl_str_mv 098cbbf65c2c15e1fb2e49c5d306a44c
604b675f3305a3a9dfaa2a04cc074254
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFS - Universidade Federal de Sergipe (UFS)
repository.mail.fl_str_mv repositorio@academico.ufs.br
_version_ 1851759411951828992