Investigação da evasão estudantil por meio da mineração de dados e aprendizagem de máquina
| Ano de defesa: | 2024 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Não Informado pela instituição
|
| Programa de Pós-Graduação: |
Pós-Graduação em Ciência da Computação
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Palavras-chave em Inglês: | |
| Área do conhecimento CNPq: | |
| Link de acesso: | https://ri.ufs.br/jspui/handle/riufs/22451 |
Resumo: | A student dropout is a recurring problem in both schools and universities, posing detrimental effects on students’ learning experiences and causing financial losses for institutions, whether public or private. Studies employing data mining (DM) and machine learning (ML) techniques to investigate educational issues are on the rise, and student dropout is one such problem. Through these techniques, it becomes possible to identify patterns in individuals or groups that may be prone to discontinuing their studies. Predictions and insights gained through DM and ML techniques can aid in reducing student dropout rates by providing a better understanding of the phenomenon, thereby informing decision-making and problem resolution. This study aims to investigate university dropout using data from the Higher Education Census obtained from the INEP portal. It analyzes the classification of university student dropout using classical algorithms in building classification models. The investigation reveals that, based on the 2016 Census, 30% of university students end up abandoning their enrolled courses or discontinuing higher education altogether. Additionally, it highlights that existing studies utilizing dropout classifiers lack a standardized set of attributes for constructing their models, making it challenging to apply these models across different institutions. To address these issues, the study employs INEP data in constructing classification models during the experiments. The best result, with an accuracy metric of 0.979, was achieved by the model based on the Decision Tree algorithm in the distance education (Educação a Distância - EAD) modality and public administrative category. |
| id |
UFS-2_b373b2ca1674f70c6fe16b06414c4fc5 |
|---|---|
| oai_identifier_str |
oai:oai:ri.ufs.br:repo_01:riufs/22451 |
| network_acronym_str |
UFS-2 |
| network_name_str |
Repositório Institucional da UFS |
| repository_id_str |
|
| spelling |
Jesus, Jeferson Andrade deGusmão, Renê Pereira de2025-06-16T19:51:56Z2025-06-16T19:51:56Z2024-02-28JESUS, Jeferson Andrade de. Investigação da evasão estudantil por meio da mineração de dados e aprendizagem de máquina. 2024. 259 f. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Sergipe, São Cristóvão, 2024.https://ri.ufs.br/jspui/handle/riufs/22451A student dropout is a recurring problem in both schools and universities, posing detrimental effects on students’ learning experiences and causing financial losses for institutions, whether public or private. Studies employing data mining (DM) and machine learning (ML) techniques to investigate educational issues are on the rise, and student dropout is one such problem. Through these techniques, it becomes possible to identify patterns in individuals or groups that may be prone to discontinuing their studies. Predictions and insights gained through DM and ML techniques can aid in reducing student dropout rates by providing a better understanding of the phenomenon, thereby informing decision-making and problem resolution. This study aims to investigate university dropout using data from the Higher Education Census obtained from the INEP portal. It analyzes the classification of university student dropout using classical algorithms in building classification models. The investigation reveals that, based on the 2016 Census, 30% of university students end up abandoning their enrolled courses or discontinuing higher education altogether. Additionally, it highlights that existing studies utilizing dropout classifiers lack a standardized set of attributes for constructing their models, making it challenging to apply these models across different institutions. To address these issues, the study employs INEP data in constructing classification models during the experiments. The best result, with an accuracy metric of 0.979, was achieved by the model based on the Decision Tree algorithm in the distance education (Educação a Distância - EAD) modality and public administrative category.A evasão dos alunos nas escolas e universidades é um problema recorrente na educação, tanto é danoso para o aluno em termos de aprendizagem, como gera prejuízos financeiros para as instituições, sejam públicas ou privadas. Estudos que usam técnicas de Mineração de Dados (MD) e Aprendizagem de Máquina (AM) para investigar problemas na educação estão em ascensão, e a evasão estudantil é um desses problemas, por meio dessas técnicas é possível identificar padrões em indivíduos ou grupos de indivíduos que possam vir a desistir dos estudos. Com essas predições e outras informações exploradas pelas técnicas de MD e AM é possível diminuir a evasão dos alunos nas instituições de ensino, pois, o estudo ajuda a entender melhor o fenômeno e a partir disso verificar ações que ajudam na tomada de decisão e consequentemente na resolução do problema. Esse trabalho tem como objetivo investigar a evasão universitária através de dados do Censo da Educação Superior obtidos no portal do Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP) e analisar a classificação de evasão de alunos do ensino superior utilizando algoritmos clássicos na construção dos modelos de classificação. A investigação mostra que com base no Censo de 2016, 30% dos alunos do ensino superior chegam a desistir do curso ao qual ingressou ou a desistir do ensino superior, também é possível evidenciar que todos os estudos que utiliza classificadores de evasão estudantil como uma maneira de minimizar esse problema não utilizam conjuntos de dados com os mesmos atributos utilizados por outras instituições na construção dos seus modelos, de maneira que não é possível reaproveitar esses modelos para outras instituições. Considerando essas informações foram utilizados os dados do INEP na construção dos modelos de classificação construídos nos experimentos deste trabalho, tendo como melhor resultado para a métrica de acurácia: 0.979, resultado obtido pelo modelo baseado no algoritmo Árvore de Decisão, na modalidade Educação a Distância (EAD) e categoria administrativa pública.São CristóvãoporPrediçãoClassificaçãoEvasão do estudanteAprendizagem de máquinaMineração de dadosPredictionClassificationStudent dropoutMachine learningData miningCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOInvestigação da evasão estudantil por meio da mineração de dados e aprendizagem de máquinainfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisPós-Graduação em Ciência da ComputaçãoUniversidade Federal de Sergipe (UFS)reponame:Repositório Institucional da UFSinstname:Universidade Federal de Sergipe (UFS)instacron:UFSinfo:eu-repo/semantics/openAccessLICENSElicense.txtlicense.txttext/plain; charset=utf-81475https://ri.ufs.br/jspui/bitstream/riufs/22451/1/license.txt098cbbf65c2c15e1fb2e49c5d306a44cMD51ORIGINALJEFERSON_ANDRADE_JESUS.pdfJEFERSON_ANDRADE_JESUS.pdfapplication/pdf3173055https://ri.ufs.br/jspui/bitstream/riufs/22451/2/JEFERSON_ANDRADE_JESUS.pdf604b675f3305a3a9dfaa2a04cc074254MD52riufs/224512025-06-16 16:52:01.467oai:oai:ri.ufs.br:repo_01:riufs/22451TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvcihlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBTZXJnaXBlIG8gZGlyZWl0byBuw6NvLWV4Y2x1c2l2byBkZSByZXByb2R1emlyIHNldSB0cmFiYWxobyBubyBmb3JtYXRvIGVsZXRyw7RuaWNvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mgw6F1ZGlvIG91IHbDrWRlby4KClZvY8OqIGNvbmNvcmRhIHF1ZSBhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIFNlcmdpcGUgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIHRyYW5zcG9yIHNldSB0cmFiYWxobyBwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byBwYXJhIGZpbnMgZGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIHRhbWLDqW0gY29uY29yZGEgcXVlIGEgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgU2VyZ2lwZSBwb2RlIG1hbnRlciBtYWlzIGRlIHVtYSBjw7NwaWEgZGUgc2V1IHRyYWJhbGhvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIHNldSB0cmFiYWxobyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gVm9jw6ogdGFtYsOpbSBkZWNsYXJhIHF1ZSBvIGRlcMOzc2l0bywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgbsOjbyBpbmZyaW5nZSBkaXJlaXRvcyBhdXRvcmFpcyBkZSBuaW5ndcOpbS4KCkNhc28gbyB0cmFiYWxobyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgw6AgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgU2VyZ2lwZSBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvLgoKQSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBTZXJnaXBlIHNlIGNvbXByb21ldGUgYSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8gc2V1IG5vbWUocykgb3UgbyhzKSBub21lKHMpIGRvKHMpIApkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRvIHRyYWJhbGhvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzIGNvbmNlZGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EuIAo=Repositório InstitucionalPUBhttps://ri.ufs.br/oai/requestrepositorio@academico.ufs.bropendoar:2025-06-16T19:52:01Repositório Institucional da UFS - Universidade Federal de Sergipe (UFS)false |
| dc.title.pt_BR.fl_str_mv |
Investigação da evasão estudantil por meio da mineração de dados e aprendizagem de máquina |
| title |
Investigação da evasão estudantil por meio da mineração de dados e aprendizagem de máquina |
| spellingShingle |
Investigação da evasão estudantil por meio da mineração de dados e aprendizagem de máquina Jesus, Jeferson Andrade de Predição Classificação Evasão do estudante Aprendizagem de máquina Mineração de dados Prediction Classification Student dropout Machine learning Data mining CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| title_short |
Investigação da evasão estudantil por meio da mineração de dados e aprendizagem de máquina |
| title_full |
Investigação da evasão estudantil por meio da mineração de dados e aprendizagem de máquina |
| title_fullStr |
Investigação da evasão estudantil por meio da mineração de dados e aprendizagem de máquina |
| title_full_unstemmed |
Investigação da evasão estudantil por meio da mineração de dados e aprendizagem de máquina |
| title_sort |
Investigação da evasão estudantil por meio da mineração de dados e aprendizagem de máquina |
| author |
Jesus, Jeferson Andrade de |
| author_facet |
Jesus, Jeferson Andrade de |
| author_role |
author |
| dc.contributor.author.fl_str_mv |
Jesus, Jeferson Andrade de |
| dc.contributor.advisor1.fl_str_mv |
Gusmão, Renê Pereira de |
| contributor_str_mv |
Gusmão, Renê Pereira de |
| dc.subject.por.fl_str_mv |
Predição Classificação Evasão do estudante Aprendizagem de máquina Mineração de dados |
| topic |
Predição Classificação Evasão do estudante Aprendizagem de máquina Mineração de dados Prediction Classification Student dropout Machine learning Data mining CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| dc.subject.eng.fl_str_mv |
Prediction Classification Student dropout Machine learning Data mining |
| dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| description |
A student dropout is a recurring problem in both schools and universities, posing detrimental effects on students’ learning experiences and causing financial losses for institutions, whether public or private. Studies employing data mining (DM) and machine learning (ML) techniques to investigate educational issues are on the rise, and student dropout is one such problem. Through these techniques, it becomes possible to identify patterns in individuals or groups that may be prone to discontinuing their studies. Predictions and insights gained through DM and ML techniques can aid in reducing student dropout rates by providing a better understanding of the phenomenon, thereby informing decision-making and problem resolution. This study aims to investigate university dropout using data from the Higher Education Census obtained from the INEP portal. It analyzes the classification of university student dropout using classical algorithms in building classification models. The investigation reveals that, based on the 2016 Census, 30% of university students end up abandoning their enrolled courses or discontinuing higher education altogether. Additionally, it highlights that existing studies utilizing dropout classifiers lack a standardized set of attributes for constructing their models, making it challenging to apply these models across different institutions. To address these issues, the study employs INEP data in constructing classification models during the experiments. The best result, with an accuracy metric of 0.979, was achieved by the model based on the Decision Tree algorithm in the distance education (Educação a Distância - EAD) modality and public administrative category. |
| publishDate |
2024 |
| dc.date.issued.fl_str_mv |
2024-02-28 |
| dc.date.accessioned.fl_str_mv |
2025-06-16T19:51:56Z |
| dc.date.available.fl_str_mv |
2025-06-16T19:51:56Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
JESUS, Jeferson Andrade de. Investigação da evasão estudantil por meio da mineração de dados e aprendizagem de máquina. 2024. 259 f. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Sergipe, São Cristóvão, 2024. |
| dc.identifier.uri.fl_str_mv |
https://ri.ufs.br/jspui/handle/riufs/22451 |
| identifier_str_mv |
JESUS, Jeferson Andrade de. Investigação da evasão estudantil por meio da mineração de dados e aprendizagem de máquina. 2024. 259 f. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Sergipe, São Cristóvão, 2024. |
| url |
https://ri.ufs.br/jspui/handle/riufs/22451 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.publisher.program.fl_str_mv |
Pós-Graduação em Ciência da Computação |
| dc.publisher.initials.fl_str_mv |
Universidade Federal de Sergipe (UFS) |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFS instname:Universidade Federal de Sergipe (UFS) instacron:UFS |
| instname_str |
Universidade Federal de Sergipe (UFS) |
| instacron_str |
UFS |
| institution |
UFS |
| reponame_str |
Repositório Institucional da UFS |
| collection |
Repositório Institucional da UFS |
| bitstream.url.fl_str_mv |
https://ri.ufs.br/jspui/bitstream/riufs/22451/1/license.txt https://ri.ufs.br/jspui/bitstream/riufs/22451/2/JEFERSON_ANDRADE_JESUS.pdf |
| bitstream.checksum.fl_str_mv |
098cbbf65c2c15e1fb2e49c5d306a44c 604b675f3305a3a9dfaa2a04cc074254 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFS - Universidade Federal de Sergipe (UFS) |
| repository.mail.fl_str_mv |
repositorio@academico.ufs.br |
| _version_ |
1851759411951828992 |