Implementação e avaliação de diferentes modelos de Machine Learning aplicados à predição de estudantes em risco de evasão estudantil em diferentes cursos do ensino superior
| Ano de defesa: | 2022 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| dARK ID: | ark:/74562/0013000007rsk |
| Idioma: | por |
| Instituição de defesa: |
Centro de Ciências Exatas e Naturais - CCEN
Brasil UFERSA Universidade Federal Rural do Semi-Árido Programa de Pós-Graduação em Ciência da Computação |
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://repositorio.ufersa.edu.br/handle/prefix/12033 |
Resumo: | Um dos maiores desafios da educação no Brasil é a evasão estudantil. A evasão estudantil é o ato de deixar de frequentar as aulas, abandonar o ensino em decorrência de um ou mais fatores. Esse problema afeta a qualidade de ensino, impactando os âmbitos econômicos e ambientais, refletindo negativamente no desenvolvimento social. Identificar as causas da evasão estudantil, bem como detectar previamente os perfis de estudantes considerados possíveis evasores em todos os níveis de ensino, tornou-se um tema de grande interesse e tem desencadeado pesquisas nacionais e internacionais. Para tanto, objetiva-se com este trabalho, desenvolver e avaliar modelos de Machine Learning capazes de realizar a predição, de forma precoce, de estudantes com alto risco de evasão estudantil, nos cursos de Ciência e Tecnologia, Engenharia Agrícola e Ambiental e Biotecnologia da Universidade Federal Rural do Semi-Árido. A abordagem foi validada, utilizando dados de ex-alunos dos cursos superiores de Ciência e Tecnologia, Engenharia Agrícola e Ambiental e Biotecnologia da Universidade Federal Rural do Semi-Árido. Neste trabalho foram utilizadas técnicas de classificação em modelos de Machine Learning. Na validação da abordagem foram empregados sete algoritmos: K-Nearest Neighbor, Naive Bayes, Decision Tree, Random Forest, Perceptron, Multilayer perceptron e Support vector machine, sendo que o modelo Support vector machine obteve os melhores resultados dentre as métricas: Accuracy, Precision, Recall e F1 Score. Em relação aos resultados, observou-se que: estudantes que não ingressaram na sua primeira opção de curso, têm uma maior probabilidade de evadir-se; estudantes que não possuem um conhecimento prévio na área do seu curso, têm uma maior probabilidade de evadir-se; o maior índice de evasão ocorre no primeiro ano de curso; estudantes que reprovam em uma ou mais disciplinas no primeiro ano de curso, têm uma maior probabilidade de evadir-se; estudantes do gênero feminino têm uma maior probabilidade de evadir-se; o mesmo modelo de Machine Learning pode ser aplicado para grupos de estudantes de diferentes cursos |
| id |
UFER_6af9d173290a348de190055041446601 |
|---|---|
| oai_identifier_str |
oai:repositorio.ufersa.edu.br:prefix/12033 |
| network_acronym_str |
UFER |
| network_name_str |
Repositório Digital da Universidade Federal Rural do Semi-Árido (RDU) |
| repository_id_str |
|
| spelling |
Implementação e avaliação de diferentes modelos de Machine Learning aplicados à predição de estudantes em risco de evasão estudantil em diferentes cursos do ensino superiorImplementation and evaluation of different Machine Learning models applied to predict students at risk of dropping out in different higher education coursesCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOevasão estudantilMachine Learningmodelos de classificaçãométricas de avaliação de algoritmosstudent dropoutMachine Learningclassification modelsalgorithm evaluation metricsUm dos maiores desafios da educação no Brasil é a evasão estudantil. A evasão estudantil é o ato de deixar de frequentar as aulas, abandonar o ensino em decorrência de um ou mais fatores. Esse problema afeta a qualidade de ensino, impactando os âmbitos econômicos e ambientais, refletindo negativamente no desenvolvimento social. Identificar as causas da evasão estudantil, bem como detectar previamente os perfis de estudantes considerados possíveis evasores em todos os níveis de ensino, tornou-se um tema de grande interesse e tem desencadeado pesquisas nacionais e internacionais. Para tanto, objetiva-se com este trabalho, desenvolver e avaliar modelos de Machine Learning capazes de realizar a predição, de forma precoce, de estudantes com alto risco de evasão estudantil, nos cursos de Ciência e Tecnologia, Engenharia Agrícola e Ambiental e Biotecnologia da Universidade Federal Rural do Semi-Árido. A abordagem foi validada, utilizando dados de ex-alunos dos cursos superiores de Ciência e Tecnologia, Engenharia Agrícola e Ambiental e Biotecnologia da Universidade Federal Rural do Semi-Árido. Neste trabalho foram utilizadas técnicas de classificação em modelos de Machine Learning. Na validação da abordagem foram empregados sete algoritmos: K-Nearest Neighbor, Naive Bayes, Decision Tree, Random Forest, Perceptron, Multilayer perceptron e Support vector machine, sendo que o modelo Support vector machine obteve os melhores resultados dentre as métricas: Accuracy, Precision, Recall e F1 Score. Em relação aos resultados, observou-se que: estudantes que não ingressaram na sua primeira opção de curso, têm uma maior probabilidade de evadir-se; estudantes que não possuem um conhecimento prévio na área do seu curso, têm uma maior probabilidade de evadir-se; o maior índice de evasão ocorre no primeiro ano de curso; estudantes que reprovam em uma ou mais disciplinas no primeiro ano de curso, têm uma maior probabilidade de evadir-se; estudantes do gênero feminino têm uma maior probabilidade de evadir-se; o mesmo modelo de Machine Learning pode ser aplicado para grupos de estudantes de diferentes cursosOne of the biggest challenges of education in Brazil is student dropout. Student evasion is the act of failing to attend classes, abandoning teaching as a result of one or more factors. This problem affects the quality of education, impacting the economic and environmental spheres, reflecting negatively on social development. Identifying the causes of student dropout, as well as previously detecting the profiles of students considered possible dropouts at all levels of education, has become a topic of great interest and has triggered national and international research. Therefore, the objective of this work is to develop and evaluate Machine Learning models capable of predicting, at an early stage, students at high risk of dropping out, in Science and Technology, Agricultural Engineering and Environment and Biotechnology at UFERSA. The approach has been validated, using data from former students of the Science and Technology, Agricultural and Environmental Engineering and Biotechnology courses at the Universidade Federal Rural do Semi-Árido. In this work, classification techniques were used in Machine Learning models. In the validation of the approach, seven Machine Learning algorithms were used: K-Nearest Neighbor, Naive Bayes, Decision Tree, Random Forest, Perceptron, Multilayer perceptron, and the Support vector machine model obtained the best results among the metrics Accuracy, Precision, Recall and F1 Score. Regarding the results, it was observed that: students who did not enter their first course option are more likely to drop out; students who do not have prior knowledge in the area of their course are more likely to drop out; the highest dropout rate occurs in the first year of the course; students who fail one or more subjects in the first year of the course are more likely to drop out; female students are more likely to drop out; the same Machine Learning model can be applied to groups of students from different courses145 p.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior – CAPESCentro de Ciências Exatas e Naturais - CCENBrasilUFERSAUniversidade Federal Rural do Semi-ÁridoPrograma de Pós-Graduação em Ciência da ComputaçãoQueiroz, Paulo Gabriel GadelhaCastro, Angélica Félix deQueiroz, Paulo Gabriel GadelhaSantos, Araken De MedeirosRodrigues, Kamila Rios da HoraNascimento , Fernanda Ferreira do2024-11-11T12:33:13Z2024-11-11T12:33:13Z2022-12-21info:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersionpdfapplication/pdfNASCIMENTO, Fernanda Ferreira do. Implementação e avaliação de diferentes modelos de Machine Learning aplicados à predição de estudantes em risco de evasão estudantil em diferentes cursos do ensino superior. 2022. 145 f. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal Rural do Semi-Árido. Mossoró-RN, 2022.https://repositorio.ufersa.edu.br/handle/prefix/12033ark:/74562/0013000007rskMossoróinfo:eu-repo/semantics/openAccessUFERSAAttribution-ShareAlike 3.0 Brazilhttp://creativecommons.org/licenses/by-sa/3.0/br/porreponame:Repositório Digital da Universidade Federal Rural do Semi-Árido (RDU)instname:Universidade Federal Rural do Semi-Árido (UFERSA)instacron:UFERSA2024-11-12T15:00:45Zoai:repositorio.ufersa.edu.br:prefix/12033Repositório Institucionalhttps://repositorio.ufersa.edu.br/PUBhttps://repositorio.ufersa.edu.br/server/oai/requestrepositorio@ufersa.edu.br || admrepositorio@ufersa.edu.bropendoar:2024-11-12T15:00:45Repositório Digital da Universidade Federal Rural do Semi-Árido (RDU) - Universidade Federal Rural do Semi-Árido (UFERSA)false |
| dc.title.none.fl_str_mv |
Implementação e avaliação de diferentes modelos de Machine Learning aplicados à predição de estudantes em risco de evasão estudantil em diferentes cursos do ensino superior Implementation and evaluation of different Machine Learning models applied to predict students at risk of dropping out in different higher education courses |
| title |
Implementação e avaliação de diferentes modelos de Machine Learning aplicados à predição de estudantes em risco de evasão estudantil em diferentes cursos do ensino superior |
| spellingShingle |
Implementação e avaliação de diferentes modelos de Machine Learning aplicados à predição de estudantes em risco de evasão estudantil em diferentes cursos do ensino superior Nascimento , Fernanda Ferreira do CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO evasão estudantil Machine Learning modelos de classificação métricas de avaliação de algoritmos student dropout Machine Learning classification models algorithm evaluation metrics |
| title_short |
Implementação e avaliação de diferentes modelos de Machine Learning aplicados à predição de estudantes em risco de evasão estudantil em diferentes cursos do ensino superior |
| title_full |
Implementação e avaliação de diferentes modelos de Machine Learning aplicados à predição de estudantes em risco de evasão estudantil em diferentes cursos do ensino superior |
| title_fullStr |
Implementação e avaliação de diferentes modelos de Machine Learning aplicados à predição de estudantes em risco de evasão estudantil em diferentes cursos do ensino superior |
| title_full_unstemmed |
Implementação e avaliação de diferentes modelos de Machine Learning aplicados à predição de estudantes em risco de evasão estudantil em diferentes cursos do ensino superior |
| title_sort |
Implementação e avaliação de diferentes modelos de Machine Learning aplicados à predição de estudantes em risco de evasão estudantil em diferentes cursos do ensino superior |
| author |
Nascimento , Fernanda Ferreira do |
| author_facet |
Nascimento , Fernanda Ferreira do |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Queiroz, Paulo Gabriel Gadelha Castro, Angélica Félix de Queiroz, Paulo Gabriel Gadelha Santos, Araken De Medeiros Rodrigues, Kamila Rios da Hora |
| dc.contributor.author.fl_str_mv |
Nascimento , Fernanda Ferreira do |
| dc.subject.por.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO evasão estudantil Machine Learning modelos de classificação métricas de avaliação de algoritmos student dropout Machine Learning classification models algorithm evaluation metrics |
| topic |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO evasão estudantil Machine Learning modelos de classificação métricas de avaliação de algoritmos student dropout Machine Learning classification models algorithm evaluation metrics |
| description |
Um dos maiores desafios da educação no Brasil é a evasão estudantil. A evasão estudantil é o ato de deixar de frequentar as aulas, abandonar o ensino em decorrência de um ou mais fatores. Esse problema afeta a qualidade de ensino, impactando os âmbitos econômicos e ambientais, refletindo negativamente no desenvolvimento social. Identificar as causas da evasão estudantil, bem como detectar previamente os perfis de estudantes considerados possíveis evasores em todos os níveis de ensino, tornou-se um tema de grande interesse e tem desencadeado pesquisas nacionais e internacionais. Para tanto, objetiva-se com este trabalho, desenvolver e avaliar modelos de Machine Learning capazes de realizar a predição, de forma precoce, de estudantes com alto risco de evasão estudantil, nos cursos de Ciência e Tecnologia, Engenharia Agrícola e Ambiental e Biotecnologia da Universidade Federal Rural do Semi-Árido. A abordagem foi validada, utilizando dados de ex-alunos dos cursos superiores de Ciência e Tecnologia, Engenharia Agrícola e Ambiental e Biotecnologia da Universidade Federal Rural do Semi-Árido. Neste trabalho foram utilizadas técnicas de classificação em modelos de Machine Learning. Na validação da abordagem foram empregados sete algoritmos: K-Nearest Neighbor, Naive Bayes, Decision Tree, Random Forest, Perceptron, Multilayer perceptron e Support vector machine, sendo que o modelo Support vector machine obteve os melhores resultados dentre as métricas: Accuracy, Precision, Recall e F1 Score. Em relação aos resultados, observou-se que: estudantes que não ingressaram na sua primeira opção de curso, têm uma maior probabilidade de evadir-se; estudantes que não possuem um conhecimento prévio na área do seu curso, têm uma maior probabilidade de evadir-se; o maior índice de evasão ocorre no primeiro ano de curso; estudantes que reprovam em uma ou mais disciplinas no primeiro ano de curso, têm uma maior probabilidade de evadir-se; estudantes do gênero feminino têm uma maior probabilidade de evadir-se; o mesmo modelo de Machine Learning pode ser aplicado para grupos de estudantes de diferentes cursos |
| publishDate |
2022 |
| dc.date.none.fl_str_mv |
2022-12-21 2024-11-11T12:33:13Z 2024-11-11T12:33:13Z |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
NASCIMENTO, Fernanda Ferreira do. Implementação e avaliação de diferentes modelos de Machine Learning aplicados à predição de estudantes em risco de evasão estudantil em diferentes cursos do ensino superior. 2022. 145 f. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal Rural do Semi-Árido. Mossoró-RN, 2022. https://repositorio.ufersa.edu.br/handle/prefix/12033 |
| dc.identifier.dark.fl_str_mv |
ark:/74562/0013000007rsk |
| identifier_str_mv |
NASCIMENTO, Fernanda Ferreira do. Implementação e avaliação de diferentes modelos de Machine Learning aplicados à predição de estudantes em risco de evasão estudantil em diferentes cursos do ensino superior. 2022. 145 f. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal Rural do Semi-Árido. Mossoró-RN, 2022. ark:/74562/0013000007rsk |
| url |
https://repositorio.ufersa.edu.br/handle/prefix/12033 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess UFERSA Attribution-ShareAlike 3.0 Brazil http://creativecommons.org/licenses/by-sa/3.0/br/ |
| eu_rights_str_mv |
openAccess |
| rights_invalid_str_mv |
UFERSA Attribution-ShareAlike 3.0 Brazil http://creativecommons.org/licenses/by-sa/3.0/br/ |
| dc.format.none.fl_str_mv |
pdf application/pdf |
| dc.coverage.none.fl_str_mv |
Mossoró |
| dc.publisher.none.fl_str_mv |
Centro de Ciências Exatas e Naturais - CCEN Brasil UFERSA Universidade Federal Rural do Semi-Árido Programa de Pós-Graduação em Ciência da Computação |
| publisher.none.fl_str_mv |
Centro de Ciências Exatas e Naturais - CCEN Brasil UFERSA Universidade Federal Rural do Semi-Árido Programa de Pós-Graduação em Ciência da Computação |
| dc.source.none.fl_str_mv |
reponame:Repositório Digital da Universidade Federal Rural do Semi-Árido (RDU) instname:Universidade Federal Rural do Semi-Árido (UFERSA) instacron:UFERSA |
| instname_str |
Universidade Federal Rural do Semi-Árido (UFERSA) |
| instacron_str |
UFERSA |
| institution |
UFERSA |
| reponame_str |
Repositório Digital da Universidade Federal Rural do Semi-Árido (RDU) |
| collection |
Repositório Digital da Universidade Federal Rural do Semi-Árido (RDU) |
| repository.name.fl_str_mv |
Repositório Digital da Universidade Federal Rural do Semi-Árido (RDU) - Universidade Federal Rural do Semi-Árido (UFERSA) |
| repository.mail.fl_str_mv |
repositorio@ufersa.edu.br || admrepositorio@ufersa.edu.br |
| _version_ |
1846631479349608448 |