Aprendizagem de máquina para predição do abandono e evasão dos estudantes do Estado do Ceará.

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: Teles, Igor Antônio Gomes
Orientador(a): Fernandes, Carlos Alexandre Rolim
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://www.repositorio.ufc.br/handle/riufc/73132
Resumo: Leaving and dropping out of school are frequent themes in Education. The numbers give an idea of the size of the problem. In 2018, around four out of ten 19-year-old Brazilians did not finish high school based on the Continuous National Household Sample Survey (PnadC), by IBGE. Dropout occurs when the student stops attending classes during the school year. School dropout, on the other hand, concerns the situation of the student who dropped out of school or failed in a given school year, and who in the following year did not enroll to continue his/her studies. The purpose of this project is to propose models for predicting dropout and dropout situations for students in the state of Ceará, using social databases, school performance and mothers' records in the CVLI and Maria da Penha databases. Another purpose of the work is to determine which factors have the most impact on evasion and abandonment. Longitudinal data from the years 2012 to 2019 of school data obtained from the School Census were used to verify the situation of students who dropped out or dropped out. In total, 4 databases were used: School Census, SPAECE, CVLI and Maria da Penha. The procedures were carried out through the Postgresql database management system, SPSS Software and Weka. After pre- processing, cleaning and applying filters, the data were used for machine training and prediction verification for decision-making about possible situations of evasion and abandonment. The Multilayer Perceptron (MLP), Support Vector Machine (SVM) and Random Forest classifiers were used, Correlation based feature selection - CFS was also applied to find the best attributes for the study, with performance in Portuguese and Mathematics, ethnicity being selected as attributes. , teaching stage and the indicator of the mother's presence in bases of violence. The respective accuracies of 83.9%, 78.24% and 71.4% were achieved, which concludes that the MLP classifier obtained the best result.
id UFC-7_dca15034f5860472ed86c13101d7b46e
oai_identifier_str oai:repositorio.ufc.br:riufc/73132
network_acronym_str UFC-7
network_name_str Repositório Institucional da Universidade Federal do Ceará (UFC)
repository_id_str
spelling Teles, Igor Antônio GomesBenevides, Alesandra de AraújoFernandes, Carlos Alexandre Rolim2023-06-27T14:57:46Z2023-06-27T14:57:46Z2023-01-27TELES, I. A. G. Aprendizagem de máquina para predição do abandono e evasão dos estudantes do Estado do Ceará.. 2023. 115f. – Dissertação (Mestrado em Engenharia Elétrica e de Computação) - Programa de Pós-graduação em Engenharia Elétrica e de Computação, Campus de Sobral, Universidade Federal do Ceará, 2023.http://www.repositorio.ufc.br/handle/riufc/73132Leaving and dropping out of school are frequent themes in Education. The numbers give an idea of the size of the problem. In 2018, around four out of ten 19-year-old Brazilians did not finish high school based on the Continuous National Household Sample Survey (PnadC), by IBGE. Dropout occurs when the student stops attending classes during the school year. School dropout, on the other hand, concerns the situation of the student who dropped out of school or failed in a given school year, and who in the following year did not enroll to continue his/her studies. The purpose of this project is to propose models for predicting dropout and dropout situations for students in the state of Ceará, using social databases, school performance and mothers' records in the CVLI and Maria da Penha databases. Another purpose of the work is to determine which factors have the most impact on evasion and abandonment. Longitudinal data from the years 2012 to 2019 of school data obtained from the School Census were used to verify the situation of students who dropped out or dropped out. In total, 4 databases were used: School Census, SPAECE, CVLI and Maria da Penha. The procedures were carried out through the Postgresql database management system, SPSS Software and Weka. After pre- processing, cleaning and applying filters, the data were used for machine training and prediction verification for decision-making about possible situations of evasion and abandonment. The Multilayer Perceptron (MLP), Support Vector Machine (SVM) and Random Forest classifiers were used, Correlation based feature selection - CFS was also applied to find the best attributes for the study, with performance in Portuguese and Mathematics, ethnicity being selected as attributes. , teaching stage and the indicator of the mother's presence in bases of violence. The respective accuracies of 83.9%, 78.24% and 71.4% were achieved, which concludes that the MLP classifier obtained the best result.O abandono e a evasão escolar são temas frequentes na Educação. Os números dão ideia do tamanho do problema. Em 2018, cerca de quatro em cada dez brasileiros de 19 anos não concluíram o Ensino Médio com base na Pesquisa Nacional por Amostra de Domicílios Contínua (PnadC), do IBGE. O abandono ocorre quando o aluno deixa de frequentar as aulas durante o ano letivo. Já a evasão escolar diz respeito à situação do aluno que abandonou a escola ou reprovou em determinado ano letivo, e que no ano seguinte não efetuou a matrícula para dar continuidade aos estudos. Dito isso, o propósito deste projeto é propor modelos de predição de situações de evasão e abandono para alunos do estado do Ceará, usando bases de dados sociais, de desempenho escolar e em registros das mães nas bases de dados CVLI e Maria da Penha. Outro propósito do trabalho é determinar quais fatores são os que mais impactam na evasão e abandono. Foram utilizados os dados longitudinais dos anos de 2012 a 2019 dos dados escolares obtidos do Censo Escolar para verificar a situação dos alunos que evadiram ou abandonaram. No total, foram usadas 4 bases de dados: Censo escolar, SPAECE, CVLI e Maria da Penha. Os procedimentos foram realizados através do sistema gerenciador de banco de dados Postgresql, Software SPSS e o Weka. Após o pré-processamento, limpeza e aplicação de filtros, os dados foram utilizados para treinamento da máquina e verificação de predição para tomadas de decisão acerca de possíveis situações de evasão e abandono. Foram utilizados os classificadores Multilayer Perceptron (MLP), Support Vector Machine (SVM) e Floresta aleatória, foi também aplicado Correlation based feature selection - CFS para encontrar os melhores atributos para o estudo, sendo selecionados como atributos o desempenho em português e matemática, etnia, etapa de ensino e o indicador da presença da mãe em bases de violência. Foram alcançadas as respectivas acuracias 83,9 %, 78,24% e 71,4 %, onde se conclui que o classificador MLP obteve o melhor resultado.Evasão EscolarViolênciaMachine LearningPrediçãoAprendizagem de máquina para predição do abandono e evasão dos estudantes do Estado do Ceará.Machine learning to predict dropout and evasion of students in the State of Cearáinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisporreponame:Repositório Institucional da Universidade Federal do Ceará (UFC)instname:Universidade Federal do Ceará (UFC)instacron:UFCinfo:eu-repo/semantics/openAccessORIGINAL2023_dis_iagteles.pdf2023_dis_iagteles.pdfTELES, I. A. G. Aprendizagem de máquina para predição do abandono e evasão dos estudantes do Estado do Ceará.. 2023. 115f. – Dissertação (Mestrado em Engenharia Elétrica e de Computação) - Programa de Pós-graduação em Engenharia Elétrica e de Computação, Campus de Sobral, Universidade Federal do Ceará, 2023.application/pdf46497011http://repositorio.ufc.br/bitstream/riufc/73132/1/2023_dis_iagteles.pdf7ba9fadd9361e96b18b742e200f440f4MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://repositorio.ufc.br/bitstream/riufc/73132/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52riufc/731322023-06-27 11:57:46.668oai:repositorio.ufc.br:riufc/73132Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttp://www.repositorio.ufc.br/ri-oai/requestbu@ufc.br || repositorio@ufc.bropendoar:2023-06-27T14:57:46Repositório Institucional da Universidade Federal do Ceará (UFC) - Universidade Federal do Ceará (UFC)false
dc.title.pt_BR.fl_str_mv Aprendizagem de máquina para predição do abandono e evasão dos estudantes do Estado do Ceará.
dc.title.en.pt_BR.fl_str_mv Machine learning to predict dropout and evasion of students in the State of Ceará
title Aprendizagem de máquina para predição do abandono e evasão dos estudantes do Estado do Ceará.
spellingShingle Aprendizagem de máquina para predição do abandono e evasão dos estudantes do Estado do Ceará.
Teles, Igor Antônio Gomes
Evasão Escolar
Violência
Machine Learning
Predição
title_short Aprendizagem de máquina para predição do abandono e evasão dos estudantes do Estado do Ceará.
title_full Aprendizagem de máquina para predição do abandono e evasão dos estudantes do Estado do Ceará.
title_fullStr Aprendizagem de máquina para predição do abandono e evasão dos estudantes do Estado do Ceará.
title_full_unstemmed Aprendizagem de máquina para predição do abandono e evasão dos estudantes do Estado do Ceará.
title_sort Aprendizagem de máquina para predição do abandono e evasão dos estudantes do Estado do Ceará.
author Teles, Igor Antônio Gomes
author_facet Teles, Igor Antônio Gomes
author_role author
dc.contributor.co-advisor.none.fl_str_mv Benevides, Alesandra de Araújo
dc.contributor.author.fl_str_mv Teles, Igor Antônio Gomes
dc.contributor.advisor1.fl_str_mv Fernandes, Carlos Alexandre Rolim
contributor_str_mv Fernandes, Carlos Alexandre Rolim
dc.subject.por.fl_str_mv Evasão Escolar
Violência
Machine Learning
Predição
topic Evasão Escolar
Violência
Machine Learning
Predição
description Leaving and dropping out of school are frequent themes in Education. The numbers give an idea of the size of the problem. In 2018, around four out of ten 19-year-old Brazilians did not finish high school based on the Continuous National Household Sample Survey (PnadC), by IBGE. Dropout occurs when the student stops attending classes during the school year. School dropout, on the other hand, concerns the situation of the student who dropped out of school or failed in a given school year, and who in the following year did not enroll to continue his/her studies. The purpose of this project is to propose models for predicting dropout and dropout situations for students in the state of Ceará, using social databases, school performance and mothers' records in the CVLI and Maria da Penha databases. Another purpose of the work is to determine which factors have the most impact on evasion and abandonment. Longitudinal data from the years 2012 to 2019 of school data obtained from the School Census were used to verify the situation of students who dropped out or dropped out. In total, 4 databases were used: School Census, SPAECE, CVLI and Maria da Penha. The procedures were carried out through the Postgresql database management system, SPSS Software and Weka. After pre- processing, cleaning and applying filters, the data were used for machine training and prediction verification for decision-making about possible situations of evasion and abandonment. The Multilayer Perceptron (MLP), Support Vector Machine (SVM) and Random Forest classifiers were used, Correlation based feature selection - CFS was also applied to find the best attributes for the study, with performance in Portuguese and Mathematics, ethnicity being selected as attributes. , teaching stage and the indicator of the mother's presence in bases of violence. The respective accuracies of 83.9%, 78.24% and 71.4% were achieved, which concludes that the MLP classifier obtained the best result.
publishDate 2023
dc.date.accessioned.fl_str_mv 2023-06-27T14:57:46Z
dc.date.available.fl_str_mv 2023-06-27T14:57:46Z
dc.date.issued.fl_str_mv 2023-01-27
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv TELES, I. A. G. Aprendizagem de máquina para predição do abandono e evasão dos estudantes do Estado do Ceará.. 2023. 115f. – Dissertação (Mestrado em Engenharia Elétrica e de Computação) - Programa de Pós-graduação em Engenharia Elétrica e de Computação, Campus de Sobral, Universidade Federal do Ceará, 2023.
dc.identifier.uri.fl_str_mv http://www.repositorio.ufc.br/handle/riufc/73132
identifier_str_mv TELES, I. A. G. Aprendizagem de máquina para predição do abandono e evasão dos estudantes do Estado do Ceará.. 2023. 115f. – Dissertação (Mestrado em Engenharia Elétrica e de Computação) - Programa de Pós-graduação em Engenharia Elétrica e de Computação, Campus de Sobral, Universidade Federal do Ceará, 2023.
url http://www.repositorio.ufc.br/handle/riufc/73132
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Institucional da Universidade Federal do Ceará (UFC)
instname:Universidade Federal do Ceará (UFC)
instacron:UFC
instname_str Universidade Federal do Ceará (UFC)
instacron_str UFC
institution UFC
reponame_str Repositório Institucional da Universidade Federal do Ceará (UFC)
collection Repositório Institucional da Universidade Federal do Ceará (UFC)
bitstream.url.fl_str_mv http://repositorio.ufc.br/bitstream/riufc/73132/1/2023_dis_iagteles.pdf
http://repositorio.ufc.br/bitstream/riufc/73132/2/license.txt
bitstream.checksum.fl_str_mv 7ba9fadd9361e96b18b742e200f440f4
8a4605be74aa9ea9d79846c1fba20a33
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da Universidade Federal do Ceará (UFC) - Universidade Federal do Ceará (UFC)
repository.mail.fl_str_mv bu@ufc.br || repositorio@ufc.br
_version_ 1847793302355574784