Aprendizagem de máquina para predição do abandono e evasão dos estudantes do Estado do Ceará.
| Ano de defesa: | 2023 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Não Informado pela instituição
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | http://www.repositorio.ufc.br/handle/riufc/73132 |
Resumo: | Leaving and dropping out of school are frequent themes in Education. The numbers give an idea of the size of the problem. In 2018, around four out of ten 19-year-old Brazilians did not finish high school based on the Continuous National Household Sample Survey (PnadC), by IBGE. Dropout occurs when the student stops attending classes during the school year. School dropout, on the other hand, concerns the situation of the student who dropped out of school or failed in a given school year, and who in the following year did not enroll to continue his/her studies. The purpose of this project is to propose models for predicting dropout and dropout situations for students in the state of Ceará, using social databases, school performance and mothers' records in the CVLI and Maria da Penha databases. Another purpose of the work is to determine which factors have the most impact on evasion and abandonment. Longitudinal data from the years 2012 to 2019 of school data obtained from the School Census were used to verify the situation of students who dropped out or dropped out. In total, 4 databases were used: School Census, SPAECE, CVLI and Maria da Penha. The procedures were carried out through the Postgresql database management system, SPSS Software and Weka. After pre- processing, cleaning and applying filters, the data were used for machine training and prediction verification for decision-making about possible situations of evasion and abandonment. The Multilayer Perceptron (MLP), Support Vector Machine (SVM) and Random Forest classifiers were used, Correlation based feature selection - CFS was also applied to find the best attributes for the study, with performance in Portuguese and Mathematics, ethnicity being selected as attributes. , teaching stage and the indicator of the mother's presence in bases of violence. The respective accuracies of 83.9%, 78.24% and 71.4% were achieved, which concludes that the MLP classifier obtained the best result. |
| id |
UFC-7_dca15034f5860472ed86c13101d7b46e |
|---|---|
| oai_identifier_str |
oai:repositorio.ufc.br:riufc/73132 |
| network_acronym_str |
UFC-7 |
| network_name_str |
Repositório Institucional da Universidade Federal do Ceará (UFC) |
| repository_id_str |
|
| spelling |
Teles, Igor Antônio GomesBenevides, Alesandra de AraújoFernandes, Carlos Alexandre Rolim2023-06-27T14:57:46Z2023-06-27T14:57:46Z2023-01-27TELES, I. A. G. Aprendizagem de máquina para predição do abandono e evasão dos estudantes do Estado do Ceará.. 2023. 115f. – Dissertação (Mestrado em Engenharia Elétrica e de Computação) - Programa de Pós-graduação em Engenharia Elétrica e de Computação, Campus de Sobral, Universidade Federal do Ceará, 2023.http://www.repositorio.ufc.br/handle/riufc/73132Leaving and dropping out of school are frequent themes in Education. The numbers give an idea of the size of the problem. In 2018, around four out of ten 19-year-old Brazilians did not finish high school based on the Continuous National Household Sample Survey (PnadC), by IBGE. Dropout occurs when the student stops attending classes during the school year. School dropout, on the other hand, concerns the situation of the student who dropped out of school or failed in a given school year, and who in the following year did not enroll to continue his/her studies. The purpose of this project is to propose models for predicting dropout and dropout situations for students in the state of Ceará, using social databases, school performance and mothers' records in the CVLI and Maria da Penha databases. Another purpose of the work is to determine which factors have the most impact on evasion and abandonment. Longitudinal data from the years 2012 to 2019 of school data obtained from the School Census were used to verify the situation of students who dropped out or dropped out. In total, 4 databases were used: School Census, SPAECE, CVLI and Maria da Penha. The procedures were carried out through the Postgresql database management system, SPSS Software and Weka. After pre- processing, cleaning and applying filters, the data were used for machine training and prediction verification for decision-making about possible situations of evasion and abandonment. The Multilayer Perceptron (MLP), Support Vector Machine (SVM) and Random Forest classifiers were used, Correlation based feature selection - CFS was also applied to find the best attributes for the study, with performance in Portuguese and Mathematics, ethnicity being selected as attributes. , teaching stage and the indicator of the mother's presence in bases of violence. The respective accuracies of 83.9%, 78.24% and 71.4% were achieved, which concludes that the MLP classifier obtained the best result.O abandono e a evasão escolar são temas frequentes na Educação. Os números dão ideia do tamanho do problema. Em 2018, cerca de quatro em cada dez brasileiros de 19 anos não concluíram o Ensino Médio com base na Pesquisa Nacional por Amostra de Domicílios Contínua (PnadC), do IBGE. O abandono ocorre quando o aluno deixa de frequentar as aulas durante o ano letivo. Já a evasão escolar diz respeito à situação do aluno que abandonou a escola ou reprovou em determinado ano letivo, e que no ano seguinte não efetuou a matrícula para dar continuidade aos estudos. Dito isso, o propósito deste projeto é propor modelos de predição de situações de evasão e abandono para alunos do estado do Ceará, usando bases de dados sociais, de desempenho escolar e em registros das mães nas bases de dados CVLI e Maria da Penha. Outro propósito do trabalho é determinar quais fatores são os que mais impactam na evasão e abandono. Foram utilizados os dados longitudinais dos anos de 2012 a 2019 dos dados escolares obtidos do Censo Escolar para verificar a situação dos alunos que evadiram ou abandonaram. No total, foram usadas 4 bases de dados: Censo escolar, SPAECE, CVLI e Maria da Penha. Os procedimentos foram realizados através do sistema gerenciador de banco de dados Postgresql, Software SPSS e o Weka. Após o pré-processamento, limpeza e aplicação de filtros, os dados foram utilizados para treinamento da máquina e verificação de predição para tomadas de decisão acerca de possíveis situações de evasão e abandono. Foram utilizados os classificadores Multilayer Perceptron (MLP), Support Vector Machine (SVM) e Floresta aleatória, foi também aplicado Correlation based feature selection - CFS para encontrar os melhores atributos para o estudo, sendo selecionados como atributos o desempenho em português e matemática, etnia, etapa de ensino e o indicador da presença da mãe em bases de violência. Foram alcançadas as respectivas acuracias 83,9 %, 78,24% e 71,4 %, onde se conclui que o classificador MLP obteve o melhor resultado.Evasão EscolarViolênciaMachine LearningPrediçãoAprendizagem de máquina para predição do abandono e evasão dos estudantes do Estado do Ceará.Machine learning to predict dropout and evasion of students in the State of Cearáinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisporreponame:Repositório Institucional da Universidade Federal do Ceará (UFC)instname:Universidade Federal do Ceará (UFC)instacron:UFCinfo:eu-repo/semantics/openAccessORIGINAL2023_dis_iagteles.pdf2023_dis_iagteles.pdfTELES, I. A. G. Aprendizagem de máquina para predição do abandono e evasão dos estudantes do Estado do Ceará.. 2023. 115f. – Dissertação (Mestrado em Engenharia Elétrica e de Computação) - Programa de Pós-graduação em Engenharia Elétrica e de Computação, Campus de Sobral, Universidade Federal do Ceará, 2023.application/pdf46497011http://repositorio.ufc.br/bitstream/riufc/73132/1/2023_dis_iagteles.pdf7ba9fadd9361e96b18b742e200f440f4MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81748http://repositorio.ufc.br/bitstream/riufc/73132/2/license.txt8a4605be74aa9ea9d79846c1fba20a33MD52riufc/731322023-06-27 11:57:46.668oai:repositorio.ufc.br:riufc/73132Tk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=Repositório InstitucionalPUBhttp://www.repositorio.ufc.br/ri-oai/requestbu@ufc.br || repositorio@ufc.bropendoar:2023-06-27T14:57:46Repositório Institucional da Universidade Federal do Ceará (UFC) - Universidade Federal do Ceará (UFC)false |
| dc.title.pt_BR.fl_str_mv |
Aprendizagem de máquina para predição do abandono e evasão dos estudantes do Estado do Ceará. |
| dc.title.en.pt_BR.fl_str_mv |
Machine learning to predict dropout and evasion of students in the State of Ceará |
| title |
Aprendizagem de máquina para predição do abandono e evasão dos estudantes do Estado do Ceará. |
| spellingShingle |
Aprendizagem de máquina para predição do abandono e evasão dos estudantes do Estado do Ceará. Teles, Igor Antônio Gomes Evasão Escolar Violência Machine Learning Predição |
| title_short |
Aprendizagem de máquina para predição do abandono e evasão dos estudantes do Estado do Ceará. |
| title_full |
Aprendizagem de máquina para predição do abandono e evasão dos estudantes do Estado do Ceará. |
| title_fullStr |
Aprendizagem de máquina para predição do abandono e evasão dos estudantes do Estado do Ceará. |
| title_full_unstemmed |
Aprendizagem de máquina para predição do abandono e evasão dos estudantes do Estado do Ceará. |
| title_sort |
Aprendizagem de máquina para predição do abandono e evasão dos estudantes do Estado do Ceará. |
| author |
Teles, Igor Antônio Gomes |
| author_facet |
Teles, Igor Antônio Gomes |
| author_role |
author |
| dc.contributor.co-advisor.none.fl_str_mv |
Benevides, Alesandra de Araújo |
| dc.contributor.author.fl_str_mv |
Teles, Igor Antônio Gomes |
| dc.contributor.advisor1.fl_str_mv |
Fernandes, Carlos Alexandre Rolim |
| contributor_str_mv |
Fernandes, Carlos Alexandre Rolim |
| dc.subject.por.fl_str_mv |
Evasão Escolar Violência Machine Learning Predição |
| topic |
Evasão Escolar Violência Machine Learning Predição |
| description |
Leaving and dropping out of school are frequent themes in Education. The numbers give an idea of the size of the problem. In 2018, around four out of ten 19-year-old Brazilians did not finish high school based on the Continuous National Household Sample Survey (PnadC), by IBGE. Dropout occurs when the student stops attending classes during the school year. School dropout, on the other hand, concerns the situation of the student who dropped out of school or failed in a given school year, and who in the following year did not enroll to continue his/her studies. The purpose of this project is to propose models for predicting dropout and dropout situations for students in the state of Ceará, using social databases, school performance and mothers' records in the CVLI and Maria da Penha databases. Another purpose of the work is to determine which factors have the most impact on evasion and abandonment. Longitudinal data from the years 2012 to 2019 of school data obtained from the School Census were used to verify the situation of students who dropped out or dropped out. In total, 4 databases were used: School Census, SPAECE, CVLI and Maria da Penha. The procedures were carried out through the Postgresql database management system, SPSS Software and Weka. After pre- processing, cleaning and applying filters, the data were used for machine training and prediction verification for decision-making about possible situations of evasion and abandonment. The Multilayer Perceptron (MLP), Support Vector Machine (SVM) and Random Forest classifiers were used, Correlation based feature selection - CFS was also applied to find the best attributes for the study, with performance in Portuguese and Mathematics, ethnicity being selected as attributes. , teaching stage and the indicator of the mother's presence in bases of violence. The respective accuracies of 83.9%, 78.24% and 71.4% were achieved, which concludes that the MLP classifier obtained the best result. |
| publishDate |
2023 |
| dc.date.accessioned.fl_str_mv |
2023-06-27T14:57:46Z |
| dc.date.available.fl_str_mv |
2023-06-27T14:57:46Z |
| dc.date.issued.fl_str_mv |
2023-01-27 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
TELES, I. A. G. Aprendizagem de máquina para predição do abandono e evasão dos estudantes do Estado do Ceará.. 2023. 115f. – Dissertação (Mestrado em Engenharia Elétrica e de Computação) - Programa de Pós-graduação em Engenharia Elétrica e de Computação, Campus de Sobral, Universidade Federal do Ceará, 2023. |
| dc.identifier.uri.fl_str_mv |
http://www.repositorio.ufc.br/handle/riufc/73132 |
| identifier_str_mv |
TELES, I. A. G. Aprendizagem de máquina para predição do abandono e evasão dos estudantes do Estado do Ceará.. 2023. 115f. – Dissertação (Mestrado em Engenharia Elétrica e de Computação) - Programa de Pós-graduação em Engenharia Elétrica e de Computação, Campus de Sobral, Universidade Federal do Ceará, 2023. |
| url |
http://www.repositorio.ufc.br/handle/riufc/73132 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Universidade Federal do Ceará (UFC) instname:Universidade Federal do Ceará (UFC) instacron:UFC |
| instname_str |
Universidade Federal do Ceará (UFC) |
| instacron_str |
UFC |
| institution |
UFC |
| reponame_str |
Repositório Institucional da Universidade Federal do Ceará (UFC) |
| collection |
Repositório Institucional da Universidade Federal do Ceará (UFC) |
| bitstream.url.fl_str_mv |
http://repositorio.ufc.br/bitstream/riufc/73132/1/2023_dis_iagteles.pdf http://repositorio.ufc.br/bitstream/riufc/73132/2/license.txt |
| bitstream.checksum.fl_str_mv |
7ba9fadd9361e96b18b742e200f440f4 8a4605be74aa9ea9d79846c1fba20a33 |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da Universidade Federal do Ceará (UFC) - Universidade Federal do Ceará (UFC) |
| repository.mail.fl_str_mv |
bu@ufc.br || repositorio@ufc.br |
| _version_ |
1847793302355574784 |