Um processo orientado a dados para geração de modelo de predição de evasão escolar

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Barros, Thiago Medeiros
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal do Rio Grande do Norte
Brasil
UFRN
PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.ufrn.br/handle/123456789/31933
Resumo: School dropout is an extremely complex problem, as it involves not only a variety of perspectives, but also a variety of different types of dropout behavior. Historically, the most cited school dropout models had their origin in education, however the emerging area of Data Science applied in Education is capable of developing new predictive models, with generally better results when compared to the most used traditional statistical methods. The main objective of this thesis is the proposition of a process for the generation of a predictive school dropout model based on Data Science. To this end, a sequence of steps is defined in order to model an information flow from problem definition to generation of useful information for managers and teachers. The steps consist of: Understanding the Problem, Understanding the Data, Feature Engineering, Feature Selection, Data Balancing, Models, Evaluation and Interpretation. The proposal’s contribution is found in the indication of which techniques and algorithms should be used in each phase of knowledge discovery, and show that the phenomenon of school dropout must be addressed as a problem of imbalanced classes, and should be approached with appropriate tools and metrics, in order to generate a robust and easy to interpret prediction model. The proposed process was validated on educational and socioeconomic data of students Federal Institute of Rio Grande do Norte (IFRN).
id UFRN_46c177dbd58ef986ae376992c6430529
oai_identifier_str oai:repositorio.ufrn.br:123456789/31933
network_acronym_str UFRN
network_name_str Repositório Institucional da UFRN
repository_id_str
spelling Um processo orientado a dados para geração de modelo de predição de evasão escolarMineração de dados educacionaisEvasãoModelo preditivoClasses desbalanceadasSchool dropout is an extremely complex problem, as it involves not only a variety of perspectives, but also a variety of different types of dropout behavior. Historically, the most cited school dropout models had their origin in education, however the emerging area of Data Science applied in Education is capable of developing new predictive models, with generally better results when compared to the most used traditional statistical methods. The main objective of this thesis is the proposition of a process for the generation of a predictive school dropout model based on Data Science. To this end, a sequence of steps is defined in order to model an information flow from problem definition to generation of useful information for managers and teachers. The steps consist of: Understanding the Problem, Understanding the Data, Feature Engineering, Feature Selection, Data Balancing, Models, Evaluation and Interpretation. The proposal’s contribution is found in the indication of which techniques and algorithms should be used in each phase of knowledge discovery, and show that the phenomenon of school dropout must be addressed as a problem of imbalanced classes, and should be approached with appropriate tools and metrics, in order to generate a robust and easy to interpret prediction model. The proposed process was validated on educational and socioeconomic data of students Federal Institute of Rio Grande do Norte (IFRN).A evasão escolar, também conhecida como abandono escolar, é um problema extremamente complexo, pois envolve não apenas uma variedade de perspectivas, mas também uma variedade de diferentes tipos de comportamento de abandono. Historicamente, os modelos de evasão escolar mais citados tiveram sua origem na educação, entretanto a emergente área de Ciência de Dados aplicada na Educação é capaz de desenvolver novos modelos preditivos, com resultados geralmente melhores quando comparados com os métodos estatísticos tradicionais. O principal objetivo dessa tese é a proposição de um processo para geração de um modelo preditivo de evasão escolar baseada em Ciências de Dados. Para tal, uma sequência de etapas é definida, a fim de modelar um fluxo de informação, desde a definição do problema até a geração de informação útil a gestores e professores. As etapas são compostas por: "Entender o Problema", "Entender os Dados", "Engenharia de Atributos", "Seleção de Atributos", "Balanceamento de Dados", "Modelos", "Avaliação"e "Interpretação". A contribuição da proposta se encontra na indicação de quais técnicas e algoritmos devem ser empregados em cada etapa do processo apresentado, e na exposição de que o fenômeno de evasão escolar deve ser abordado como um problema de classes desbalanceadas, a qual deve utilizar-se de ferramentas e métricas apropriadas, a fim de gerar um modelo de predição robusto e de fácil interpretação. O processo proposto foi validado sobre dados educacionais, socioeconômicos e demográficos de alunos de cursos integrados do Instituto Federal do Rio Grande do Norte (IFRN).Universidade Federal do Rio Grande do NorteBrasilUFRNPROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃOOliveira, Luiz Affonso Henderson Guedes dehttp://lattes.cnpq.br/3844440611390386http://lattes.cnpq.br/7987212907837941Silva, Ivanovitch Medeiros Dantas dahttp://lattes.cnpq.br/3608440944832201Ramalho, Betânia Leitehttp://lattes.cnpq.br/1326690619078211Ferreira Filho, Raymundo Carlos Machadohttp://lattes.cnpq.br/1297246206844791Souza Neto, Plácido Antônio dehttp://lattes.cnpq.br/3641504724164977Barros, Thiago Medeiros2021-03-17T23:53:23Z2021-03-17T23:53:23Z2020-10-22info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfBARROS, Thiago Medeiros. Um processo orientado a dados para geração de modelo de predição de evasão escolar. 2020. 116f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2020.https://repositorio.ufrn.br/handle/123456789/31933info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRN2021-03-21T08:48:20Zoai:repositorio.ufrn.br:123456789/31933Repositório InstitucionalPUBhttp://repositorio.ufrn.br/oai/repositorio@bczm.ufrn.bropendoar:2021-03-21T08:48:20Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false
dc.title.none.fl_str_mv Um processo orientado a dados para geração de modelo de predição de evasão escolar
title Um processo orientado a dados para geração de modelo de predição de evasão escolar
spellingShingle Um processo orientado a dados para geração de modelo de predição de evasão escolar
Barros, Thiago Medeiros
Mineração de dados educacionais
Evasão
Modelo preditivo
Classes desbalanceadas
title_short Um processo orientado a dados para geração de modelo de predição de evasão escolar
title_full Um processo orientado a dados para geração de modelo de predição de evasão escolar
title_fullStr Um processo orientado a dados para geração de modelo de predição de evasão escolar
title_full_unstemmed Um processo orientado a dados para geração de modelo de predição de evasão escolar
title_sort Um processo orientado a dados para geração de modelo de predição de evasão escolar
author Barros, Thiago Medeiros
author_facet Barros, Thiago Medeiros
author_role author
dc.contributor.none.fl_str_mv Oliveira, Luiz Affonso Henderson Guedes de

http://lattes.cnpq.br/3844440611390386

http://lattes.cnpq.br/7987212907837941
Silva, Ivanovitch Medeiros Dantas da

http://lattes.cnpq.br/3608440944832201
Ramalho, Betânia Leite

http://lattes.cnpq.br/1326690619078211
Ferreira Filho, Raymundo Carlos Machado

http://lattes.cnpq.br/1297246206844791
Souza Neto, Plácido Antônio de

http://lattes.cnpq.br/3641504724164977
dc.contributor.author.fl_str_mv Barros, Thiago Medeiros
dc.subject.por.fl_str_mv Mineração de dados educacionais
Evasão
Modelo preditivo
Classes desbalanceadas
topic Mineração de dados educacionais
Evasão
Modelo preditivo
Classes desbalanceadas
description School dropout is an extremely complex problem, as it involves not only a variety of perspectives, but also a variety of different types of dropout behavior. Historically, the most cited school dropout models had their origin in education, however the emerging area of Data Science applied in Education is capable of developing new predictive models, with generally better results when compared to the most used traditional statistical methods. The main objective of this thesis is the proposition of a process for the generation of a predictive school dropout model based on Data Science. To this end, a sequence of steps is defined in order to model an information flow from problem definition to generation of useful information for managers and teachers. The steps consist of: Understanding the Problem, Understanding the Data, Feature Engineering, Feature Selection, Data Balancing, Models, Evaluation and Interpretation. The proposal’s contribution is found in the indication of which techniques and algorithms should be used in each phase of knowledge discovery, and show that the phenomenon of school dropout must be addressed as a problem of imbalanced classes, and should be approached with appropriate tools and metrics, in order to generate a robust and easy to interpret prediction model. The proposed process was validated on educational and socioeconomic data of students Federal Institute of Rio Grande do Norte (IFRN).
publishDate 2020
dc.date.none.fl_str_mv 2020-10-22
2021-03-17T23:53:23Z
2021-03-17T23:53:23Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv BARROS, Thiago Medeiros. Um processo orientado a dados para geração de modelo de predição de evasão escolar. 2020. 116f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2020.
https://repositorio.ufrn.br/handle/123456789/31933
identifier_str_mv BARROS, Thiago Medeiros. Um processo orientado a dados para geração de modelo de predição de evasão escolar. 2020. 116f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2020.
url https://repositorio.ufrn.br/handle/123456789/31933
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
Brasil
UFRN
PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO
publisher.none.fl_str_mv Universidade Federal do Rio Grande do Norte
Brasil
UFRN
PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRN
instname:Universidade Federal do Rio Grande do Norte (UFRN)
instacron:UFRN
instname_str Universidade Federal do Rio Grande do Norte (UFRN)
instacron_str UFRN
institution UFRN
reponame_str Repositório Institucional da UFRN
collection Repositório Institucional da UFRN
repository.name.fl_str_mv Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)
repository.mail.fl_str_mv repositorio@bczm.ufrn.br
_version_ 1855758742410231808