Um processo orientado a dados para geração de modelo de predição de evasão escolar
| Ano de defesa: | 2020 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal do Rio Grande do Norte
Brasil UFRN PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO |
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://repositorio.ufrn.br/handle/123456789/31933 |
Resumo: | School dropout is an extremely complex problem, as it involves not only a variety of perspectives, but also a variety of different types of dropout behavior. Historically, the most cited school dropout models had their origin in education, however the emerging area of Data Science applied in Education is capable of developing new predictive models, with generally better results when compared to the most used traditional statistical methods. The main objective of this thesis is the proposition of a process for the generation of a predictive school dropout model based on Data Science. To this end, a sequence of steps is defined in order to model an information flow from problem definition to generation of useful information for managers and teachers. The steps consist of: Understanding the Problem, Understanding the Data, Feature Engineering, Feature Selection, Data Balancing, Models, Evaluation and Interpretation. The proposal’s contribution is found in the indication of which techniques and algorithms should be used in each phase of knowledge discovery, and show that the phenomenon of school dropout must be addressed as a problem of imbalanced classes, and should be approached with appropriate tools and metrics, in order to generate a robust and easy to interpret prediction model. The proposed process was validated on educational and socioeconomic data of students Federal Institute of Rio Grande do Norte (IFRN). |
| id |
UFRN_46c177dbd58ef986ae376992c6430529 |
|---|---|
| oai_identifier_str |
oai:repositorio.ufrn.br:123456789/31933 |
| network_acronym_str |
UFRN |
| network_name_str |
Repositório Institucional da UFRN |
| repository_id_str |
|
| spelling |
Um processo orientado a dados para geração de modelo de predição de evasão escolarMineração de dados educacionaisEvasãoModelo preditivoClasses desbalanceadasSchool dropout is an extremely complex problem, as it involves not only a variety of perspectives, but also a variety of different types of dropout behavior. Historically, the most cited school dropout models had their origin in education, however the emerging area of Data Science applied in Education is capable of developing new predictive models, with generally better results when compared to the most used traditional statistical methods. The main objective of this thesis is the proposition of a process for the generation of a predictive school dropout model based on Data Science. To this end, a sequence of steps is defined in order to model an information flow from problem definition to generation of useful information for managers and teachers. The steps consist of: Understanding the Problem, Understanding the Data, Feature Engineering, Feature Selection, Data Balancing, Models, Evaluation and Interpretation. The proposal’s contribution is found in the indication of which techniques and algorithms should be used in each phase of knowledge discovery, and show that the phenomenon of school dropout must be addressed as a problem of imbalanced classes, and should be approached with appropriate tools and metrics, in order to generate a robust and easy to interpret prediction model. The proposed process was validated on educational and socioeconomic data of students Federal Institute of Rio Grande do Norte (IFRN).A evasão escolar, também conhecida como abandono escolar, é um problema extremamente complexo, pois envolve não apenas uma variedade de perspectivas, mas também uma variedade de diferentes tipos de comportamento de abandono. Historicamente, os modelos de evasão escolar mais citados tiveram sua origem na educação, entretanto a emergente área de Ciência de Dados aplicada na Educação é capaz de desenvolver novos modelos preditivos, com resultados geralmente melhores quando comparados com os métodos estatísticos tradicionais. O principal objetivo dessa tese é a proposição de um processo para geração de um modelo preditivo de evasão escolar baseada em Ciências de Dados. Para tal, uma sequência de etapas é definida, a fim de modelar um fluxo de informação, desde a definição do problema até a geração de informação útil a gestores e professores. As etapas são compostas por: "Entender o Problema", "Entender os Dados", "Engenharia de Atributos", "Seleção de Atributos", "Balanceamento de Dados", "Modelos", "Avaliação"e "Interpretação". A contribuição da proposta se encontra na indicação de quais técnicas e algoritmos devem ser empregados em cada etapa do processo apresentado, e na exposição de que o fenômeno de evasão escolar deve ser abordado como um problema de classes desbalanceadas, a qual deve utilizar-se de ferramentas e métricas apropriadas, a fim de gerar um modelo de predição robusto e de fácil interpretação. O processo proposto foi validado sobre dados educacionais, socioeconômicos e demográficos de alunos de cursos integrados do Instituto Federal do Rio Grande do Norte (IFRN).Universidade Federal do Rio Grande do NorteBrasilUFRNPROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃOOliveira, Luiz Affonso Henderson Guedes dehttp://lattes.cnpq.br/3844440611390386http://lattes.cnpq.br/7987212907837941Silva, Ivanovitch Medeiros Dantas dahttp://lattes.cnpq.br/3608440944832201Ramalho, Betânia Leitehttp://lattes.cnpq.br/1326690619078211Ferreira Filho, Raymundo Carlos Machadohttp://lattes.cnpq.br/1297246206844791Souza Neto, Plácido Antônio dehttp://lattes.cnpq.br/3641504724164977Barros, Thiago Medeiros2021-03-17T23:53:23Z2021-03-17T23:53:23Z2020-10-22info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfBARROS, Thiago Medeiros. Um processo orientado a dados para geração de modelo de predição de evasão escolar. 2020. 116f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2020.https://repositorio.ufrn.br/handle/123456789/31933info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFRNinstname:Universidade Federal do Rio Grande do Norte (UFRN)instacron:UFRN2021-03-21T08:48:20Zoai:repositorio.ufrn.br:123456789/31933Repositório InstitucionalPUBhttp://repositorio.ufrn.br/oai/repositorio@bczm.ufrn.bropendoar:2021-03-21T08:48:20Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN)false |
| dc.title.none.fl_str_mv |
Um processo orientado a dados para geração de modelo de predição de evasão escolar |
| title |
Um processo orientado a dados para geração de modelo de predição de evasão escolar |
| spellingShingle |
Um processo orientado a dados para geração de modelo de predição de evasão escolar Barros, Thiago Medeiros Mineração de dados educacionais Evasão Modelo preditivo Classes desbalanceadas |
| title_short |
Um processo orientado a dados para geração de modelo de predição de evasão escolar |
| title_full |
Um processo orientado a dados para geração de modelo de predição de evasão escolar |
| title_fullStr |
Um processo orientado a dados para geração de modelo de predição de evasão escolar |
| title_full_unstemmed |
Um processo orientado a dados para geração de modelo de predição de evasão escolar |
| title_sort |
Um processo orientado a dados para geração de modelo de predição de evasão escolar |
| author |
Barros, Thiago Medeiros |
| author_facet |
Barros, Thiago Medeiros |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Oliveira, Luiz Affonso Henderson Guedes de http://lattes.cnpq.br/3844440611390386 http://lattes.cnpq.br/7987212907837941 Silva, Ivanovitch Medeiros Dantas da http://lattes.cnpq.br/3608440944832201 Ramalho, Betânia Leite http://lattes.cnpq.br/1326690619078211 Ferreira Filho, Raymundo Carlos Machado http://lattes.cnpq.br/1297246206844791 Souza Neto, Plácido Antônio de http://lattes.cnpq.br/3641504724164977 |
| dc.contributor.author.fl_str_mv |
Barros, Thiago Medeiros |
| dc.subject.por.fl_str_mv |
Mineração de dados educacionais Evasão Modelo preditivo Classes desbalanceadas |
| topic |
Mineração de dados educacionais Evasão Modelo preditivo Classes desbalanceadas |
| description |
School dropout is an extremely complex problem, as it involves not only a variety of perspectives, but also a variety of different types of dropout behavior. Historically, the most cited school dropout models had their origin in education, however the emerging area of Data Science applied in Education is capable of developing new predictive models, with generally better results when compared to the most used traditional statistical methods. The main objective of this thesis is the proposition of a process for the generation of a predictive school dropout model based on Data Science. To this end, a sequence of steps is defined in order to model an information flow from problem definition to generation of useful information for managers and teachers. The steps consist of: Understanding the Problem, Understanding the Data, Feature Engineering, Feature Selection, Data Balancing, Models, Evaluation and Interpretation. The proposal’s contribution is found in the indication of which techniques and algorithms should be used in each phase of knowledge discovery, and show that the phenomenon of school dropout must be addressed as a problem of imbalanced classes, and should be approached with appropriate tools and metrics, in order to generate a robust and easy to interpret prediction model. The proposed process was validated on educational and socioeconomic data of students Federal Institute of Rio Grande do Norte (IFRN). |
| publishDate |
2020 |
| dc.date.none.fl_str_mv |
2020-10-22 2021-03-17T23:53:23Z 2021-03-17T23:53:23Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
BARROS, Thiago Medeiros. Um processo orientado a dados para geração de modelo de predição de evasão escolar. 2020. 116f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2020. https://repositorio.ufrn.br/handle/123456789/31933 |
| identifier_str_mv |
BARROS, Thiago Medeiros. Um processo orientado a dados para geração de modelo de predição de evasão escolar. 2020. 116f. Tese (Doutorado em Engenharia Elétrica e de Computação) - Centro de Tecnologia, Universidade Federal do Rio Grande do Norte, Natal, 2020. |
| url |
https://repositorio.ufrn.br/handle/123456789/31933 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Norte Brasil UFRN PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO |
| publisher.none.fl_str_mv |
Universidade Federal do Rio Grande do Norte Brasil UFRN PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRN instname:Universidade Federal do Rio Grande do Norte (UFRN) instacron:UFRN |
| instname_str |
Universidade Federal do Rio Grande do Norte (UFRN) |
| instacron_str |
UFRN |
| institution |
UFRN |
| reponame_str |
Repositório Institucional da UFRN |
| collection |
Repositório Institucional da UFRN |
| repository.name.fl_str_mv |
Repositório Institucional da UFRN - Universidade Federal do Rio Grande do Norte (UFRN) |
| repository.mail.fl_str_mv |
repositorio@bczm.ufrn.br |
| _version_ |
1855758742410231808 |