Um processo baseado em seleção de atributos e aprendizagem de máquina para geração de modelos preditivos: um estudo sobre evasão no ensino superior brasileiro

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Dionisio, Gustavo Marcelino
Orientador(a): Menolli, André Luís Andrade
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.uel.br/handle/123456789/18185
Resumo: Um dos grandes desafios na aprendizagem de máquina em alguns domínios é a alta dimensionalidade de características. Assim, este estudo propõe um processo focado na seleção de atributos e redução de dimensões para aprimorar modelos preditivos, além de ter como uma das saídas os atributos mais relevantes para a predição em questão. O objeto de estudo para a aplicação deste processo é o fenômeno da evasão em Instituições de Ensino Superior brasileiras, com foco especial em cursos presenciais, utilizando dados providos pelo Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira. Com a adoção de técnicas e algoritmos de Aprendizagem de Máquina, o processo visa identificar os atributos mais impactantes na evasão, otimizando a análise preditiva por meio da eliminação de variáveis irrelevantes ao contexto. Este procedimento inclui etapas essenciais, como transformação e balanceamento de dados, seleção de contexto, seleção empírica e algorítmica de atributos, além de possuir etapas iterativas para refinar os modelos preditivos, culminando na geração de modelos de aprendizagem de máquina especializados em contextos específicos. O processo foi aplicado em cinco diferentes contextos do ensino superior brasileiro. Com os resultados destes experimentos, por meio do processo proposto, foi possível gerar modelos preditivos de dimensionalidade reduzida de maior acurácia que os modelos originais. Além disso, comparando com outras técnicas de seleção de atributos os modelos gerados por meio do processo obteve acurácia superior. Com relação ao estudo sobre evasão, foi possível identificar as principais características relacionadas à contextos específicos. Por fim, foi constatado que existe um conjunto de características comum a todos os cenários estudados, que são essenciais na predição da evasão no ensino superior presencial no Brasil
id UEL_7922c8eb82181d6795ef10b1575a60e8
oai_identifier_str oai:repositorio.uel.br:123456789/18185
network_acronym_str UEL
network_name_str Repositório Institucional da UEL
repository_id_str
spelling Dionisio, Gustavo MarcelinoBrancher, Jacques Duílio949db30c-52b4-4805-a386-a5f8f1b6345a-1Boscarioli, Clodis336f92ff-1b01-4cfb-8990-24817e2f79b6-15168d7cf-6a6c-40eb-b396-34ada6264d271122a4fd-fa01-4211-9648-7dfd4d2c7edfMenolli, André Luís AndradeLondrina57 p.2024-10-21T19:28:44Z2024-10-21T19:28:44Z2024-04-04https://repositorio.uel.br/handle/123456789/18185Um dos grandes desafios na aprendizagem de máquina em alguns domínios é a alta dimensionalidade de características. Assim, este estudo propõe um processo focado na seleção de atributos e redução de dimensões para aprimorar modelos preditivos, além de ter como uma das saídas os atributos mais relevantes para a predição em questão. O objeto de estudo para a aplicação deste processo é o fenômeno da evasão em Instituições de Ensino Superior brasileiras, com foco especial em cursos presenciais, utilizando dados providos pelo Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira. Com a adoção de técnicas e algoritmos de Aprendizagem de Máquina, o processo visa identificar os atributos mais impactantes na evasão, otimizando a análise preditiva por meio da eliminação de variáveis irrelevantes ao contexto. Este procedimento inclui etapas essenciais, como transformação e balanceamento de dados, seleção de contexto, seleção empírica e algorítmica de atributos, além de possuir etapas iterativas para refinar os modelos preditivos, culminando na geração de modelos de aprendizagem de máquina especializados em contextos específicos. O processo foi aplicado em cinco diferentes contextos do ensino superior brasileiro. Com os resultados destes experimentos, por meio do processo proposto, foi possível gerar modelos preditivos de dimensionalidade reduzida de maior acurácia que os modelos originais. Além disso, comparando com outras técnicas de seleção de atributos os modelos gerados por meio do processo obteve acurácia superior. Com relação ao estudo sobre evasão, foi possível identificar as principais características relacionadas à contextos específicos. Por fim, foi constatado que existe um conjunto de características comum a todos os cenários estudados, que são essenciais na predição da evasão no ensino superior presencial no BrasilOne of the major challenges in machine learning in some domains is the high dimensionality of features. Thus, this study proposes a process focused on attribute selection and dimensionality reduction to enhance predictive models, with one of its outputs being the most relevant attributes for the prediction at hand. The object of study for applying this process is the phenomenon of dropout in Brazilian Higher Education Institutions, with a special focus on face-to-face courses, using data provided by the National Institute for Educational Studies and Research. By adopting Machine Learning techniques and algorithms, the process aims to identify the most impactful attributes on dropout, optimizing predictive analysis by eliminating variables irrelevant to the context. This procedure includes essential steps such as data transformation and balancing, context selection, empirical and algorithmic attribute selection, as well as iterative steps to refine predictive models, resulting in the generation of machine learning models specialized in specific contexts. The process was applied in five different contexts of Brazilian higher education. With the results of these experiments, through the proposed process, it was possible to generate predictive models of reduced dimensionality with higher accuracy than the original models. Furthermore, compared to other feature selection techniques, the models generated through the process achieved superior accuracy. Regarding the study on dropout, it was possible to identify the main characteristics related to specific contexts. Finally, it was found that there is a set of common characteristics to all studied scenarios, which are essential in predicting dropout in face-to-face higher education in BrazilporCiências Exatas e da Terra - Ciência da ComputaçãoCiências Exatas e da Terra - Ciência da ComputaçãoFeature selectionMachine learningDropoutHigher education - BrazilCollege dropouts - BrazilMachine learningLearning - ComputingSeleção de atributosAprendizagem de máquinaEvasãoEnsino superior - BrasilEvasão universitária - BrasilAprendizado do computadorAprendizagem - computaçãoUm processo baseado em seleção de atributos e aprendizagem de máquina para geração de modelos preditivos: um estudo sobre evasão no ensino superior brasileiroA process based on feature selection and machine learning to generate predictive models: an study on higher education dropoutinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisCCE - Departamento de ComputaçãoPrograma de Pós-Graduação em Ciência da ComputaçãoUniversidade Estadual de Londrina - UEL-1-1reponame:Repositório Institucional da UELinstname:Universidade Estadual de Londrina (UEL)instacron:UELinfo:eu-repo/semantics/openAccessMestrado AcadêmicoCentro de Ciências ExatasORIGINALCE_COM_Me_2024_Dionísio_Gustavo_M.pdfCE_COM_Me_2024_Dionísio_Gustavo_M.pdfTexto completo ID. 192724application/pdf749151https://repositorio.uel.br/bitstreams/bbf6ec04-a0c2-4431-a968-381ff46573db/download9217fa6d69168fa864cf6ec0329d80f6MD51CE_COM_Me_2024_Dionísio_Gustavo_M_TERMO.pdfCE_COM_Me_2024_Dionísio_Gustavo_M_TERMO.pdfTermo de compromissoapplication/pdf140301https://repositorio.uel.br/bitstreams/e8bfc228-c2f9-41bd-915d-a14678a5dc2a/download88ce54d1fcbbbf967c7617ccc1254e6fMD52LICENSElicense.txtlicense.txttext/plain; charset=utf-8555https://repositorio.uel.br/bitstreams/2e222294-4372-4268-912a-8600da80f096/downloadb0875caec81dd1122312ab77c11250f1MD53THUMBNAILCE_COM_Me_2024_Dionísio_Gustavo_M.pdf.jpgCE_COM_Me_2024_Dionísio_Gustavo_M.pdf.jpgGenerated Thumbnailimage/jpeg3593https://repositorio.uel.br/bitstreams/2e825eb0-75f4-4947-a2ef-84bf6586f326/downloadfb638e9aedcd1090b648e93289d80ce0MD54CE_COM_Me_2024_Dionísio_Gustavo_M_TERMO.pdf.jpgCE_COM_Me_2024_Dionísio_Gustavo_M_TERMO.pdf.jpgGenerated Thumbnailimage/jpeg5020https://repositorio.uel.br/bitstreams/6fb9c009-cf3b-41e1-923b-e647476d3328/downloadc0cc99efdf26caf9031dffb807c28d57MD56TEXTCE_COM_Me_2024_Dionísio_Gustavo_M_TERMO.pdf.txtCE_COM_Me_2024_Dionísio_Gustavo_M_TERMO.pdf.txtExtracted texttext/plain2243https://repositorio.uel.br/bitstreams/61f07289-086a-4994-b793-0b6c1368fc89/download6c72e30599b50bef5ad6b27da0d06838MD55123456789/181852024-11-12 15:01:29.216open.accessoai:repositorio.uel.br:123456789/18185https://repositorio.uel.brBiblioteca Digital de Teses e Dissertaçõeshttp://www.bibliotecadigital.uel.br/PUBhttp://www.bibliotecadigital.uel.br/OAI/oai2.phpbcuel@uel.br||opendoar:2024-11-12T18:01:29Repositório Institucional da UEL - Universidade Estadual de Londrina (UEL)falseQXV0b3Jpem8gYSBkaXZ1bGdhw6fDo28gbm8gUmVwb3NpdMOzcmlvIGRhIFVuaXZlcnNpZGFkZSBFc3RhZHVhbCBkZSBMb25kcmluYSAocmVwb3NpdG9yaW8udWVsLmJyKSwgZSBwZXJtaXRvIGEgcmVwcm9kdcOnw6NvIHRvdGFsIHBvciBtZWlvIGVsZXRyw7RuaWNvLCBzZW0gcmVzc2FyY2ltZW50byBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGEgT2JyYSwgYSBwYXJ0aXIgZGEgZGF0YSBpbmRpY2FkYSBubyBhcnF1aXZvIChiaXRzdHJlYW0pLCBvdSBhdMOpIHF1ZSBtYW5pZmVzdGHDp8OjbyBlbSBzZW50aWRvIGNvbnRyw6FyaW8gZGUgbWluaGEgcGFydGUgZGV0ZXJtaW5lIGEgY2Vzc2HDp8OjbyBkZXN0YSBhdXRvcml6YcOnw6NvLiBEZWNsYXJvLCB0YW1iw6ltLCBxdWUgbWUgcmVzcG9uc2FiaWxpem8gcGVsbyBjb250ZcO6ZG8gZGEgb2JyYSBvYmpldG8gZGVzdGEgYXV0b3JpemHDp8Ojbywgc2VuZG8gZGUgbWluaGEgcmVzcG9uc2FiaWxpZGFkZSBxdWFpc3F1ZXIgbWVkaWRhcyBqdWRpY2lhaXMgb3UgZXh0cmFqdWRpY2lhaXMgY29uY2VybmVudGVzIGFvIGNvbnRlw7pkby4K
dc.title.none.fl_str_mv Um processo baseado em seleção de atributos e aprendizagem de máquina para geração de modelos preditivos: um estudo sobre evasão no ensino superior brasileiro
dc.title.alternative.none.fl_str_mv A process based on feature selection and machine learning to generate predictive models: an study on higher education dropout
title Um processo baseado em seleção de atributos e aprendizagem de máquina para geração de modelos preditivos: um estudo sobre evasão no ensino superior brasileiro
spellingShingle Um processo baseado em seleção de atributos e aprendizagem de máquina para geração de modelos preditivos: um estudo sobre evasão no ensino superior brasileiro
Dionisio, Gustavo Marcelino
Ciências Exatas e da Terra - Ciência da Computação
Seleção de atributos
Aprendizagem de máquina
Evasão
Ensino superior - Brasil
Evasão universitária - Brasil
Aprendizado do computador
Aprendizagem - computação
Ciências Exatas e da Terra - Ciência da Computação
Feature selection
Machine learning
Dropout
Higher education - Brazil
College dropouts - Brazil
Machine learning
Learning - Computing
title_short Um processo baseado em seleção de atributos e aprendizagem de máquina para geração de modelos preditivos: um estudo sobre evasão no ensino superior brasileiro
title_full Um processo baseado em seleção de atributos e aprendizagem de máquina para geração de modelos preditivos: um estudo sobre evasão no ensino superior brasileiro
title_fullStr Um processo baseado em seleção de atributos e aprendizagem de máquina para geração de modelos preditivos: um estudo sobre evasão no ensino superior brasileiro
title_full_unstemmed Um processo baseado em seleção de atributos e aprendizagem de máquina para geração de modelos preditivos: um estudo sobre evasão no ensino superior brasileiro
title_sort Um processo baseado em seleção de atributos e aprendizagem de máquina para geração de modelos preditivos: um estudo sobre evasão no ensino superior brasileiro
author Dionisio, Gustavo Marcelino
author_facet Dionisio, Gustavo Marcelino
author_role author
dc.contributor.banca.none.fl_str_mv Brancher, Jacques Duílio
Boscarioli, Clodis
dc.contributor.author.fl_str_mv Dionisio, Gustavo Marcelino
dc.contributor.authorID.fl_str_mv 5168d7cf-6a6c-40eb-b396-34ada6264d27
dc.contributor.advisor1ID.fl_str_mv 1122a4fd-fa01-4211-9648-7dfd4d2c7edf
dc.contributor.advisor1.fl_str_mv Menolli, André Luís Andrade
contributor_str_mv Menolli, André Luís Andrade
dc.subject.cnpq.fl_str_mv Ciências Exatas e da Terra - Ciência da Computação
topic Ciências Exatas e da Terra - Ciência da Computação
Seleção de atributos
Aprendizagem de máquina
Evasão
Ensino superior - Brasil
Evasão universitária - Brasil
Aprendizado do computador
Aprendizagem - computação
Ciências Exatas e da Terra - Ciência da Computação
Feature selection
Machine learning
Dropout
Higher education - Brazil
College dropouts - Brazil
Machine learning
Learning - Computing
dc.subject.por.fl_str_mv Seleção de atributos
Aprendizagem de máquina
Evasão
Ensino superior - Brasil
Evasão universitária - Brasil
Aprendizado do computador
Aprendizagem - computação
dc.subject.capes.none.fl_str_mv Ciências Exatas e da Terra - Ciência da Computação
dc.subject.keywords.none.fl_str_mv Feature selection
Machine learning
Dropout
Higher education - Brazil
College dropouts - Brazil
Machine learning
Learning - Computing
description Um dos grandes desafios na aprendizagem de máquina em alguns domínios é a alta dimensionalidade de características. Assim, este estudo propõe um processo focado na seleção de atributos e redução de dimensões para aprimorar modelos preditivos, além de ter como uma das saídas os atributos mais relevantes para a predição em questão. O objeto de estudo para a aplicação deste processo é o fenômeno da evasão em Instituições de Ensino Superior brasileiras, com foco especial em cursos presenciais, utilizando dados providos pelo Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira. Com a adoção de técnicas e algoritmos de Aprendizagem de Máquina, o processo visa identificar os atributos mais impactantes na evasão, otimizando a análise preditiva por meio da eliminação de variáveis irrelevantes ao contexto. Este procedimento inclui etapas essenciais, como transformação e balanceamento de dados, seleção de contexto, seleção empírica e algorítmica de atributos, além de possuir etapas iterativas para refinar os modelos preditivos, culminando na geração de modelos de aprendizagem de máquina especializados em contextos específicos. O processo foi aplicado em cinco diferentes contextos do ensino superior brasileiro. Com os resultados destes experimentos, por meio do processo proposto, foi possível gerar modelos preditivos de dimensionalidade reduzida de maior acurácia que os modelos originais. Além disso, comparando com outras técnicas de seleção de atributos os modelos gerados por meio do processo obteve acurácia superior. Com relação ao estudo sobre evasão, foi possível identificar as principais características relacionadas à contextos específicos. Por fim, foi constatado que existe um conjunto de características comum a todos os cenários estudados, que são essenciais na predição da evasão no ensino superior presencial no Brasil
publishDate 2024
dc.date.accessioned.fl_str_mv 2024-10-21T19:28:44Z
dc.date.available.fl_str_mv 2024-10-21T19:28:44Z
dc.date.issued.fl_str_mv 2024-04-04
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.uel.br/handle/123456789/18185
url https://repositorio.uel.br/handle/123456789/18185
dc.language.iso.fl_str_mv por
language por
dc.relation.confidence.fl_str_mv -1
-1
dc.relation.departament.none.fl_str_mv CCE - Departamento de Computação
dc.relation.ppgname.none.fl_str_mv Programa de Pós-Graduação em Ciência da Computação
dc.relation.institutionname.none.fl_str_mv Universidade Estadual de Londrina - UEL
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.coverage.spatial.none.fl_str_mv Londrina
dc.coverage.extent.none.fl_str_mv 57 p.
dc.source.none.fl_str_mv reponame:Repositório Institucional da UEL
instname:Universidade Estadual de Londrina (UEL)
instacron:UEL
instname_str Universidade Estadual de Londrina (UEL)
instacron_str UEL
institution UEL
reponame_str Repositório Institucional da UEL
collection Repositório Institucional da UEL
bitstream.url.fl_str_mv https://repositorio.uel.br/bitstreams/bbf6ec04-a0c2-4431-a968-381ff46573db/download
https://repositorio.uel.br/bitstreams/e8bfc228-c2f9-41bd-915d-a14678a5dc2a/download
https://repositorio.uel.br/bitstreams/2e222294-4372-4268-912a-8600da80f096/download
https://repositorio.uel.br/bitstreams/2e825eb0-75f4-4947-a2ef-84bf6586f326/download
https://repositorio.uel.br/bitstreams/6fb9c009-cf3b-41e1-923b-e647476d3328/download
https://repositorio.uel.br/bitstreams/61f07289-086a-4994-b793-0b6c1368fc89/download
bitstream.checksum.fl_str_mv 9217fa6d69168fa864cf6ec0329d80f6
88ce54d1fcbbbf967c7617ccc1254e6f
b0875caec81dd1122312ab77c11250f1
fb638e9aedcd1090b648e93289d80ce0
c0cc99efdf26caf9031dffb807c28d57
6c72e30599b50bef5ad6b27da0d06838
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UEL - Universidade Estadual de Londrina (UEL)
repository.mail.fl_str_mv bcuel@uel.br||
_version_ 1862739678432591872