Agrupamento de questões do ENEM usando técnicas de processamento de linguagem natural

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Ramalho, André Alves
Orientador(a): Zampirolli, Francisco de Assis
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal do ABC
Programa de Pós-Graduação: Programa de Pós-Graduação em Ciência da Computação
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Link de acesso: http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=128461&midiaext=81897
Resumo: Coordenação de Aperfeiçoamento de Pessoal de Nivel Superior
id UFBC_cec4c604b6fc348aa3b8768da09e9df6
oai_identifier_str oai:BDTD:128461
network_acronym_str UFBC
network_name_str Repositório Institucional da UFABC
repository_id_str
spelling info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisAgrupamento de questões do ENEM usando técnicas de processamento de linguagem natural2024-10-09Zampirolli, Francisco de AssisRamalho, André AlvesUniversidade Federal do ABCPrograma de Pós-Graduação em Ciência da ComputaçãoUFABCporAGRUPAMENTO TEXTUALPROCESSAMENTO DE LINGUAGEM NATURALGLOBAL VECTORSAFFINITY PROPAGATIONK-MEANSTEXT GROUPNATURAL LANGUAGE PROCESSINGPROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO - UFABCCoordenação de Aperfeiçoamento de Pessoal de Nivel SuperiorDesde sua concepção, o Processamento de Linguagem Natural (PLN) exerce um papel crucial ao permitir que computadores processem textos. Nas últimas décadas, a demanda por essa capacidade aumentou exponencialmente devido ao vasto volume de informações digitais disponíveis. Este estudo tem como objetivo agrupar questões de múltipla escolha, assegurando sua universalidade e acessibilidade. Para isso, foram utilizadas 2400 questões de múltipla escolha (enunciados e alternativas) de provas do Exame Nacional do Ensino Médio (ENEM), abrangendo candidatos de diversas regiões e culturas em todo o país. É essencial que as questões sejam compreensíveis tanto para candidatos em áreas remotas da região Norte quanto para aqueles em bairros nobres de São Paulo. Para validar o método proposto, foram geradas 200 questões parametrizadas de múltipla escolha (enunciados e alternativas) e um conjunto de 50 textos para simular enunciado de questões utilizando o ChatGPT, representados por meio das técnicas Word2Vec, Wang2Vec, FastText e GloVe, totalizando 35 configurações distintas de modelos pré-treinados disponíveis no site do NILCUSP. As questões foram agrupadas utilizando os algoritmos DBSCAN, K-means e Affinity Propagation. A avaliação dos resultados foi conduzida através do método de acurácia, considerando apenas as técnicas em que todos os modelos obtiveram o resultado máximo de 100% nos testes com as questões parametrizadas. Os testes realizados com os textos gerados pelo ChatGPT resultaram em uma acurácia de 76%. Os resultados indicaram que o GloVe, com 100 ou 300 dimensões, associado ao algoritmo Affinity Propagation, apresentou desempenho superior em comparação aos demais métodos. Este modelo possibilitou a representação e o agrupamento das questões do ENEM de maneira eficaz, alcançando 64% de acurácia nos agrupamentos, cumprindo, assim, o objetivo inicial deste estudo.http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=128461&midiaext=81897application/pdfreponame:Repositório Institucional da UFABCinstname:Universidade Federal do ABC (UFABC)instacron:UFABCinfo:eu-repo/semantics/openAccess2026-01-15T22:14:54Zoai:BDTD:128461Repositório InstitucionalPUBhttp://www.biblioteca.ufabc.edu.br/oai/oai.phpopendoar:2025-09-02T11:32:49Repositório Institucional da UFABC - Universidade Federal do ABC (UFABC)false
dc.title.pt.fl_str_mv Agrupamento de questões do ENEM usando técnicas de processamento de linguagem natural
title Agrupamento de questões do ENEM usando técnicas de processamento de linguagem natural
spellingShingle Agrupamento de questões do ENEM usando técnicas de processamento de linguagem natural
Ramalho, André Alves
title_short Agrupamento de questões do ENEM usando técnicas de processamento de linguagem natural
title_full Agrupamento de questões do ENEM usando técnicas de processamento de linguagem natural
title_fullStr Agrupamento de questões do ENEM usando técnicas de processamento de linguagem natural
title_full_unstemmed Agrupamento de questões do ENEM usando técnicas de processamento de linguagem natural
title_sort Agrupamento de questões do ENEM usando técnicas de processamento de linguagem natural
author Ramalho, André Alves
author_facet Ramalho, André Alves
author_role author
dc.contributor.advisor1.fl_str_mv Zampirolli, Francisco de Assis
dc.contributor.author.fl_str_mv Ramalho, André Alves
contributor_str_mv Zampirolli, Francisco de Assis
description Coordenação de Aperfeiçoamento de Pessoal de Nivel Superior
publishDate 2024
dc.date.issued.fl_str_mv 2024-10-09
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=128461&midiaext=81897
url http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=128461&midiaext=81897
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal do ABC
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Ciência da Computação
dc.publisher.initials.fl_str_mv UFABC
publisher.none.fl_str_mv Universidade Federal do ABC
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFABC
instname:Universidade Federal do ABC (UFABC)
instacron:UFABC
instname_str Universidade Federal do ABC (UFABC)
instacron_str UFABC
institution UFABC
reponame_str Repositório Institucional da UFABC
collection Repositório Institucional da UFABC
repository.name.fl_str_mv Repositório Institucional da UFABC - Universidade Federal do ABC (UFABC)
repository.mail.fl_str_mv
_version_ 1854475893746958336