Agrupamento de questões do ENEM usando técnicas de processamento de linguagem natural
| Ano de defesa: | 2024 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade Federal do ABC
|
| Programa de Pós-Graduação: |
Programa de Pós-Graduação em Ciência da Computação
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Link de acesso: | http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=128461&midiaext=81897 |
Resumo: | Coordenação de Aperfeiçoamento de Pessoal de Nivel Superior |
| id |
UFBC_cec4c604b6fc348aa3b8768da09e9df6 |
|---|---|
| oai_identifier_str |
oai:BDTD:128461 |
| network_acronym_str |
UFBC |
| network_name_str |
Repositório Institucional da UFABC |
| repository_id_str |
|
| spelling |
info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisAgrupamento de questões do ENEM usando técnicas de processamento de linguagem natural2024-10-09Zampirolli, Francisco de AssisRamalho, André AlvesUniversidade Federal do ABCPrograma de Pós-Graduação em Ciência da ComputaçãoUFABCporAGRUPAMENTO TEXTUALPROCESSAMENTO DE LINGUAGEM NATURALGLOBAL VECTORSAFFINITY PROPAGATIONK-MEANSTEXT GROUPNATURAL LANGUAGE PROCESSINGPROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO - UFABCCoordenação de Aperfeiçoamento de Pessoal de Nivel SuperiorDesde sua concepção, o Processamento de Linguagem Natural (PLN) exerce um papel crucial ao permitir que computadores processem textos. Nas últimas décadas, a demanda por essa capacidade aumentou exponencialmente devido ao vasto volume de informações digitais disponíveis. Este estudo tem como objetivo agrupar questões de múltipla escolha, assegurando sua universalidade e acessibilidade. Para isso, foram utilizadas 2400 questões de múltipla escolha (enunciados e alternativas) de provas do Exame Nacional do Ensino Médio (ENEM), abrangendo candidatos de diversas regiões e culturas em todo o país. É essencial que as questões sejam compreensíveis tanto para candidatos em áreas remotas da região Norte quanto para aqueles em bairros nobres de São Paulo. Para validar o método proposto, foram geradas 200 questões parametrizadas de múltipla escolha (enunciados e alternativas) e um conjunto de 50 textos para simular enunciado de questões utilizando o ChatGPT, representados por meio das técnicas Word2Vec, Wang2Vec, FastText e GloVe, totalizando 35 configurações distintas de modelos pré-treinados disponíveis no site do NILCUSP. As questões foram agrupadas utilizando os algoritmos DBSCAN, K-means e Affinity Propagation. A avaliação dos resultados foi conduzida através do método de acurácia, considerando apenas as técnicas em que todos os modelos obtiveram o resultado máximo de 100% nos testes com as questões parametrizadas. Os testes realizados com os textos gerados pelo ChatGPT resultaram em uma acurácia de 76%. Os resultados indicaram que o GloVe, com 100 ou 300 dimensões, associado ao algoritmo Affinity Propagation, apresentou desempenho superior em comparação aos demais métodos. Este modelo possibilitou a representação e o agrupamento das questões do ENEM de maneira eficaz, alcançando 64% de acurácia nos agrupamentos, cumprindo, assim, o objetivo inicial deste estudo.http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=128461&midiaext=81897application/pdfreponame:Repositório Institucional da UFABCinstname:Universidade Federal do ABC (UFABC)instacron:UFABCinfo:eu-repo/semantics/openAccess2026-01-15T22:14:54Zoai:BDTD:128461Repositório InstitucionalPUBhttp://www.biblioteca.ufabc.edu.br/oai/oai.phpopendoar:2025-09-02T11:32:49Repositório Institucional da UFABC - Universidade Federal do ABC (UFABC)false |
| dc.title.pt.fl_str_mv |
Agrupamento de questões do ENEM usando técnicas de processamento de linguagem natural |
| title |
Agrupamento de questões do ENEM usando técnicas de processamento de linguagem natural |
| spellingShingle |
Agrupamento de questões do ENEM usando técnicas de processamento de linguagem natural Ramalho, André Alves |
| title_short |
Agrupamento de questões do ENEM usando técnicas de processamento de linguagem natural |
| title_full |
Agrupamento de questões do ENEM usando técnicas de processamento de linguagem natural |
| title_fullStr |
Agrupamento de questões do ENEM usando técnicas de processamento de linguagem natural |
| title_full_unstemmed |
Agrupamento de questões do ENEM usando técnicas de processamento de linguagem natural |
| title_sort |
Agrupamento de questões do ENEM usando técnicas de processamento de linguagem natural |
| author |
Ramalho, André Alves |
| author_facet |
Ramalho, André Alves |
| author_role |
author |
| dc.contributor.advisor1.fl_str_mv |
Zampirolli, Francisco de Assis |
| dc.contributor.author.fl_str_mv |
Ramalho, André Alves |
| contributor_str_mv |
Zampirolli, Francisco de Assis |
| description |
Coordenação de Aperfeiçoamento de Pessoal de Nivel Superior |
| publishDate |
2024 |
| dc.date.issued.fl_str_mv |
2024-10-09 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=128461&midiaext=81897 |
| url |
http://biblioteca.ufabc.edu.br/index.php?codigo_sophia=128461&midiaext=81897 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Federal do ABC |
| dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Ciência da Computação |
| dc.publisher.initials.fl_str_mv |
UFABC |
| publisher.none.fl_str_mv |
Universidade Federal do ABC |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFABC instname:Universidade Federal do ABC (UFABC) instacron:UFABC |
| instname_str |
Universidade Federal do ABC (UFABC) |
| instacron_str |
UFABC |
| institution |
UFABC |
| reponame_str |
Repositório Institucional da UFABC |
| collection |
Repositório Institucional da UFABC |
| repository.name.fl_str_mv |
Repositório Institucional da UFABC - Universidade Federal do ABC (UFABC) |
| repository.mail.fl_str_mv |
|
| _version_ |
1854475893746958336 |