Predicting item response theory parameters using question statements texts
| Ano de defesa: | 2025 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| dARK ID: | ark:/87559/001300001cnxb |
| Idioma: | eng |
| Instituição de defesa: |
Não Informado pela instituição
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://app.uff.br/riuff/handle/1/39803 |
Resumo: | Nos últimos anos, avanços em Modelos Neurais de Linguagem pré-treinados em grandes corpora de textos têm possibilitado a extração de representações linguísticas ricas, permitindo o treinamento eficiente de redes neurais para aplicações específicas, mesmo com conjuntos de dados reduzidos. Neste contexto, esta tese investiga o uso dessas representações para a predição de parâmetros da Teoria da Resposta ao Item (TRI), utilizando exclusivamente os enunciados das questões. A pesquisa inova ao demonstrar a viabilidade da obtenção dos parâmetros de dificuldade dos itens a partir da Curva Característica do Item, em vez da abordagem convencional de regressão direta sobre os parâmetros, predominante na literatura. Para avaliar essa proposta, foram testados diversos tipos de encoders, baseados em arquiteturas Transformer, comparando modelos treinados em Português e Multilinguais. A arquitetura piramidal desenvolvida foi capaz de predizer o parâmetro de dificuldade das questões do ENEM 2020 e 2021 com um erro médio de 70 pontos e uma mediana de 58 pontos. Ao calcular a nota TRI para uma amostra de 100.000 estudantes, o erro absoluto médio permaneceu abaixo de 40 pontos em todas as áreas do exame. Para o quartil superior dos candidatos, os candidatos mais competitivos do SISU, o erro médio absoluto foi inferior a 30 pontos em todas as áreas, chegando a menos de 15 pontos em algumas delas. Além disso, foi desenvolvida uma nova abordagem para a obtenção de embeddings baseada em Representações Relativas, que explora a similaridade entre os tokens de uma questão e um conjunto de âncoras selecionadas, reduzindo a complexidade computacional do processo. Os experimentos demonstraram que essa estratégia apresenta desempenho similar ou superior à abordagem piramidal, que utiliza a matriz completa de tokens, além de tornar o processo mais eficiente. Os experimentos foram conduzidos em uma base de dados real e de alta relevância nacional, composta por 2.578 enunciados de questões extraídos de 14 anos de exames do ENEM, principal porta de entrada para o ensino superior no Brasil, impactando milhões de estudantes anualmente. Os resultados desta pesquisa indicam que a tecnologia desenvolvida pode ser utilizada para prever parâmetros de novas questões, compor exames simulados e avaliar o desempenho dos candidatos neste exame com precisão. Além disso, a abordagem reduz a dependência de custosos processos de pré-calibração em avaliações educacionais. |
| id |
UFF-2_b5a6dfe9c4712257ded54bb9aa9bd8b5 |
|---|---|
| oai_identifier_str |
oai:app.uff.br:1/39803 |
| network_acronym_str |
UFF-2 |
| network_name_str |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
| repository_id_str |
|
| spelling |
Predicting item response theory parameters using question statements textsENEMTeoria de resposta ao itemModelos neurais de linguagemRepresentações relativasExame Nacional do Ensino Médio (Brasil)Rede neuralLinguagem (Computação)Item response theoryNeural language modelsRelative representationsNos últimos anos, avanços em Modelos Neurais de Linguagem pré-treinados em grandes corpora de textos têm possibilitado a extração de representações linguísticas ricas, permitindo o treinamento eficiente de redes neurais para aplicações específicas, mesmo com conjuntos de dados reduzidos. Neste contexto, esta tese investiga o uso dessas representações para a predição de parâmetros da Teoria da Resposta ao Item (TRI), utilizando exclusivamente os enunciados das questões. A pesquisa inova ao demonstrar a viabilidade da obtenção dos parâmetros de dificuldade dos itens a partir da Curva Característica do Item, em vez da abordagem convencional de regressão direta sobre os parâmetros, predominante na literatura. Para avaliar essa proposta, foram testados diversos tipos de encoders, baseados em arquiteturas Transformer, comparando modelos treinados em Português e Multilinguais. A arquitetura piramidal desenvolvida foi capaz de predizer o parâmetro de dificuldade das questões do ENEM 2020 e 2021 com um erro médio de 70 pontos e uma mediana de 58 pontos. Ao calcular a nota TRI para uma amostra de 100.000 estudantes, o erro absoluto médio permaneceu abaixo de 40 pontos em todas as áreas do exame. Para o quartil superior dos candidatos, os candidatos mais competitivos do SISU, o erro médio absoluto foi inferior a 30 pontos em todas as áreas, chegando a menos de 15 pontos em algumas delas. Além disso, foi desenvolvida uma nova abordagem para a obtenção de embeddings baseada em Representações Relativas, que explora a similaridade entre os tokens de uma questão e um conjunto de âncoras selecionadas, reduzindo a complexidade computacional do processo. Os experimentos demonstraram que essa estratégia apresenta desempenho similar ou superior à abordagem piramidal, que utiliza a matriz completa de tokens, além de tornar o processo mais eficiente. Os experimentos foram conduzidos em uma base de dados real e de alta relevância nacional, composta por 2.578 enunciados de questões extraídos de 14 anos de exames do ENEM, principal porta de entrada para o ensino superior no Brasil, impactando milhões de estudantes anualmente. Os resultados desta pesquisa indicam que a tecnologia desenvolvida pode ser utilizada para prever parâmetros de novas questões, compor exames simulados e avaliar o desempenho dos candidatos neste exame com precisão. Além disso, a abordagem reduz a dependência de custosos processos de pré-calibração em avaliações educacionais.In recent years, advances in pre-trained Neural Language Models on large text corpora have enabled the extraction of rich linguistic representations, allowing for the eficient training of neural networks for specific applications, even with limited datasets. In this context, this thesis investigates the use of these representations for predicting parameters of Item Response Theory (IRT), relying exclusively on the textual content of exam questions. This research introduces an innovative approach by demonstrating the feasibility of obtaining item dificulty parameters from the Item Characteristic Curve, rather than the conventional regression-based approach widely used in the literature. To evaluate this proposal, various Transformer-based encoders were tested, comparing models trained in Portuguese and Multilingual settings. The pyramidal neural architecture developed was able to predict the dificulty parameter of ENEM 2020 and 2021 questions with an average error of 70 points and a median of 58 points. When calculating the IRT scores for a sample of 100,000 students, the mean absolute error remained below 40 points across all exam areas, and below 30 points for the top quartile of candidates, reaching less than 15 points in some cases. Additionally, a novel approach for generating embeddings based on Relative Representations was developed. This method leverages the similarity between question tokens and a selected set of anchor words, reducing computational complexity while maintaining or even improving performance compared to the pyramidal approach, which relies on the full token matrix. The experiments were conducted on a real and nationally relevant dataset, consisting of 2,578 question texts collected from 14 years of ENEM exams. As Brazil's primary university entrance exam, ENEM impacts millions of students annually. The findings of this research suggest that the proposed technology can be used to predict parameters for new exam questions, design simulated tests, and assess candidate performance with high accuracy. Furthermore, this approach reduces reliance on costly pre-calibration processes in educational assessments, optimizing evaluation methodologies.133 f.Clua, Esteban Walter GonzalezBernardini, Flavia CristinaViterbo Filho, JoséOrosa, Luis MartíSanchez-Pi, NayatMarinho, Wemerson Pastor de Oliveira2025-08-12T15:37:35Z2025-08-12T15:37:35Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfMARINHO, Wemerson Pastor de Oliveira. Predicting item response theory parameters using question statements texts. 2025. 133 f. Tese (Doutorado em Computação) – Programa de Pós-Graduação em Computação, Instituto de Computação, Universidade Federal Fluminense, Niterói, 2025.https://app.uff.br/riuff/handle/1/39803ark:/87559/001300001cnxbCC-BY-SAinfo:eu-repo/semantics/openAccessengreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2025-08-12T15:37:35Zoai:app.uff.br:1/39803Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202025-08-12T15:37:35Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false |
| dc.title.none.fl_str_mv |
Predicting item response theory parameters using question statements texts |
| title |
Predicting item response theory parameters using question statements texts |
| spellingShingle |
Predicting item response theory parameters using question statements texts Marinho, Wemerson Pastor de Oliveira ENEM Teoria de resposta ao item Modelos neurais de linguagem Representações relativas Exame Nacional do Ensino Médio (Brasil) Rede neural Linguagem (Computação) Item response theory Neural language models Relative representations |
| title_short |
Predicting item response theory parameters using question statements texts |
| title_full |
Predicting item response theory parameters using question statements texts |
| title_fullStr |
Predicting item response theory parameters using question statements texts |
| title_full_unstemmed |
Predicting item response theory parameters using question statements texts |
| title_sort |
Predicting item response theory parameters using question statements texts |
| author |
Marinho, Wemerson Pastor de Oliveira |
| author_facet |
Marinho, Wemerson Pastor de Oliveira |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Clua, Esteban Walter Gonzalez Bernardini, Flavia Cristina Viterbo Filho, José Orosa, Luis Martí Sanchez-Pi, Nayat |
| dc.contributor.author.fl_str_mv |
Marinho, Wemerson Pastor de Oliveira |
| dc.subject.por.fl_str_mv |
ENEM Teoria de resposta ao item Modelos neurais de linguagem Representações relativas Exame Nacional do Ensino Médio (Brasil) Rede neural Linguagem (Computação) Item response theory Neural language models Relative representations |
| topic |
ENEM Teoria de resposta ao item Modelos neurais de linguagem Representações relativas Exame Nacional do Ensino Médio (Brasil) Rede neural Linguagem (Computação) Item response theory Neural language models Relative representations |
| description |
Nos últimos anos, avanços em Modelos Neurais de Linguagem pré-treinados em grandes corpora de textos têm possibilitado a extração de representações linguísticas ricas, permitindo o treinamento eficiente de redes neurais para aplicações específicas, mesmo com conjuntos de dados reduzidos. Neste contexto, esta tese investiga o uso dessas representações para a predição de parâmetros da Teoria da Resposta ao Item (TRI), utilizando exclusivamente os enunciados das questões. A pesquisa inova ao demonstrar a viabilidade da obtenção dos parâmetros de dificuldade dos itens a partir da Curva Característica do Item, em vez da abordagem convencional de regressão direta sobre os parâmetros, predominante na literatura. Para avaliar essa proposta, foram testados diversos tipos de encoders, baseados em arquiteturas Transformer, comparando modelos treinados em Português e Multilinguais. A arquitetura piramidal desenvolvida foi capaz de predizer o parâmetro de dificuldade das questões do ENEM 2020 e 2021 com um erro médio de 70 pontos e uma mediana de 58 pontos. Ao calcular a nota TRI para uma amostra de 100.000 estudantes, o erro absoluto médio permaneceu abaixo de 40 pontos em todas as áreas do exame. Para o quartil superior dos candidatos, os candidatos mais competitivos do SISU, o erro médio absoluto foi inferior a 30 pontos em todas as áreas, chegando a menos de 15 pontos em algumas delas. Além disso, foi desenvolvida uma nova abordagem para a obtenção de embeddings baseada em Representações Relativas, que explora a similaridade entre os tokens de uma questão e um conjunto de âncoras selecionadas, reduzindo a complexidade computacional do processo. Os experimentos demonstraram que essa estratégia apresenta desempenho similar ou superior à abordagem piramidal, que utiliza a matriz completa de tokens, além de tornar o processo mais eficiente. Os experimentos foram conduzidos em uma base de dados real e de alta relevância nacional, composta por 2.578 enunciados de questões extraídos de 14 anos de exames do ENEM, principal porta de entrada para o ensino superior no Brasil, impactando milhões de estudantes anualmente. Os resultados desta pesquisa indicam que a tecnologia desenvolvida pode ser utilizada para prever parâmetros de novas questões, compor exames simulados e avaliar o desempenho dos candidatos neste exame com precisão. Além disso, a abordagem reduz a dependência de custosos processos de pré-calibração em avaliações educacionais. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-08-12T15:37:35Z 2025-08-12T15:37:35Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
MARINHO, Wemerson Pastor de Oliveira. Predicting item response theory parameters using question statements texts. 2025. 133 f. Tese (Doutorado em Computação) – Programa de Pós-Graduação em Computação, Instituto de Computação, Universidade Federal Fluminense, Niterói, 2025. https://app.uff.br/riuff/handle/1/39803 |
| dc.identifier.dark.fl_str_mv |
ark:/87559/001300001cnxb |
| identifier_str_mv |
MARINHO, Wemerson Pastor de Oliveira. Predicting item response theory parameters using question statements texts. 2025. 133 f. Tese (Doutorado em Computação) – Programa de Pós-Graduação em Computação, Instituto de Computação, Universidade Federal Fluminense, Niterói, 2025. ark:/87559/001300001cnxb |
| url |
https://app.uff.br/riuff/handle/1/39803 |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.rights.driver.fl_str_mv |
CC-BY-SA info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
CC-BY-SA |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF) instname:Universidade Federal Fluminense (UFF) instacron:UFF |
| instname_str |
Universidade Federal Fluminense (UFF) |
| instacron_str |
UFF |
| institution |
UFF |
| reponame_str |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
| collection |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) |
| repository.name.fl_str_mv |
Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF) |
| repository.mail.fl_str_mv |
riuff@id.uff.br |
| _version_ |
1848091254247653376 |