Predicting item response theory parameters using question statements texts

Marinho, Wemerson Pastor de Oliveira

Predicting item response theory parameters using question statements texts

Detalhes bibliográficos
Ano de defesa:	2025
Autor(a) principal:	Marinho, Wemerson Pastor de Oliveira
Orientador(a):	Não Informado pela instituição
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Tese
Tipo de acesso:	Acesso aberto
dARK ID:	ark:/87559/001300001cnxb
Idioma:	eng
Instituição de defesa:	Não Informado pela instituição
Programa de Pós-Graduação:	Não Informado pela instituição
Departamento:	Não Informado pela instituição
País:	Não Informado pela instituição
Palavras-chave em Português:	ENEM Teoria de resposta ao item Modelos neurais de linguagem Representações relativas Exame Nacional do Ensino Médio (Brasil) Rede neural Linguagem (Computação) Item response theory Neural language models Relative representations
Link de acesso:	https://app.uff.br/riuff/handle/1/39803
Resumo:	Nos últimos anos, avanços em Modelos Neurais de Linguagem pré-treinados em grandes corpora de textos têm possibilitado a extração de representações linguísticas ricas, permitindo o treinamento eficiente de redes neurais para aplicações específicas, mesmo com conjuntos de dados reduzidos. Neste contexto, esta tese investiga o uso dessas representações para a predição de parâmetros da Teoria da Resposta ao Item (TRI), utilizando exclusivamente os enunciados das questões. A pesquisa inova ao demonstrar a viabilidade da obtenção dos parâmetros de dificuldade dos itens a partir da Curva Característica do Item, em vez da abordagem convencional de regressão direta sobre os parâmetros, predominante na literatura. Para avaliar essa proposta, foram testados diversos tipos de encoders, baseados em arquiteturas Transformer, comparando modelos treinados em Português e Multilinguais. A arquitetura piramidal desenvolvida foi capaz de predizer o parâmetro de dificuldade das questões do ENEM 2020 e 2021 com um erro médio de 70 pontos e uma mediana de 58 pontos. Ao calcular a nota TRI para uma amostra de 100.000 estudantes, o erro absoluto médio permaneceu abaixo de 40 pontos em todas as áreas do exame. Para o quartil superior dos candidatos, os candidatos mais competitivos do SISU, o erro médio absoluto foi inferior a 30 pontos em todas as áreas, chegando a menos de 15 pontos em algumas delas. Além disso, foi desenvolvida uma nova abordagem para a obtenção de embeddings baseada em Representações Relativas, que explora a similaridade entre os tokens de uma questão e um conjunto de âncoras selecionadas, reduzindo a complexidade computacional do processo. Os experimentos demonstraram que essa estratégia apresenta desempenho similar ou superior à abordagem piramidal, que utiliza a matriz completa de tokens, além de tornar o processo mais eficiente. Os experimentos foram conduzidos em uma base de dados real e de alta relevância nacional, composta por 2.578 enunciados de questões extraídos de 14 anos de exames do ENEM, principal porta de entrada para o ensino superior no Brasil, impactando milhões de estudantes anualmente. Os resultados desta pesquisa indicam que a tecnologia desenvolvida pode ser utilizada para prever parâmetros de novas questões, compor exames simulados e avaliar o desempenho dos candidatos neste exame com precisão. Além disso, a abordagem reduz a dependência de custosos processos de pré-calibração em avaliações educacionais.

Metadados do item

id	UFF-2_b5a6dfe9c4712257ded54bb9aa9bd8b5
oai_identifier_str	oai:app.uff.br:1/39803
network_acronym_str	UFF-2
network_name_str	Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository_id_str
spelling	Predicting item response theory parameters using question statements textsENEMTeoria de resposta ao itemModelos neurais de linguagemRepresentações relativasExame Nacional do Ensino Médio (Brasil)Rede neuralLinguagem (Computação)Item response theoryNeural language modelsRelative representationsNos últimos anos, avanços em Modelos Neurais de Linguagem pré-treinados em grandes corpora de textos têm possibilitado a extração de representações linguísticas ricas, permitindo o treinamento eficiente de redes neurais para aplicações específicas, mesmo com conjuntos de dados reduzidos. Neste contexto, esta tese investiga o uso dessas representações para a predição de parâmetros da Teoria da Resposta ao Item (TRI), utilizando exclusivamente os enunciados das questões. A pesquisa inova ao demonstrar a viabilidade da obtenção dos parâmetros de dificuldade dos itens a partir da Curva Característica do Item, em vez da abordagem convencional de regressão direta sobre os parâmetros, predominante na literatura. Para avaliar essa proposta, foram testados diversos tipos de encoders, baseados em arquiteturas Transformer, comparando modelos treinados em Português e Multilinguais. A arquitetura piramidal desenvolvida foi capaz de predizer o parâmetro de dificuldade das questões do ENEM 2020 e 2021 com um erro médio de 70 pontos e uma mediana de 58 pontos. Ao calcular a nota TRI para uma amostra de 100.000 estudantes, o erro absoluto médio permaneceu abaixo de 40 pontos em todas as áreas do exame. Para o quartil superior dos candidatos, os candidatos mais competitivos do SISU, o erro médio absoluto foi inferior a 30 pontos em todas as áreas, chegando a menos de 15 pontos em algumas delas. Além disso, foi desenvolvida uma nova abordagem para a obtenção de embeddings baseada em Representações Relativas, que explora a similaridade entre os tokens de uma questão e um conjunto de âncoras selecionadas, reduzindo a complexidade computacional do processo. Os experimentos demonstraram que essa estratégia apresenta desempenho similar ou superior à abordagem piramidal, que utiliza a matriz completa de tokens, além de tornar o processo mais eficiente. Os experimentos foram conduzidos em uma base de dados real e de alta relevância nacional, composta por 2.578 enunciados de questões extraídos de 14 anos de exames do ENEM, principal porta de entrada para o ensino superior no Brasil, impactando milhões de estudantes anualmente. Os resultados desta pesquisa indicam que a tecnologia desenvolvida pode ser utilizada para prever parâmetros de novas questões, compor exames simulados e avaliar o desempenho dos candidatos neste exame com precisão. Além disso, a abordagem reduz a dependência de custosos processos de pré-calibração em avaliações educacionais.In recent years, advances in pre-trained Neural Language Models on large text corpora have enabled the extraction of rich linguistic representations, allowing for the eficient training of neural networks for specific applications, even with limited datasets. In this context, this thesis investigates the use of these representations for predicting parameters of Item Response Theory (IRT), relying exclusively on the textual content of exam questions. This research introduces an innovative approach by demonstrating the feasibility of obtaining item dificulty parameters from the Item Characteristic Curve, rather than the conventional regression-based approach widely used in the literature. To evaluate this proposal, various Transformer-based encoders were tested, comparing models trained in Portuguese and Multilingual settings. The pyramidal neural architecture developed was able to predict the dificulty parameter of ENEM 2020 and 2021 questions with an average error of 70 points and a median of 58 points. When calculating the IRT scores for a sample of 100,000 students, the mean absolute error remained below 40 points across all exam areas, and below 30 points for the top quartile of candidates, reaching less than 15 points in some cases. Additionally, a novel approach for generating embeddings based on Relative Representations was developed. This method leverages the similarity between question tokens and a selected set of anchor words, reducing computational complexity while maintaining or even improving performance compared to the pyramidal approach, which relies on the full token matrix. The experiments were conducted on a real and nationally relevant dataset, consisting of 2,578 question texts collected from 14 years of ENEM exams. As Brazil's primary university entrance exam, ENEM impacts millions of students annually. The findings of this research suggest that the proposed technology can be used to predict parameters for new exam questions, design simulated tests, and assess candidate performance with high accuracy. Furthermore, this approach reduces reliance on costly pre-calibration processes in educational assessments, optimizing evaluation methodologies.133 f.Clua, Esteban Walter GonzalezBernardini, Flavia CristinaViterbo Filho, JoséOrosa, Luis MartíSanchez-Pi, NayatMarinho, Wemerson Pastor de Oliveira2025-08-12T15:37:35Z2025-08-12T15:37:35Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfMARINHO, Wemerson Pastor de Oliveira. Predicting item response theory parameters using question statements texts. 2025. 133 f. Tese (Doutorado em Computação) – Programa de Pós-Graduação em Computação, Instituto de Computação, Universidade Federal Fluminense, Niterói, 2025.https://app.uff.br/riuff/handle/1/39803ark:/87559/001300001cnxbCC-BY-SAinfo:eu-repo/semantics/openAccessengreponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF)instname:Universidade Federal Fluminense (UFF)instacron:UFF2025-08-12T15:37:35Zoai:app.uff.br:1/39803Repositório InstitucionalPUBhttps://app.uff.br/oai/requestriuff@id.uff.bropendoar:21202025-08-12T15:37:35Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)false
dc.title.none.fl_str_mv	Predicting item response theory parameters using question statements texts
title	Predicting item response theory parameters using question statements texts
spellingShingle	Predicting item response theory parameters using question statements texts Marinho, Wemerson Pastor de Oliveira ENEM Teoria de resposta ao item Modelos neurais de linguagem Representações relativas Exame Nacional do Ensino Médio (Brasil) Rede neural Linguagem (Computação) Item response theory Neural language models Relative representations
title_short	Predicting item response theory parameters using question statements texts
title_full	Predicting item response theory parameters using question statements texts
title_fullStr	Predicting item response theory parameters using question statements texts
title_full_unstemmed	Predicting item response theory parameters using question statements texts
title_sort	Predicting item response theory parameters using question statements texts
author	Marinho, Wemerson Pastor de Oliveira
author_facet	Marinho, Wemerson Pastor de Oliveira
author_role	author
dc.contributor.none.fl_str_mv	Clua, Esteban Walter Gonzalez Bernardini, Flavia Cristina Viterbo Filho, José Orosa, Luis Martí Sanchez-Pi, Nayat
dc.contributor.author.fl_str_mv	Marinho, Wemerson Pastor de Oliveira
dc.subject.por.fl_str_mv	ENEM Teoria de resposta ao item Modelos neurais de linguagem Representações relativas Exame Nacional do Ensino Médio (Brasil) Rede neural Linguagem (Computação) Item response theory Neural language models Relative representations
topic	ENEM Teoria de resposta ao item Modelos neurais de linguagem Representações relativas Exame Nacional do Ensino Médio (Brasil) Rede neural Linguagem (Computação) Item response theory Neural language models Relative representations
description	Nos últimos anos, avanços em Modelos Neurais de Linguagem pré-treinados em grandes corpora de textos têm possibilitado a extração de representações linguísticas ricas, permitindo o treinamento eficiente de redes neurais para aplicações específicas, mesmo com conjuntos de dados reduzidos. Neste contexto, esta tese investiga o uso dessas representações para a predição de parâmetros da Teoria da Resposta ao Item (TRI), utilizando exclusivamente os enunciados das questões. A pesquisa inova ao demonstrar a viabilidade da obtenção dos parâmetros de dificuldade dos itens a partir da Curva Característica do Item, em vez da abordagem convencional de regressão direta sobre os parâmetros, predominante na literatura. Para avaliar essa proposta, foram testados diversos tipos de encoders, baseados em arquiteturas Transformer, comparando modelos treinados em Português e Multilinguais. A arquitetura piramidal desenvolvida foi capaz de predizer o parâmetro de dificuldade das questões do ENEM 2020 e 2021 com um erro médio de 70 pontos e uma mediana de 58 pontos. Ao calcular a nota TRI para uma amostra de 100.000 estudantes, o erro absoluto médio permaneceu abaixo de 40 pontos em todas as áreas do exame. Para o quartil superior dos candidatos, os candidatos mais competitivos do SISU, o erro médio absoluto foi inferior a 30 pontos em todas as áreas, chegando a menos de 15 pontos em algumas delas. Além disso, foi desenvolvida uma nova abordagem para a obtenção de embeddings baseada em Representações Relativas, que explora a similaridade entre os tokens de uma questão e um conjunto de âncoras selecionadas, reduzindo a complexidade computacional do processo. Os experimentos demonstraram que essa estratégia apresenta desempenho similar ou superior à abordagem piramidal, que utiliza a matriz completa de tokens, além de tornar o processo mais eficiente. Os experimentos foram conduzidos em uma base de dados real e de alta relevância nacional, composta por 2.578 enunciados de questões extraídos de 14 anos de exames do ENEM, principal porta de entrada para o ensino superior no Brasil, impactando milhões de estudantes anualmente. Os resultados desta pesquisa indicam que a tecnologia desenvolvida pode ser utilizada para prever parâmetros de novas questões, compor exames simulados e avaliar o desempenho dos candidatos neste exame com precisão. Além disso, a abordagem reduz a dependência de custosos processos de pré-calibração em avaliações educacionais.
publishDate	2025
dc.date.none.fl_str_mv	2025-08-12T15:37:35Z 2025-08-12T15:37:35Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/doctoralThesis
format	doctoralThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	MARINHO, Wemerson Pastor de Oliveira. Predicting item response theory parameters using question statements texts. 2025. 133 f. Tese (Doutorado em Computação) – Programa de Pós-Graduação em Computação, Instituto de Computação, Universidade Federal Fluminense, Niterói, 2025. https://app.uff.br/riuff/handle/1/39803
dc.identifier.dark.fl_str_mv	ark:/87559/001300001cnxb
identifier_str_mv	MARINHO, Wemerson Pastor de Oliveira. Predicting item response theory parameters using question statements texts. 2025. 133 f. Tese (Doutorado em Computação) – Programa de Pós-Graduação em Computação, Instituto de Computação, Universidade Federal Fluminense, Niterói, 2025. ark:/87559/001300001cnxb
url	https://app.uff.br/riuff/handle/1/39803
dc.language.iso.fl_str_mv	eng
language	eng
dc.rights.driver.fl_str_mv	CC-BY-SA info:eu-repo/semantics/openAccess
rights_invalid_str_mv	CC-BY-SA
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.source.none.fl_str_mv	reponame:Repositório Institucional da Universidade Federal Fluminense (RIUFF) instname:Universidade Federal Fluminense (UFF) instacron:UFF
instname_str	Universidade Federal Fluminense (UFF)
instacron_str	UFF
institution	UFF
reponame_str	Repositório Institucional da Universidade Federal Fluminense (RIUFF)
collection	Repositório Institucional da Universidade Federal Fluminense (RIUFF)
repository.name.fl_str_mv	Repositório Institucional da Universidade Federal Fluminense (RIUFF) - Universidade Federal Fluminense (UFF)
repository.mail.fl_str_mv	riuff@id.uff.br
_version_	1848091254247653376

Predicting item response theory parameters using question statements texts

Registros relacionados