DiT-MAE: Modelo Transformer Autoencoder Mascarado para Imputação de Dados Discretos para Questionários Psicométricos Educacionais
| Ano de defesa: | 2025 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Universidade de São Paulo - São Carlos
Externas/Outras Instituições |
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://locus.ufv.br/handle/123456789/34854 |
Resumo: | Modelos de Teoria de Resposta ao Item (TRI) são bastante difundidos e aplicados em avaliações psicométricas para estimar comportamentos, habilidades, proficiências, aprendizado e distúrbios. Essa metodologia permite estimar traços latentes de indivíduos a partir das respostas a itens de um questionário ou prova. Recentemente, modelos da TRI foram incorporados em redes neurais profundas não supervisionadas, da família dos autoencoders, buscando maior flexibilidade e escalabilidade para análise de dados educacionais ou psicológicos de maior dimensão e complexidade. Os modelos do tipo autoencoders são caracterizados por duas redes neurais: uma de codificação que comprime os dados (encoder) e uma de decodificação que tenta reconstruir os dados originais (decoder). As atuais propostas incorporam um modelo de TRI no decoder, tornando essa parte da rede interpretável e capaz de estimar uma maior dimensão de habilidades e complexidade dos dados. No entanto, a grande limitação dessa metodologia é a incapacidade de lidar com a ausência de respostas para um ou mais itens do questionário ou prova. Dados faltantes são bastante comuns nas avaliações educacionais, seja por limitação de tempo de prova, ignorância do conteúdo avaliado no item ou, até mesmo, por planejamento de aplicação da prova de avaliação educacional. Os métodos de estimação usuais na TRI são capazes de lidar com dados faltantes e já foram muito investigados na literatura. Porém, no contexto das novas implementações com autoencoders, estes estudos são escassos, não tão eficazes e podem aumentar o nível de complexidade computacional demasiadamente. Esta pesquisa de trabalho implementou uma arquitetura de rede neural, utilizando modelos Transformers com mecanismos de self-attention, para imputar dados faltantes de avaliações educacionais e melhorar a qualidade das estimativas dos parâmetros do modelo de TRI e interpretabilidade dos resultados. Foram realizadas simulações para comparar com métodos tradicionalmente empregados na literatura. O novo método demonstrou desempenho melhor na redução da complexidade, tempo de execução e na estimativa de parâmetros da TRI para grandes conjuntos de dados e altas dimensões. Uma aplicação real também foi realizada com os dados do PISA. Palavras-chave: Dados Faltantes, Teoria de Resposta ao Item, Modelo Transformer, Redes Neurais, Variational Autoencoder. |
| id |
UFV_ffd063ba8c3082f2daa75895b07f4af5 |
|---|---|
| oai_identifier_str |
oai:locus.ufv.br:123456789/34854 |
| network_acronym_str |
UFV |
| network_name_str |
LOCUS Repositório Institucional da UFV |
| repository_id_str |
|
| spelling |
DiT-MAE: Modelo Transformer Autoencoder Mascarado para Imputação de Dados Discretos para Questionários Psicométricos EducacionaisDiT-MAE: Masked Autoencoder Transformer Model for Discrete Data Imputation for Educational Psychometric QuestionnairesTeoria de Resposta ao ItemRedes NeuraisPsicometriaCIENCIAS EXATAS E DA TERRAModelos de Teoria de Resposta ao Item (TRI) são bastante difundidos e aplicados em avaliações psicométricas para estimar comportamentos, habilidades, proficiências, aprendizado e distúrbios. Essa metodologia permite estimar traços latentes de indivíduos a partir das respostas a itens de um questionário ou prova. Recentemente, modelos da TRI foram incorporados em redes neurais profundas não supervisionadas, da família dos autoencoders, buscando maior flexibilidade e escalabilidade para análise de dados educacionais ou psicológicos de maior dimensão e complexidade. Os modelos do tipo autoencoders são caracterizados por duas redes neurais: uma de codificação que comprime os dados (encoder) e uma de decodificação que tenta reconstruir os dados originais (decoder). As atuais propostas incorporam um modelo de TRI no decoder, tornando essa parte da rede interpretável e capaz de estimar uma maior dimensão de habilidades e complexidade dos dados. No entanto, a grande limitação dessa metodologia é a incapacidade de lidar com a ausência de respostas para um ou mais itens do questionário ou prova. Dados faltantes são bastante comuns nas avaliações educacionais, seja por limitação de tempo de prova, ignorância do conteúdo avaliado no item ou, até mesmo, por planejamento de aplicação da prova de avaliação educacional. Os métodos de estimação usuais na TRI são capazes de lidar com dados faltantes e já foram muito investigados na literatura. Porém, no contexto das novas implementações com autoencoders, estes estudos são escassos, não tão eficazes e podem aumentar o nível de complexidade computacional demasiadamente. Esta pesquisa de trabalho implementou uma arquitetura de rede neural, utilizando modelos Transformers com mecanismos de self-attention, para imputar dados faltantes de avaliações educacionais e melhorar a qualidade das estimativas dos parâmetros do modelo de TRI e interpretabilidade dos resultados. Foram realizadas simulações para comparar com métodos tradicionalmente empregados na literatura. O novo método demonstrou desempenho melhor na redução da complexidade, tempo de execução e na estimativa de parâmetros da TRI para grandes conjuntos de dados e altas dimensões. Uma aplicação real também foi realizada com os dados do PISA. Palavras-chave: Dados Faltantes, Teoria de Resposta ao Item, Modelo Transformer, Redes Neurais, Variational Autoencoder.Item Response Theory (IRT) models are widely used and applied in psychometric assessments to estimate behaviors, skills, proficiencies, learning, and disorders. This methodology allows for the estimation of latent traits of individuals based on responses to items in a questionnaire or test. Recently, IRT models have been incorporated into unsupervised deep neural networks, from the autoencoder family, seeking greater flexibility and scalability to analyze larger and more complex educational or psychological data. Autoencoder models are characterized by two neural networks: an encoding network that compresses the data (encoder) and a decoding network that attempts to reconstruct the original data (decoder). Current proposals incorporate an IRT model into the decoder, making this part of the network interpretable and capable of estimating a larger dimension of skills and data complexity. However, the major limitation of this methodology is the inability to deal with the absence of responses to one or more items in the questionnaire or test. Missing data are quite common in educational assessments, whether due to time constraints, ignorance of the content assessed in the item, or even due to the planning of the educational assessment test application. The usual study methods in IRT are capable of dealing with missing data and have already been extensively investigated in the literature. However, in the context of new implementations with autoencoders, these studies are scarce, not so practical, and can significantly increase the computational complexity. This research work implemented a neural network architecture, using transformer models with self-attention mechanisms, to impute missing data from educational assessments and improve the quality of the estimates of the parameters of the IRT model and the interpretability of the results. Simulations were performed to compare with traditional methods used in the literature. The new method demonstrated better performance in reducing the complexity, execution time, and parameter estimation of TRIM for large data sets and high dimensions. A real application was also performed with PISA data. Keywords: Item Response Theory, Missing Data, Neural Networks, Transformer Model, Varia- tional Autoencoder.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - (CAPES)Universidade de São Paulo - São CarlosExternas/Outras InstituiçõesCuri, Marianahttp://lattes.cnpq.br/3016452229354730Souza, Frederico de Oliveira e2025-11-13T11:59:40Z2025-02info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfFREIRE, Guilherme Mendonça. DiT-MAE: Modelo Transformer Autoencoder Mascarado para Imputação de Dados Discretos para Questionários Psicométricos Educacionais. 2025. 87 f. Tese (Doutorado em Ciências de Computação e Matemática Computacional) - Universidade de São Paulo, São Carlos. 2025.https://locus.ufv.br/handle/123456789/34854porinfo:eu-repo/semantics/openAccessreponame:LOCUS Repositório Institucional da UFVinstname:Universidade Federal de Viçosa (UFV)instacron:UFV2025-11-14T06:02:00Zoai:locus.ufv.br:123456789/34854Repositório InstitucionalPUBhttps://www.locus.ufv.br/oai/requestfabiojreis@ufv.bropendoar:21452025-11-14T06:02LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV)false |
| dc.title.none.fl_str_mv |
DiT-MAE: Modelo Transformer Autoencoder Mascarado para Imputação de Dados Discretos para Questionários Psicométricos Educacionais DiT-MAE: Masked Autoencoder Transformer Model for Discrete Data Imputation for Educational Psychometric Questionnaires |
| title |
DiT-MAE: Modelo Transformer Autoencoder Mascarado para Imputação de Dados Discretos para Questionários Psicométricos Educacionais |
| spellingShingle |
DiT-MAE: Modelo Transformer Autoencoder Mascarado para Imputação de Dados Discretos para Questionários Psicométricos Educacionais Souza, Frederico de Oliveira e Teoria de Resposta ao Item Redes Neurais Psicometria CIENCIAS EXATAS E DA TERRA |
| title_short |
DiT-MAE: Modelo Transformer Autoencoder Mascarado para Imputação de Dados Discretos para Questionários Psicométricos Educacionais |
| title_full |
DiT-MAE: Modelo Transformer Autoencoder Mascarado para Imputação de Dados Discretos para Questionários Psicométricos Educacionais |
| title_fullStr |
DiT-MAE: Modelo Transformer Autoencoder Mascarado para Imputação de Dados Discretos para Questionários Psicométricos Educacionais |
| title_full_unstemmed |
DiT-MAE: Modelo Transformer Autoencoder Mascarado para Imputação de Dados Discretos para Questionários Psicométricos Educacionais |
| title_sort |
DiT-MAE: Modelo Transformer Autoencoder Mascarado para Imputação de Dados Discretos para Questionários Psicométricos Educacionais |
| author |
Souza, Frederico de Oliveira e |
| author_facet |
Souza, Frederico de Oliveira e |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Curi, Mariana http://lattes.cnpq.br/3016452229354730 |
| dc.contributor.author.fl_str_mv |
Souza, Frederico de Oliveira e |
| dc.subject.por.fl_str_mv |
Teoria de Resposta ao Item Redes Neurais Psicometria CIENCIAS EXATAS E DA TERRA |
| topic |
Teoria de Resposta ao Item Redes Neurais Psicometria CIENCIAS EXATAS E DA TERRA |
| description |
Modelos de Teoria de Resposta ao Item (TRI) são bastante difundidos e aplicados em avaliações psicométricas para estimar comportamentos, habilidades, proficiências, aprendizado e distúrbios. Essa metodologia permite estimar traços latentes de indivíduos a partir das respostas a itens de um questionário ou prova. Recentemente, modelos da TRI foram incorporados em redes neurais profundas não supervisionadas, da família dos autoencoders, buscando maior flexibilidade e escalabilidade para análise de dados educacionais ou psicológicos de maior dimensão e complexidade. Os modelos do tipo autoencoders são caracterizados por duas redes neurais: uma de codificação que comprime os dados (encoder) e uma de decodificação que tenta reconstruir os dados originais (decoder). As atuais propostas incorporam um modelo de TRI no decoder, tornando essa parte da rede interpretável e capaz de estimar uma maior dimensão de habilidades e complexidade dos dados. No entanto, a grande limitação dessa metodologia é a incapacidade de lidar com a ausência de respostas para um ou mais itens do questionário ou prova. Dados faltantes são bastante comuns nas avaliações educacionais, seja por limitação de tempo de prova, ignorância do conteúdo avaliado no item ou, até mesmo, por planejamento de aplicação da prova de avaliação educacional. Os métodos de estimação usuais na TRI são capazes de lidar com dados faltantes e já foram muito investigados na literatura. Porém, no contexto das novas implementações com autoencoders, estes estudos são escassos, não tão eficazes e podem aumentar o nível de complexidade computacional demasiadamente. Esta pesquisa de trabalho implementou uma arquitetura de rede neural, utilizando modelos Transformers com mecanismos de self-attention, para imputar dados faltantes de avaliações educacionais e melhorar a qualidade das estimativas dos parâmetros do modelo de TRI e interpretabilidade dos resultados. Foram realizadas simulações para comparar com métodos tradicionalmente empregados na literatura. O novo método demonstrou desempenho melhor na redução da complexidade, tempo de execução e na estimativa de parâmetros da TRI para grandes conjuntos de dados e altas dimensões. Uma aplicação real também foi realizada com os dados do PISA. Palavras-chave: Dados Faltantes, Teoria de Resposta ao Item, Modelo Transformer, Redes Neurais, Variational Autoencoder. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-11-13T11:59:40Z 2025-02 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
FREIRE, Guilherme Mendonça. DiT-MAE: Modelo Transformer Autoencoder Mascarado para Imputação de Dados Discretos para Questionários Psicométricos Educacionais. 2025. 87 f. Tese (Doutorado em Ciências de Computação e Matemática Computacional) - Universidade de São Paulo, São Carlos. 2025. https://locus.ufv.br/handle/123456789/34854 |
| identifier_str_mv |
FREIRE, Guilherme Mendonça. DiT-MAE: Modelo Transformer Autoencoder Mascarado para Imputação de Dados Discretos para Questionários Psicométricos Educacionais. 2025. 87 f. Tese (Doutorado em Ciências de Computação e Matemática Computacional) - Universidade de São Paulo, São Carlos. 2025. |
| url |
https://locus.ufv.br/handle/123456789/34854 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade de São Paulo - São Carlos Externas/Outras Instituições |
| publisher.none.fl_str_mv |
Universidade de São Paulo - São Carlos Externas/Outras Instituições |
| dc.source.none.fl_str_mv |
reponame:LOCUS Repositório Institucional da UFV instname:Universidade Federal de Viçosa (UFV) instacron:UFV |
| instname_str |
Universidade Federal de Viçosa (UFV) |
| instacron_str |
UFV |
| institution |
UFV |
| reponame_str |
LOCUS Repositório Institucional da UFV |
| collection |
LOCUS Repositório Institucional da UFV |
| repository.name.fl_str_mv |
LOCUS Repositório Institucional da UFV - Universidade Federal de Viçosa (UFV) |
| repository.mail.fl_str_mv |
fabiojreis@ufv.br |
| _version_ |
1855045550698659840 |