Exportação concluída — 

Um método de avaliação automática para a tarefa de perguntas e respostas.

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Grava, Ricardo Saraiva
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertacoes da USP
Universidade de São Paulo
Escola Politécnica
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://teses.usp.br/teses/disponiveis/3/3141/tde-17042026-101413/
Resumo: Este projeto de pesquisa trata da criação de um método de avaliação automática para sistemas de perguntas e respostas. Perguntas e respostas (QA) é a tarefa de processamento de linguagem natural focada na geração de respostas acuradas a perguntas objetivas. Tratase de um mecanismo com diversas aplicações, como em motores de busca e assistentes virtuais. Modelos de linguagem respondedores de perguntas são tipicamente avaliados por meio de consultas a seres humanos ou pelo cálculo de métricas de avaliação automática, apontadas pela literatura como ineficazes. Este trabalho busca uma nova via, apresentando o Q3AE (Question Answering Adversarial Attack Evaluator), um método que permite avaliar sistemas de QA explorando o uso de ataques adversariais. Tais ataques consistem no processo de gerar exemplos difíceis, provocando o erro do sistema de QA, que neste trabalho são trazidos para QA em língua portuguesa. Os cenários de falha identificados podem ser usados para o cálculo de uma medida de robustez ou para inspeção manual por parte do desenvolvedor. Q3AE é um método replicável e interpretável. Demonstra-se o funcionamento do método por meio de uma bateria de experimentos, testando eficácia do método contra diferentes LLMs, e gerando um estudo comparativo entre modelos das famílias LLaMA e Gemma.
id USP_c256bf4258dcc6eee2c267fbd6283df3
oai_identifier_str oai:teses.usp.br:tde-17042026-101413
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Um método de avaliação automática para a tarefa de perguntas e respostas.Untitled in englishInteligência artificialAprendizado computacionalAtaques adversariasGrandes modelos de linguagemMétricasMetricsMachine learning, EvaluationLarge language modelsAdversarial attacksArtificial intelligenceQuestion answeringEste projeto de pesquisa trata da criação de um método de avaliação automática para sistemas de perguntas e respostas. Perguntas e respostas (QA) é a tarefa de processamento de linguagem natural focada na geração de respostas acuradas a perguntas objetivas. Tratase de um mecanismo com diversas aplicações, como em motores de busca e assistentes virtuais. Modelos de linguagem respondedores de perguntas são tipicamente avaliados por meio de consultas a seres humanos ou pelo cálculo de métricas de avaliação automática, apontadas pela literatura como ineficazes. Este trabalho busca uma nova via, apresentando o Q3AE (Question Answering Adversarial Attack Evaluator), um método que permite avaliar sistemas de QA explorando o uso de ataques adversariais. Tais ataques consistem no processo de gerar exemplos difíceis, provocando o erro do sistema de QA, que neste trabalho são trazidos para QA em língua portuguesa. Os cenários de falha identificados podem ser usados para o cálculo de uma medida de robustez ou para inspeção manual por parte do desenvolvedor. Q3AE é um método replicável e interpretável. Demonstra-se o funcionamento do método por meio de uma bateria de experimentos, testando eficácia do método contra diferentes LLMs, e gerando um estudo comparativo entre modelos das famílias LLaMA e Gemma.This research project deals with the creation of an automated evaluation method for Question Answering systems. Question Answering is the natural language processing task focused on the generation of accurate answers to objective questions. It is a mechanism with many applications, such as in search engines or virtual assistants. Question answerer models are typically evaluated by consulting human annotators, an expensive and slow process, or by the calculation of automated evaluation metrics, shown in literature to be ineffective. This work presents Q3AE (Question Answering Adversarial Attack Evaluator), a method that can evaluate QA systems exploring the use of adversarial attacks. Such attacks consist in the process of generating difficult examples, which provoke erroneous output of the QA system, and are in this work brought to QA evaluation in the portuguese language. The systems errors may be used for the calculus of a robustness metric or for manual analysis by the developer. Q3AE is a replicable and interpretable method. The methods functionality is demonstrated by a sequence of experiments, which tests the methods efficacy against LLMs, producing a comparative study between models of the LLaMA and Gemma families.Biblioteca Digitais de Teses e Dissertacoes da USPUniversidade de São PauloEscola PolitécnicaBrandão, Anarosa Alves FrancoGrava, Ricardo Saraiva2025-12-162026-04-17info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://teses.usp.br/teses/disponiveis/3/3141/tde-17042026-101413/doi:10.11606/D.3.2025.tde-17042026-101413Liberar o conteúdo para acesso público.info:eu-repo/semantics/openAccessporreponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USP2026-04-17T13:27:02Zoai:teses.usp.br:tde-17042026-101413Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212026-04-17T13:27:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Um método de avaliação automática para a tarefa de perguntas e respostas.
Untitled in english
title Um método de avaliação automática para a tarefa de perguntas e respostas.
spellingShingle Um método de avaliação automática para a tarefa de perguntas e respostas.
Grava, Ricardo Saraiva
Inteligência artificial
Aprendizado computacional
Ataques adversarias
Grandes modelos de linguagem
Métricas
Metrics
Machine learning, Evaluation
Large language models
Adversarial attacks
Artificial intelligence
Question answering
title_short Um método de avaliação automática para a tarefa de perguntas e respostas.
title_full Um método de avaliação automática para a tarefa de perguntas e respostas.
title_fullStr Um método de avaliação automática para a tarefa de perguntas e respostas.
title_full_unstemmed Um método de avaliação automática para a tarefa de perguntas e respostas.
title_sort Um método de avaliação automática para a tarefa de perguntas e respostas.
author Grava, Ricardo Saraiva
author_facet Grava, Ricardo Saraiva
author_role author
dc.contributor.none.fl_str_mv Brandão, Anarosa Alves Franco
dc.contributor.author.fl_str_mv Grava, Ricardo Saraiva
dc.subject.por.fl_str_mv Inteligência artificial
Aprendizado computacional
Ataques adversarias
Grandes modelos de linguagem
Métricas
Metrics
Machine learning, Evaluation
Large language models
Adversarial attacks
Artificial intelligence
Question answering
topic Inteligência artificial
Aprendizado computacional
Ataques adversarias
Grandes modelos de linguagem
Métricas
Metrics
Machine learning, Evaluation
Large language models
Adversarial attacks
Artificial intelligence
Question answering
description Este projeto de pesquisa trata da criação de um método de avaliação automática para sistemas de perguntas e respostas. Perguntas e respostas (QA) é a tarefa de processamento de linguagem natural focada na geração de respostas acuradas a perguntas objetivas. Tratase de um mecanismo com diversas aplicações, como em motores de busca e assistentes virtuais. Modelos de linguagem respondedores de perguntas são tipicamente avaliados por meio de consultas a seres humanos ou pelo cálculo de métricas de avaliação automática, apontadas pela literatura como ineficazes. Este trabalho busca uma nova via, apresentando o Q3AE (Question Answering Adversarial Attack Evaluator), um método que permite avaliar sistemas de QA explorando o uso de ataques adversariais. Tais ataques consistem no processo de gerar exemplos difíceis, provocando o erro do sistema de QA, que neste trabalho são trazidos para QA em língua portuguesa. Os cenários de falha identificados podem ser usados para o cálculo de uma medida de robustez ou para inspeção manual por parte do desenvolvedor. Q3AE é um método replicável e interpretável. Demonstra-se o funcionamento do método por meio de uma bateria de experimentos, testando eficácia do método contra diferentes LLMs, e gerando um estudo comparativo entre modelos das famílias LLaMA e Gemma.
publishDate 2025
dc.date.none.fl_str_mv 2025-12-16
2026-04-17
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://teses.usp.br/teses/disponiveis/3/3141/tde-17042026-101413/
doi:10.11606/D.3.2025.tde-17042026-101413
url https://teses.usp.br/teses/disponiveis/3/3141/tde-17042026-101413/
identifier_str_mv doi:10.11606/D.3.2025.tde-17042026-101413
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertacoes da USP
Universidade de São Paulo
Escola Politécnica
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertacoes da USP
Universidade de São Paulo
Escola Politécnica
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1865492703730466816