Um método de avaliação automática para a tarefa de perguntas e respostas.

Grava, Ricardo Saraiva

Um método de avaliação automática para a tarefa de perguntas e respostas.

Detalhes bibliográficos
Ano de defesa:	2025
Autor(a) principal:	Grava, Ricardo Saraiva
Orientador(a):	Não Informado pela instituição
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Dissertação
Tipo de acesso:	Acesso aberto
Idioma:	por
Instituição de defesa:	Biblioteca Digitais de Teses e Dissertacoes da USP Universidade de São Paulo Escola Politécnica
Programa de Pós-Graduação:	Não Informado pela instituição
Departamento:	Não Informado pela instituição
País:	Não Informado pela instituição
Palavras-chave em Português:	Inteligência artificial Aprendizado computacional Ataques adversarias Grandes modelos de linguagem Métricas Metrics Machine learning, Evaluation Large language models Adversarial attacks Artificial intelligence Question answering
Link de acesso:	https://teses.usp.br/teses/disponiveis/3/3141/tde-17042026-101413/
Resumo:	Este projeto de pesquisa trata da criação de um método de avaliação automática para sistemas de perguntas e respostas. Perguntas e respostas (QA) é a tarefa de processamento de linguagem natural focada na geração de respostas acuradas a perguntas objetivas. Tratase de um mecanismo com diversas aplicações, como em motores de busca e assistentes virtuais. Modelos de linguagem respondedores de perguntas são tipicamente avaliados por meio de consultas a seres humanos ou pelo cálculo de métricas de avaliação automática, apontadas pela literatura como ineficazes. Este trabalho busca uma nova via, apresentando o Q3AE (Question Answering Adversarial Attack Evaluator), um método que permite avaliar sistemas de QA explorando o uso de ataques adversariais. Tais ataques consistem no processo de gerar exemplos difíceis, provocando o erro do sistema de QA, que neste trabalho são trazidos para QA em língua portuguesa. Os cenários de falha identificados podem ser usados para o cálculo de uma medida de robustez ou para inspeção manual por parte do desenvolvedor. Q3AE é um método replicável e interpretável. Demonstra-se o funcionamento do método por meio de uma bateria de experimentos, testando eficácia do método contra diferentes LLMs, e gerando um estudo comparativo entre modelos das famílias LLaMA e Gemma.

Metadados do item

id	USP_c256bf4258dcc6eee2c267fbd6283df3
oai_identifier_str	oai:teses.usp.br:tde-17042026-101413
network_acronym_str	USP
network_name_str	Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling	Um método de avaliação automática para a tarefa de perguntas e respostas.Untitled in englishInteligência artificialAprendizado computacionalAtaques adversariasGrandes modelos de linguagemMétricasMetricsMachine learning, EvaluationLarge language modelsAdversarial attacksArtificial intelligenceQuestion answeringEste projeto de pesquisa trata da criação de um método de avaliação automática para sistemas de perguntas e respostas. Perguntas e respostas (QA) é a tarefa de processamento de linguagem natural focada na geração de respostas acuradas a perguntas objetivas. Tratase de um mecanismo com diversas aplicações, como em motores de busca e assistentes virtuais. Modelos de linguagem respondedores de perguntas são tipicamente avaliados por meio de consultas a seres humanos ou pelo cálculo de métricas de avaliação automática, apontadas pela literatura como ineficazes. Este trabalho busca uma nova via, apresentando o Q3AE (Question Answering Adversarial Attack Evaluator), um método que permite avaliar sistemas de QA explorando o uso de ataques adversariais. Tais ataques consistem no processo de gerar exemplos difíceis, provocando o erro do sistema de QA, que neste trabalho são trazidos para QA em língua portuguesa. Os cenários de falha identificados podem ser usados para o cálculo de uma medida de robustez ou para inspeção manual por parte do desenvolvedor. Q3AE é um método replicável e interpretável. Demonstra-se o funcionamento do método por meio de uma bateria de experimentos, testando eficácia do método contra diferentes LLMs, e gerando um estudo comparativo entre modelos das famílias LLaMA e Gemma.This research project deals with the creation of an automated evaluation method for Question Answering systems. Question Answering is the natural language processing task focused on the generation of accurate answers to objective questions. It is a mechanism with many applications, such as in search engines or virtual assistants. Question answerer models are typically evaluated by consulting human annotators, an expensive and slow process, or by the calculation of automated evaluation metrics, shown in literature to be ineffective. This work presents Q3AE (Question Answering Adversarial Attack Evaluator), a method that can evaluate QA systems exploring the use of adversarial attacks. Such attacks consist in the process of generating difficult examples, which provoke erroneous output of the QA system, and are in this work brought to QA evaluation in the portuguese language. The systems errors may be used for the calculus of a robustness metric or for manual analysis by the developer. Q3AE is a replicable and interpretable method. The methods functionality is demonstrated by a sequence of experiments, which tests the methods efficacy against LLMs, producing a comparative study between models of the LLaMA and Gemma families.Biblioteca Digitais de Teses e Dissertacoes da USPUniversidade de São PauloEscola PolitécnicaBrandão, Anarosa Alves FrancoGrava, Ricardo Saraiva2025-12-162026-04-17info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://teses.usp.br/teses/disponiveis/3/3141/tde-17042026-101413/doi:10.11606/D.3.2025.tde-17042026-101413Liberar o conteúdo para acesso público.info:eu-repo/semantics/openAccessporreponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USP2026-04-17T13:27:02Zoai:teses.usp.br:tde-17042026-101413Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.bropendoar:27212026-04-17T13:27:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv	Um método de avaliação automática para a tarefa de perguntas e respostas. Untitled in english
title	Um método de avaliação automática para a tarefa de perguntas e respostas.
spellingShingle	Um método de avaliação automática para a tarefa de perguntas e respostas. Grava, Ricardo Saraiva Inteligência artificial Aprendizado computacional Ataques adversarias Grandes modelos de linguagem Métricas Metrics Machine learning, Evaluation Large language models Adversarial attacks Artificial intelligence Question answering
title_short	Um método de avaliação automática para a tarefa de perguntas e respostas.
title_full	Um método de avaliação automática para a tarefa de perguntas e respostas.
title_fullStr	Um método de avaliação automática para a tarefa de perguntas e respostas.
title_full_unstemmed	Um método de avaliação automática para a tarefa de perguntas e respostas.
title_sort	Um método de avaliação automática para a tarefa de perguntas e respostas.
author	Grava, Ricardo Saraiva
author_facet	Grava, Ricardo Saraiva
author_role	author
dc.contributor.none.fl_str_mv	Brandão, Anarosa Alves Franco
dc.contributor.author.fl_str_mv	Grava, Ricardo Saraiva
dc.subject.por.fl_str_mv	Inteligência artificial Aprendizado computacional Ataques adversarias Grandes modelos de linguagem Métricas Metrics Machine learning, Evaluation Large language models Adversarial attacks Artificial intelligence Question answering
topic	Inteligência artificial Aprendizado computacional Ataques adversarias Grandes modelos de linguagem Métricas Metrics Machine learning, Evaluation Large language models Adversarial attacks Artificial intelligence Question answering
description	Este projeto de pesquisa trata da criação de um método de avaliação automática para sistemas de perguntas e respostas. Perguntas e respostas (QA) é a tarefa de processamento de linguagem natural focada na geração de respostas acuradas a perguntas objetivas. Tratase de um mecanismo com diversas aplicações, como em motores de busca e assistentes virtuais. Modelos de linguagem respondedores de perguntas são tipicamente avaliados por meio de consultas a seres humanos ou pelo cálculo de métricas de avaliação automática, apontadas pela literatura como ineficazes. Este trabalho busca uma nova via, apresentando o Q3AE (Question Answering Adversarial Attack Evaluator), um método que permite avaliar sistemas de QA explorando o uso de ataques adversariais. Tais ataques consistem no processo de gerar exemplos difíceis, provocando o erro do sistema de QA, que neste trabalho são trazidos para QA em língua portuguesa. Os cenários de falha identificados podem ser usados para o cálculo de uma medida de robustez ou para inspeção manual por parte do desenvolvedor. Q3AE é um método replicável e interpretável. Demonstra-se o funcionamento do método por meio de uma bateria de experimentos, testando eficácia do método contra diferentes LLMs, e gerando um estudo comparativo entre modelos das famílias LLaMA e Gemma.
publishDate	2025
dc.date.none.fl_str_mv	2025-12-16 2026-04-17
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	https://teses.usp.br/teses/disponiveis/3/3141/tde-17042026-101413/ doi:10.11606/D.3.2025.tde-17042026-101413
url	https://teses.usp.br/teses/disponiveis/3/3141/tde-17042026-101413/
identifier_str_mv	doi:10.11606/D.3.2025.tde-17042026-101413
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess
rights_invalid_str_mv	Liberar o conteúdo para acesso público.
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertacoes da USP Universidade de São Paulo Escola Politécnica
publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertacoes da USP Universidade de São Paulo Escola Politécnica
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP
instname_str	Universidade de São Paulo (USP)
instacron_str	USP
institution	USP
reponame_str	Biblioteca Digital de Teses e Dissertações da USP
collection	Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv	virginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.br
_version_	1865492703730466816

Um método de avaliação automática para a tarefa de perguntas e respostas.

Registros relacionados