Um método de avaliação automática para a tarefa de perguntas e respostas.
| Ano de defesa: | 2025 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertacoes da USP
Universidade de São Paulo Escola Politécnica |
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://teses.usp.br/teses/disponiveis/3/3141/tde-17042026-101413/ |
Resumo: | Este projeto de pesquisa trata da criação de um método de avaliação automática para sistemas de perguntas e respostas. Perguntas e respostas (QA) é a tarefa de processamento de linguagem natural focada na geração de respostas acuradas a perguntas objetivas. Tratase de um mecanismo com diversas aplicações, como em motores de busca e assistentes virtuais. Modelos de linguagem respondedores de perguntas são tipicamente avaliados por meio de consultas a seres humanos ou pelo cálculo de métricas de avaliação automática, apontadas pela literatura como ineficazes. Este trabalho busca uma nova via, apresentando o Q3AE (Question Answering Adversarial Attack Evaluator), um método que permite avaliar sistemas de QA explorando o uso de ataques adversariais. Tais ataques consistem no processo de gerar exemplos difíceis, provocando o erro do sistema de QA, que neste trabalho são trazidos para QA em língua portuguesa. Os cenários de falha identificados podem ser usados para o cálculo de uma medida de robustez ou para inspeção manual por parte do desenvolvedor. Q3AE é um método replicável e interpretável. Demonstra-se o funcionamento do método por meio de uma bateria de experimentos, testando eficácia do método contra diferentes LLMs, e gerando um estudo comparativo entre modelos das famílias LLaMA e Gemma. |
| id |
USP_c256bf4258dcc6eee2c267fbd6283df3 |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-17042026-101413 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Um método de avaliação automática para a tarefa de perguntas e respostas.Untitled in englishInteligência artificialAprendizado computacionalAtaques adversariasGrandes modelos de linguagemMétricasMetricsMachine learning, EvaluationLarge language modelsAdversarial attacksArtificial intelligenceQuestion answeringEste projeto de pesquisa trata da criação de um método de avaliação automática para sistemas de perguntas e respostas. Perguntas e respostas (QA) é a tarefa de processamento de linguagem natural focada na geração de respostas acuradas a perguntas objetivas. Tratase de um mecanismo com diversas aplicações, como em motores de busca e assistentes virtuais. Modelos de linguagem respondedores de perguntas são tipicamente avaliados por meio de consultas a seres humanos ou pelo cálculo de métricas de avaliação automática, apontadas pela literatura como ineficazes. Este trabalho busca uma nova via, apresentando o Q3AE (Question Answering Adversarial Attack Evaluator), um método que permite avaliar sistemas de QA explorando o uso de ataques adversariais. Tais ataques consistem no processo de gerar exemplos difíceis, provocando o erro do sistema de QA, que neste trabalho são trazidos para QA em língua portuguesa. Os cenários de falha identificados podem ser usados para o cálculo de uma medida de robustez ou para inspeção manual por parte do desenvolvedor. Q3AE é um método replicável e interpretável. Demonstra-se o funcionamento do método por meio de uma bateria de experimentos, testando eficácia do método contra diferentes LLMs, e gerando um estudo comparativo entre modelos das famílias LLaMA e Gemma.This research project deals with the creation of an automated evaluation method for Question Answering systems. Question Answering is the natural language processing task focused on the generation of accurate answers to objective questions. It is a mechanism with many applications, such as in search engines or virtual assistants. Question answerer models are typically evaluated by consulting human annotators, an expensive and slow process, or by the calculation of automated evaluation metrics, shown in literature to be ineffective. This work presents Q3AE (Question Answering Adversarial Attack Evaluator), a method that can evaluate QA systems exploring the use of adversarial attacks. Such attacks consist in the process of generating difficult examples, which provoke erroneous output of the QA system, and are in this work brought to QA evaluation in the portuguese language. The systems errors may be used for the calculus of a robustness metric or for manual analysis by the developer. Q3AE is a replicable and interpretable method. The methods functionality is demonstrated by a sequence of experiments, which tests the methods efficacy against LLMs, producing a comparative study between models of the LLaMA and Gemma families.Biblioteca Digitais de Teses e Dissertacoes da USPUniversidade de São PauloEscola PolitécnicaBrandão, Anarosa Alves FrancoGrava, Ricardo Saraiva2025-12-162026-04-17info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://teses.usp.br/teses/disponiveis/3/3141/tde-17042026-101413/doi:10.11606/D.3.2025.tde-17042026-101413Liberar o conteúdo para acesso público.info:eu-repo/semantics/openAccessporreponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USP2026-04-17T13:27:02Zoai:teses.usp.br:tde-17042026-101413Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212026-04-17T13:27:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Um método de avaliação automática para a tarefa de perguntas e respostas. Untitled in english |
| title |
Um método de avaliação automática para a tarefa de perguntas e respostas. |
| spellingShingle |
Um método de avaliação automática para a tarefa de perguntas e respostas. Grava, Ricardo Saraiva Inteligência artificial Aprendizado computacional Ataques adversarias Grandes modelos de linguagem Métricas Metrics Machine learning, Evaluation Large language models Adversarial attacks Artificial intelligence Question answering |
| title_short |
Um método de avaliação automática para a tarefa de perguntas e respostas. |
| title_full |
Um método de avaliação automática para a tarefa de perguntas e respostas. |
| title_fullStr |
Um método de avaliação automática para a tarefa de perguntas e respostas. |
| title_full_unstemmed |
Um método de avaliação automática para a tarefa de perguntas e respostas. |
| title_sort |
Um método de avaliação automática para a tarefa de perguntas e respostas. |
| author |
Grava, Ricardo Saraiva |
| author_facet |
Grava, Ricardo Saraiva |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Brandão, Anarosa Alves Franco |
| dc.contributor.author.fl_str_mv |
Grava, Ricardo Saraiva |
| dc.subject.por.fl_str_mv |
Inteligência artificial Aprendizado computacional Ataques adversarias Grandes modelos de linguagem Métricas Metrics Machine learning, Evaluation Large language models Adversarial attacks Artificial intelligence Question answering |
| topic |
Inteligência artificial Aprendizado computacional Ataques adversarias Grandes modelos de linguagem Métricas Metrics Machine learning, Evaluation Large language models Adversarial attacks Artificial intelligence Question answering |
| description |
Este projeto de pesquisa trata da criação de um método de avaliação automática para sistemas de perguntas e respostas. Perguntas e respostas (QA) é a tarefa de processamento de linguagem natural focada na geração de respostas acuradas a perguntas objetivas. Tratase de um mecanismo com diversas aplicações, como em motores de busca e assistentes virtuais. Modelos de linguagem respondedores de perguntas são tipicamente avaliados por meio de consultas a seres humanos ou pelo cálculo de métricas de avaliação automática, apontadas pela literatura como ineficazes. Este trabalho busca uma nova via, apresentando o Q3AE (Question Answering Adversarial Attack Evaluator), um método que permite avaliar sistemas de QA explorando o uso de ataques adversariais. Tais ataques consistem no processo de gerar exemplos difíceis, provocando o erro do sistema de QA, que neste trabalho são trazidos para QA em língua portuguesa. Os cenários de falha identificados podem ser usados para o cálculo de uma medida de robustez ou para inspeção manual por parte do desenvolvedor. Q3AE é um método replicável e interpretável. Demonstra-se o funcionamento do método por meio de uma bateria de experimentos, testando eficácia do método contra diferentes LLMs, e gerando um estudo comparativo entre modelos das famílias LLaMA e Gemma. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-12-16 2026-04-17 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://teses.usp.br/teses/disponiveis/3/3141/tde-17042026-101413/ doi:10.11606/D.3.2025.tde-17042026-101413 |
| url |
https://teses.usp.br/teses/disponiveis/3/3141/tde-17042026-101413/ |
| identifier_str_mv |
doi:10.11606/D.3.2025.tde-17042026-101413 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertacoes da USP Universidade de São Paulo Escola Politécnica |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertacoes da USP Universidade de São Paulo Escola Politécnica |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1865492703730466816 |