Assessment of expertise through neural activation pattern analysis in LLMs

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Figênio, Mateus Raganhan
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Universidade Tecnológica Federal do Paraná
Curitiba
Brasil
Programa de Pós-Graduação em Computação Aplicada
UTFPR
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://repositorio.utfpr.edu.br/jspui/handle/1/38388
Resumo: The performance benchmarks of Natural Language Processing (NLP) tasks have been overwhelmed by Large Language Models (LLMs), with their capabilities outshining many previous approaches to language modeling. Despite the success in these tasks and the more widespread use of these models in many fields of application, the understanding of how these models reach the outputs they achieve is lacking. The objective of this research is to study attributes of activation patterns of the neuron layers of these models that are related to how these models capture the underlying expertise in human written text. The research uses the LLM-MRI library to generate Neuron Region Activation Graphs (NRAGs) to represent the activation patterns across an LLM’s neural layers, and analyses them through various complex network metrics and a newly developed “center of mass” metric. Our results show that texts demonstrating different levels of expertise will generate measurably distinct activation patterns in LLMs, especially with greater variance of node strength. The proposed “center of mass” metric proved to be useful for locating the layers containing the most relevant expertise for the processed text. This research contributes to the field of Explainable Artificial Intelligence (ExAI) by offering new perspectives and tools to understand the internal workings of LLMs and improve their interpretability and reliability.
id UTFPR-12_c9585ffd31c19f24e79c83cabf0434ba
oai_identifier_str oai:repositorio.utfpr.edu.br:1/38388
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling Assessment of expertise through neural activation pattern analysis in LLMsAvaliação de expertise através da análise de padrões de ativação neural em LLMsProcessamento de linguagem natural (Computação)Inteligência artificialRedes neurais (Computação)Linguagens de modelagem (Ciência da computação)Natural language processing (Computer science)Artificial intelligenceNeural networks (Computer science)Modeling languages (Computer science)CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOCiência da ComputaçãoThe performance benchmarks of Natural Language Processing (NLP) tasks have been overwhelmed by Large Language Models (LLMs), with their capabilities outshining many previous approaches to language modeling. Despite the success in these tasks and the more widespread use of these models in many fields of application, the understanding of how these models reach the outputs they achieve is lacking. The objective of this research is to study attributes of activation patterns of the neuron layers of these models that are related to how these models capture the underlying expertise in human written text. The research uses the LLM-MRI library to generate Neuron Region Activation Graphs (NRAGs) to represent the activation patterns across an LLM’s neural layers, and analyses them through various complex network metrics and a newly developed “center of mass” metric. Our results show that texts demonstrating different levels of expertise will generate measurably distinct activation patterns in LLMs, especially with greater variance of node strength. The proposed “center of mass” metric proved to be useful for locating the layers containing the most relevant expertise for the processed text. This research contributes to the field of Explainable Artificial Intelligence (ExAI) by offering new perspectives and tools to understand the internal workings of LLMs and improve their interpretability and reliability.Os benchmarks de desempenho nas tarefas de Processamento de Linguagem Natural (PLN) foram tomados pelos Grandes Modelos de Linguagem (LLMs), com suas capacidades superando as abordagens anteriores de modelagem de linguagem. Apesar do sucesso nessas tarefas e do uso mais difundido desses modelos em muitos campos de aplicação, ainda falta compreensão de como esses modelos chegam aos seus resultados. A pesquisa utiliza a biblioteca LLM-MRI para gerar Gráficos de Ativação de Região Neuronal (NRAGs) para representar os padrões de ativação nas camadas neurais de um LLM e analisá-los por meio de métricas de rede complexas e uma nova métrica de “centro de massa” desenvolvida por este trabalho. Nossos resultados mostram que textos que demonstram diferentes níveis de expertise geraram padrões de ativação mensuravelmente distintos em LLMs, especialmente com maior variância na força dos nós. A métrica de “centro de massa” proposta, mostrou-se útil para localizar as camadas que contêm a expertise mais relevante para o texto processado. Esta pesquisa contribui para o campo da Inteligência Artificial Explicável (ExAI), oferecendo novas perspectivas e ferramentas para compreender o funcionamento interno dos LLMs e aprimorar sua interpretabilidade e confiabilidade.Universidade Tecnológica Federal do ParanáCuritibaBrasilPrograma de Pós-Graduação em Computação AplicadaUTFPRGomes Junior, Luiz Celsohttps://orcid.org/0000-0002-1534-9032https://lattes.cnpq.br/0370301102971417Santanchè, Andréhttps://orcid.org/0000-0002-1756-4852http://lattes.cnpq.br/5121623021406209Gomes Junior, Luiz Celsohttps://orcid.org/0000-0002-1534-9032https://lattes.cnpq.br/0370301102971417Delgado, Myriam Regattieri de Biase da Silvahttps://orcid.org/0000-0002-2791-174Xhttps://lattes.cnpq.br/4166922845507601Costa, Paula Dornhofer Parohttps://orcid.org/0000-0002-1534-5744http://lattes.cnpq.br/4518009815956207Figênio, Mateus Raganhan2025-09-25T21:38:18Z2025-09-25T21:38:18Z2025-06-25info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfFIGÊNIO, Mateus Raganhan. Assessment of expertise through neural activation pattern analysis in LLMs. 2025. Dissertação (Mestrado em Computação Aplicada) - Universidade Tecnológica Federal do Paraná, Curitiba, 2025.http://repositorio.utfpr.edu.br/jspui/handle/1/38388enghttp://creativecommons.org/licenses/by/4.0/info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPR2025-09-26T06:14:25Zoai:repositorio.utfpr.edu.br:1/38388Repositório InstitucionalPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestriut@utfpr.edu.br || sibi@utfpr.edu.bropendoar:2025-09-26T06:14:25Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.none.fl_str_mv Assessment of expertise through neural activation pattern analysis in LLMs
Avaliação de expertise através da análise de padrões de ativação neural em LLMs
title Assessment of expertise through neural activation pattern analysis in LLMs
spellingShingle Assessment of expertise through neural activation pattern analysis in LLMs
Figênio, Mateus Raganhan
Processamento de linguagem natural (Computação)
Inteligência artificial
Redes neurais (Computação)
Linguagens de modelagem (Ciência da computação)
Natural language processing (Computer science)
Artificial intelligence
Neural networks (Computer science)
Modeling languages (Computer science)
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Ciência da Computação
title_short Assessment of expertise through neural activation pattern analysis in LLMs
title_full Assessment of expertise through neural activation pattern analysis in LLMs
title_fullStr Assessment of expertise through neural activation pattern analysis in LLMs
title_full_unstemmed Assessment of expertise through neural activation pattern analysis in LLMs
title_sort Assessment of expertise through neural activation pattern analysis in LLMs
author Figênio, Mateus Raganhan
author_facet Figênio, Mateus Raganhan
author_role author
dc.contributor.none.fl_str_mv Gomes Junior, Luiz Celso
https://orcid.org/0000-0002-1534-9032
https://lattes.cnpq.br/0370301102971417
Santanchè, André
https://orcid.org/0000-0002-1756-4852
http://lattes.cnpq.br/5121623021406209
Gomes Junior, Luiz Celso
https://orcid.org/0000-0002-1534-9032
https://lattes.cnpq.br/0370301102971417
Delgado, Myriam Regattieri de Biase da Silva
https://orcid.org/0000-0002-2791-174X
https://lattes.cnpq.br/4166922845507601
Costa, Paula Dornhofer Paro
https://orcid.org/0000-0002-1534-5744
http://lattes.cnpq.br/4518009815956207
dc.contributor.author.fl_str_mv Figênio, Mateus Raganhan
dc.subject.por.fl_str_mv Processamento de linguagem natural (Computação)
Inteligência artificial
Redes neurais (Computação)
Linguagens de modelagem (Ciência da computação)
Natural language processing (Computer science)
Artificial intelligence
Neural networks (Computer science)
Modeling languages (Computer science)
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Ciência da Computação
topic Processamento de linguagem natural (Computação)
Inteligência artificial
Redes neurais (Computação)
Linguagens de modelagem (Ciência da computação)
Natural language processing (Computer science)
Artificial intelligence
Neural networks (Computer science)
Modeling languages (Computer science)
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Ciência da Computação
description The performance benchmarks of Natural Language Processing (NLP) tasks have been overwhelmed by Large Language Models (LLMs), with their capabilities outshining many previous approaches to language modeling. Despite the success in these tasks and the more widespread use of these models in many fields of application, the understanding of how these models reach the outputs they achieve is lacking. The objective of this research is to study attributes of activation patterns of the neuron layers of these models that are related to how these models capture the underlying expertise in human written text. The research uses the LLM-MRI library to generate Neuron Region Activation Graphs (NRAGs) to represent the activation patterns across an LLM’s neural layers, and analyses them through various complex network metrics and a newly developed “center of mass” metric. Our results show that texts demonstrating different levels of expertise will generate measurably distinct activation patterns in LLMs, especially with greater variance of node strength. The proposed “center of mass” metric proved to be useful for locating the layers containing the most relevant expertise for the processed text. This research contributes to the field of Explainable Artificial Intelligence (ExAI) by offering new perspectives and tools to understand the internal workings of LLMs and improve their interpretability and reliability.
publishDate 2025
dc.date.none.fl_str_mv 2025-09-25T21:38:18Z
2025-09-25T21:38:18Z
2025-06-25
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv FIGÊNIO, Mateus Raganhan. Assessment of expertise through neural activation pattern analysis in LLMs. 2025. Dissertação (Mestrado em Computação Aplicada) - Universidade Tecnológica Federal do Paraná, Curitiba, 2025.
http://repositorio.utfpr.edu.br/jspui/handle/1/38388
identifier_str_mv FIGÊNIO, Mateus Raganhan. Assessment of expertise through neural activation pattern analysis in LLMs. 2025. Dissertação (Mestrado em Computação Aplicada) - Universidade Tecnológica Federal do Paraná, Curitiba, 2025.
url http://repositorio.utfpr.edu.br/jspui/handle/1/38388
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by/4.0/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by/4.0/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Curitiba
Brasil
Programa de Pós-Graduação em Computação Aplicada
UTFPR
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Curitiba
Brasil
Programa de Pós-Graduação em Computação Aplicada
UTFPR
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv riut@utfpr.edu.br || sibi@utfpr.edu.br
_version_ 1850498316969705472