Assessment of expertise through neural activation pattern analysis in LLMs
| Ano de defesa: | 2025 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| Idioma: | eng |
| Instituição de defesa: |
Universidade Tecnológica Federal do Paraná
Curitiba Brasil Programa de Pós-Graduação em Computação Aplicada UTFPR |
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | http://repositorio.utfpr.edu.br/jspui/handle/1/38388 |
Resumo: | The performance benchmarks of Natural Language Processing (NLP) tasks have been overwhelmed by Large Language Models (LLMs), with their capabilities outshining many previous approaches to language modeling. Despite the success in these tasks and the more widespread use of these models in many fields of application, the understanding of how these models reach the outputs they achieve is lacking. The objective of this research is to study attributes of activation patterns of the neuron layers of these models that are related to how these models capture the underlying expertise in human written text. The research uses the LLM-MRI library to generate Neuron Region Activation Graphs (NRAGs) to represent the activation patterns across an LLM’s neural layers, and analyses them through various complex network metrics and a newly developed “center of mass” metric. Our results show that texts demonstrating different levels of expertise will generate measurably distinct activation patterns in LLMs, especially with greater variance of node strength. The proposed “center of mass” metric proved to be useful for locating the layers containing the most relevant expertise for the processed text. This research contributes to the field of Explainable Artificial Intelligence (ExAI) by offering new perspectives and tools to understand the internal workings of LLMs and improve their interpretability and reliability. |
| id |
UTFPR-12_c9585ffd31c19f24e79c83cabf0434ba |
|---|---|
| oai_identifier_str |
oai:repositorio.utfpr.edu.br:1/38388 |
| network_acronym_str |
UTFPR-12 |
| network_name_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
| repository_id_str |
|
| spelling |
Assessment of expertise through neural activation pattern analysis in LLMsAvaliação de expertise através da análise de padrões de ativação neural em LLMsProcessamento de linguagem natural (Computação)Inteligência artificialRedes neurais (Computação)Linguagens de modelagem (Ciência da computação)Natural language processing (Computer science)Artificial intelligenceNeural networks (Computer science)Modeling languages (Computer science)CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOCiência da ComputaçãoThe performance benchmarks of Natural Language Processing (NLP) tasks have been overwhelmed by Large Language Models (LLMs), with their capabilities outshining many previous approaches to language modeling. Despite the success in these tasks and the more widespread use of these models in many fields of application, the understanding of how these models reach the outputs they achieve is lacking. The objective of this research is to study attributes of activation patterns of the neuron layers of these models that are related to how these models capture the underlying expertise in human written text. The research uses the LLM-MRI library to generate Neuron Region Activation Graphs (NRAGs) to represent the activation patterns across an LLM’s neural layers, and analyses them through various complex network metrics and a newly developed “center of mass” metric. Our results show that texts demonstrating different levels of expertise will generate measurably distinct activation patterns in LLMs, especially with greater variance of node strength. The proposed “center of mass” metric proved to be useful for locating the layers containing the most relevant expertise for the processed text. This research contributes to the field of Explainable Artificial Intelligence (ExAI) by offering new perspectives and tools to understand the internal workings of LLMs and improve their interpretability and reliability.Os benchmarks de desempenho nas tarefas de Processamento de Linguagem Natural (PLN) foram tomados pelos Grandes Modelos de Linguagem (LLMs), com suas capacidades superando as abordagens anteriores de modelagem de linguagem. Apesar do sucesso nessas tarefas e do uso mais difundido desses modelos em muitos campos de aplicação, ainda falta compreensão de como esses modelos chegam aos seus resultados. A pesquisa utiliza a biblioteca LLM-MRI para gerar Gráficos de Ativação de Região Neuronal (NRAGs) para representar os padrões de ativação nas camadas neurais de um LLM e analisá-los por meio de métricas de rede complexas e uma nova métrica de “centro de massa” desenvolvida por este trabalho. Nossos resultados mostram que textos que demonstram diferentes níveis de expertise geraram padrões de ativação mensuravelmente distintos em LLMs, especialmente com maior variância na força dos nós. A métrica de “centro de massa” proposta, mostrou-se útil para localizar as camadas que contêm a expertise mais relevante para o texto processado. Esta pesquisa contribui para o campo da Inteligência Artificial Explicável (ExAI), oferecendo novas perspectivas e ferramentas para compreender o funcionamento interno dos LLMs e aprimorar sua interpretabilidade e confiabilidade.Universidade Tecnológica Federal do ParanáCuritibaBrasilPrograma de Pós-Graduação em Computação AplicadaUTFPRGomes Junior, Luiz Celsohttps://orcid.org/0000-0002-1534-9032https://lattes.cnpq.br/0370301102971417Santanchè, Andréhttps://orcid.org/0000-0002-1756-4852http://lattes.cnpq.br/5121623021406209Gomes Junior, Luiz Celsohttps://orcid.org/0000-0002-1534-9032https://lattes.cnpq.br/0370301102971417Delgado, Myriam Regattieri de Biase da Silvahttps://orcid.org/0000-0002-2791-174Xhttps://lattes.cnpq.br/4166922845507601Costa, Paula Dornhofer Parohttps://orcid.org/0000-0002-1534-5744http://lattes.cnpq.br/4518009815956207Figênio, Mateus Raganhan2025-09-25T21:38:18Z2025-09-25T21:38:18Z2025-06-25info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfFIGÊNIO, Mateus Raganhan. Assessment of expertise through neural activation pattern analysis in LLMs. 2025. Dissertação (Mestrado em Computação Aplicada) - Universidade Tecnológica Federal do Paraná, Curitiba, 2025.http://repositorio.utfpr.edu.br/jspui/handle/1/38388enghttp://creativecommons.org/licenses/by/4.0/info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPR2025-09-26T06:14:25Zoai:repositorio.utfpr.edu.br:1/38388Repositório InstitucionalPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestriut@utfpr.edu.br || sibi@utfpr.edu.bropendoar:2025-09-26T06:14:25Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false |
| dc.title.none.fl_str_mv |
Assessment of expertise through neural activation pattern analysis in LLMs Avaliação de expertise através da análise de padrões de ativação neural em LLMs |
| title |
Assessment of expertise through neural activation pattern analysis in LLMs |
| spellingShingle |
Assessment of expertise through neural activation pattern analysis in LLMs Figênio, Mateus Raganhan Processamento de linguagem natural (Computação) Inteligência artificial Redes neurais (Computação) Linguagens de modelagem (Ciência da computação) Natural language processing (Computer science) Artificial intelligence Neural networks (Computer science) Modeling languages (Computer science) CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Ciência da Computação |
| title_short |
Assessment of expertise through neural activation pattern analysis in LLMs |
| title_full |
Assessment of expertise through neural activation pattern analysis in LLMs |
| title_fullStr |
Assessment of expertise through neural activation pattern analysis in LLMs |
| title_full_unstemmed |
Assessment of expertise through neural activation pattern analysis in LLMs |
| title_sort |
Assessment of expertise through neural activation pattern analysis in LLMs |
| author |
Figênio, Mateus Raganhan |
| author_facet |
Figênio, Mateus Raganhan |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Gomes Junior, Luiz Celso https://orcid.org/0000-0002-1534-9032 https://lattes.cnpq.br/0370301102971417 Santanchè, André https://orcid.org/0000-0002-1756-4852 http://lattes.cnpq.br/5121623021406209 Gomes Junior, Luiz Celso https://orcid.org/0000-0002-1534-9032 https://lattes.cnpq.br/0370301102971417 Delgado, Myriam Regattieri de Biase da Silva https://orcid.org/0000-0002-2791-174X https://lattes.cnpq.br/4166922845507601 Costa, Paula Dornhofer Paro https://orcid.org/0000-0002-1534-5744 http://lattes.cnpq.br/4518009815956207 |
| dc.contributor.author.fl_str_mv |
Figênio, Mateus Raganhan |
| dc.subject.por.fl_str_mv |
Processamento de linguagem natural (Computação) Inteligência artificial Redes neurais (Computação) Linguagens de modelagem (Ciência da computação) Natural language processing (Computer science) Artificial intelligence Neural networks (Computer science) Modeling languages (Computer science) CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Ciência da Computação |
| topic |
Processamento de linguagem natural (Computação) Inteligência artificial Redes neurais (Computação) Linguagens de modelagem (Ciência da computação) Natural language processing (Computer science) Artificial intelligence Neural networks (Computer science) Modeling languages (Computer science) CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Ciência da Computação |
| description |
The performance benchmarks of Natural Language Processing (NLP) tasks have been overwhelmed by Large Language Models (LLMs), with their capabilities outshining many previous approaches to language modeling. Despite the success in these tasks and the more widespread use of these models in many fields of application, the understanding of how these models reach the outputs they achieve is lacking. The objective of this research is to study attributes of activation patterns of the neuron layers of these models that are related to how these models capture the underlying expertise in human written text. The research uses the LLM-MRI library to generate Neuron Region Activation Graphs (NRAGs) to represent the activation patterns across an LLM’s neural layers, and analyses them through various complex network metrics and a newly developed “center of mass” metric. Our results show that texts demonstrating different levels of expertise will generate measurably distinct activation patterns in LLMs, especially with greater variance of node strength. The proposed “center of mass” metric proved to be useful for locating the layers containing the most relevant expertise for the processed text. This research contributes to the field of Explainable Artificial Intelligence (ExAI) by offering new perspectives and tools to understand the internal workings of LLMs and improve their interpretability and reliability. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-09-25T21:38:18Z 2025-09-25T21:38:18Z 2025-06-25 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
FIGÊNIO, Mateus Raganhan. Assessment of expertise through neural activation pattern analysis in LLMs. 2025. Dissertação (Mestrado em Computação Aplicada) - Universidade Tecnológica Federal do Paraná, Curitiba, 2025. http://repositorio.utfpr.edu.br/jspui/handle/1/38388 |
| identifier_str_mv |
FIGÊNIO, Mateus Raganhan. Assessment of expertise through neural activation pattern analysis in LLMs. 2025. Dissertação (Mestrado em Computação Aplicada) - Universidade Tecnológica Federal do Paraná, Curitiba, 2025. |
| url |
http://repositorio.utfpr.edu.br/jspui/handle/1/38388 |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.rights.driver.fl_str_mv |
http://creativecommons.org/licenses/by/4.0/ info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
http://creativecommons.org/licenses/by/4.0/ |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Curitiba Brasil Programa de Pós-Graduação em Computação Aplicada UTFPR |
| publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Curitiba Brasil Programa de Pós-Graduação em Computação Aplicada UTFPR |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) instname:Universidade Tecnológica Federal do Paraná (UTFPR) instacron:UTFPR |
| instname_str |
Universidade Tecnológica Federal do Paraná (UTFPR) |
| instacron_str |
UTFPR |
| institution |
UTFPR |
| reponame_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
| collection |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
| repository.name.fl_str_mv |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR) |
| repository.mail.fl_str_mv |
riut@utfpr.edu.br || sibi@utfpr.edu.br |
| _version_ |
1850498316969705472 |