Integrando modelos transformer e stpa: uma abordagem automatizada para geração de perdas, perigos e restrições a partir de documentos de conops

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Pacheco, Gabriel Nogueira [UNIFESP]
Orientador(a): Martins, Luiz Eduardo Galvão [UNIFESP]
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
dARK ID: ark:/48912/001300001m32w
Idioma: eng
Instituição de defesa: Universidade Federal de São Paulo
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://hdl.handle.net/11600/74736
Resumo: Este trabalho aborda os desafios nas metodologias de análise de segurança, particularmente a análise manual de documentos críticos para a segurança, ao propor uma abordagem inovadora que utiliza técnicas avançadas de processamento de linguagem natural (PLN). Focando no método System-Theoretic Process Analysis (STPA), introduzimos um pipeline que utiliza documentos de Concept of Operations (ConOps) como entrada para Grandes Modelos de Linguagem (LLM) a fim de automatizar a extração de perdas, perigos e restrições. Para alcançar este objetivo, criamos o dataset SHACO (STPA Hazard Analysis from ConOps), que contém documentos ConOps reais e gerados sinteticamente, pareados com suas respectivas análises STPA. Em seguida, empregamos o ajuste fino supervisionado para treinar os LLMs, especificamente o Llama3.1 e o Longformer Encoder-Decoder (LED), neste dataset para desenvolver nossos modelos. Nossa avaliação experimental, utilizando a métrica BERT-Score, demonstrou que nosso modelo resultante, o SHACO-Llama, alcançou um desempenho superior (F1-score: 80%) em comparação com o SHACO-LED (F1-score: 75%). A avaliação também identificou áreas específicas para melhoria na formulação das perdas e dos perigos. Este trabalho contribui para o avanço da análise de segurança de sistemas complexos ao oferecer uma metodologia mais eficiente e acessível, com a justificativa de superar as limitações da análise manual por meio de uma abordagem adaptativa e escalável.
id UFSP_2d3e2913042cf66a9887e3caacbe5735
oai_identifier_str oai:repositorio.unifesp.br:11600/74736
network_acronym_str UFSP
network_name_str Repositório Institucional da UNIFESP
repository_id_str
spelling http://lattes.cnpq.br/9070607576528017http://lattes.cnpq.br/0203910403476737Pacheco, Gabriel Nogueira [UNIFESP]http://lattes.cnpq.br/1871704115297627Martins, Luiz Eduardo Galvão [UNIFESP]da Silva, Ana Estela Antunes [UNICAMP]São José dos Campos, SP2025-08-05T13:35:32Z2025-08-05T13:35:32Z2025-06-26Este trabalho aborda os desafios nas metodologias de análise de segurança, particularmente a análise manual de documentos críticos para a segurança, ao propor uma abordagem inovadora que utiliza técnicas avançadas de processamento de linguagem natural (PLN). Focando no método System-Theoretic Process Analysis (STPA), introduzimos um pipeline que utiliza documentos de Concept of Operations (ConOps) como entrada para Grandes Modelos de Linguagem (LLM) a fim de automatizar a extração de perdas, perigos e restrições. Para alcançar este objetivo, criamos o dataset SHACO (STPA Hazard Analysis from ConOps), que contém documentos ConOps reais e gerados sinteticamente, pareados com suas respectivas análises STPA. Em seguida, empregamos o ajuste fino supervisionado para treinar os LLMs, especificamente o Llama3.1 e o Longformer Encoder-Decoder (LED), neste dataset para desenvolver nossos modelos. Nossa avaliação experimental, utilizando a métrica BERT-Score, demonstrou que nosso modelo resultante, o SHACO-Llama, alcançou um desempenho superior (F1-score: 80%) em comparação com o SHACO-LED (F1-score: 75%). A avaliação também identificou áreas específicas para melhoria na formulação das perdas e dos perigos. Este trabalho contribui para o avanço da análise de segurança de sistemas complexos ao oferecer uma metodologia mais eficiente e acessível, com a justificativa de superar as limitações da análise manual por meio de uma abordagem adaptativa e escalável.This work addresses the challenges in safety analysis methodologies, particularly the manual analysis of safety-critical documents, by proposing an innovative approach that leverages advanced natural language processing (NLP) techniques. Focusing on the System-Theoretic Process Analysis (STPA) method, we introduce a pipeline that uses Concept of Operations (ConOps) documents as input for Large Language Models (LLM) to automate the extraction of losses, hazards, and constraints. To achieve this, we created the SHACO (STPA Hazard Analysis from ConOps) dataset, which contains real and synthetically generated ConOps documents paired with their respective STPA analyses. We then employed supervised fine-tuning to train LLMs, specifically Llama3.1 and the Longformer Encoder-Decoder (LED), on this dataset to develop our models. Our experimental evaluation, using BERT-Score metrics, demonstrated that our resulting model, SHACO-Llama, achieved superior performance (F1-score: 80%) compared to SHACO-LED (F1-score: 75%). The evaluation also identified specific areas for improvement in the formulation of losses and hazards. This work contributes to advancing safety analysis for complex systems by offering a more efficient and accessible methodology, with the rationale being to overcome the limitations of manual analysis through an adaptive and scalable approach.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)88887.715361/2022-00legmartins@unifesp.br150 f.https://hdl.handle.net/11600/74736ark:/48912/001300001m32wengUniversidade Federal de São Pauloinfo:eu-repo/semantics/openAccessNão se aplicaProcessamento de linguagem naturalGrandes modelos de linguagemSTPAConOpsAjuste finoIntegrando modelos transformer e stpa: uma abordagem automatizada para geração de perdas, perigos e restrições a partir de documentos de conopsIntegrating transformer models and stpa: an automated approach for loss, hazard and constraint generation from conops documentsinfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersionreponame:Repositório Institucional da UNIFESPinstname:Universidade Federal de São Paulo (UNIFESP)instacron:UNIFESPInstituto de Ciência e Tecnologia (ICT)Ciência da ComputaçãoCiência da ComputaçãoProcessamento de Linguagem NaturalORIGINALdissertacao_gabriel_pacheco_v7-1.pdfdissertacao_gabriel_pacheco_v7-1.pdfapplication/pdf2916239https://repositorio.unifesp.br/bitstreams/0d124805-a3b1-437e-b3b4-21d2a7b53141/download5424dae3d4451d764dfdc0d2fbb13272MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-86456https://repositorio.unifesp.br/bitstreams/3275c721-a328-47b5-8cd3-e38b33dcb3e5/download79881d6dea480587c66312d1102a8942MD52TEXTdissertacao_gabriel_pacheco_v7-1.pdf.txtdissertacao_gabriel_pacheco_v7-1.pdf.txtExtracted texttext/plain100538https://repositorio.unifesp.br/bitstreams/9875278a-fc23-400c-b524-2572aea95995/download3269fb825a3549ea99ce9d972bd64ecaMD53THUMBNAILdissertacao_gabriel_pacheco_v7-1.pdf.jpgdissertacao_gabriel_pacheco_v7-1.pdf.jpgGenerated Thumbnailimage/jpeg3923https://repositorio.unifesp.br/bitstreams/66281f64-5466-4dd3-905e-384ff28293a1/downloadad48e1b2169683e203aeb387fbc9b92eMD5411600/747362025-08-06 04:01:33.127oai:repositorio.unifesp.br:11600/74736https://repositorio.unifesp.brRepositório InstitucionalPUBhttp://www.repositorio.unifesp.br/oai/requestbiblioteca.csp@unifesp.bropendoar:34652025-08-06T04:01:33Repositório Institucional da UNIFESP - Universidade Federal de São Paulo (UNIFESP)falsePGgxPjxzdHJvbmc+TGljZW7Dp2EgZGlzdHJpYnXDrWRhPC9zdHJvbmc+PC9oMT4KPGJyPjxicj4KTm8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgVW5pZmVzcCwgcGFyYSByZXByb2R1emlyLCB0cmFkdXppciBlIGRpc3RyaWJ1aXIgc3VhIHN1Ym1pc3PDo28gZW0gdG9kbyBvIG11bmRvLCB2b2PDqiBkZXZlIGNvbmNvcmRhciBjb20gb3MgdGVybW9zIGEgc2VndWlyLgo8YnI+PGJyPgpQYXJhIGNvbmNlZGVyIGEgbGljZW7Dp2EgZGUgZGlzdHJpYnVpw6fDo28gcGFkcsOjbywgYXDDs3MgYSBsZWl0dXJhIGRvcyB0ZXJtb3MsIHNlbGVjaW9uZTogIkV1IGNvbmNlZG8gYSBMaWNlbsOnYSIgZSBjbGlxdWUgZW0gIkZpbmFsaXphciBzdWJtaXNzw6NvIi4KPGJyPjxicj4KVEVSTU9TIEUgQ09OREnDh8OVRVMgUEFSQSBPIExJQ0VOQ0lBTUVOVE8gRE8gQVJRVUlWQU1FTlRPLCBSRVBST0RVw4fDg08gRSBESVZVTEdBw4fDg08gUMOaQkxJQ0EgREUgQ09OVEXDmkRPIE5PIFJFUE9TSVTDk1JJTyBJTlNUSVRVQ0lPTkFMIFVOSUZFU1AuCjxicj48YnI+CjEuIEV1LCByZXNwb25zw6F2ZWwgcGVsbyB0cmFiYWxobyBlL291IHVzdcOhcmlvLWRlcG9zaXRhbnRlIG5vIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIFVOSUZFU1AsIGFzc2VndXJvIG5vIHByZXNlbnRlIGF0byBxdWUgc291IHRpdHVsYXIgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhdHJpbW9uaWFpcyBlL291IGRpcmVpdG9zIGNvbmV4b3MgcmVmZXJlbnRlcyDDoCB0b3RhbGlkYWRlIGRhIE9icmEgb3JhIGRlcG9zaXRhZGEgZW0gZm9ybWF0byBkaWdpdGFsLCBiZW0gY29tbyBkZSBzZXVzIGNvbXBvbmVudGVzIG1lbm9yZXMsIGVtIHNlIHRyYXRhbmRvIGRlIG9icmEgY29sZXRpdmEsIGNvbmZvcm1lIG8gcHJlY2VpdHVhZG8gcGVsYSBMZWkgOS42MTAvOTggZS9vdSBMZWkgOS42MDkvOTguIE7Do28gc2VuZG8gZXN0ZSBvIGNhc28sIGFzc2VndXJvIHRlciBvYnRpZG8gZGlyZXRhbWVudGUgZG9zIGRldmlkb3MgdGl0dWxhcmVzIGF1dG9yaXphw6fDo28gcHLDqXZpYSBlIGV4cHJlc3NhIHBhcmEgbyBkZXDDs3NpdG8gZSBwYXJhIGEgZGl2dWxnYcOnw6NvIGRhIE9icmEsIGFicmFuZ2VuZG8gdG9kb3Mgb3MgZGlyZWl0b3MgYXV0b3JhaXMgZSBjb25leG9zIGFmZXRhZG9zIHBlbGEgYXNzaW5hdHVyYSBkbyBwcmVzZW50ZSB0ZXJtbyBkZSBsaWNlbmNpYW1lbnRvLCBkZSBtb2RvIGEgZWZldGl2YW1lbnRlIGlzZW50YXIgYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBTw6NvIFBhdWxvIChVTklGRVNQKSBlIHNldXMgZnVuY2lvbsOhcmlvcyBkZSBxdWFscXVlciByZXNwb25zYWJpbGlkYWRlIHBlbG8gdXNvIG7Do28tYXV0b3JpemFkbyBkbyBtYXRlcmlhbCBkZXBvc2l0YWRvLCBzZWphIGVtIHZpbmN1bGHDp8OjbyBhbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBVTklGRVNQLCBzZWphIGVtIHZpbmN1bGHDp8OjbyBhIHF1YWlzcXVlciBzZXJ2acOnb3MgZGUgYnVzY2EgZSBkZSBkaXN0cmlidWnDp8OjbyBkZSBjb250ZcO6ZG8gcXVlIGZhw6dhbSB1c28gZGFzIGludGVyZmFjZXMgZSBlc3Bhw6dvIGRlIGFybWF6ZW5hbWVudG8gcHJvdmlkZW5jaWFkb3MgcGVsYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBTw6NvIFBhdWxvIChVTklGRVNQKSBwb3IgbWVpbyBkZSBzZXVzIHNpc3RlbWFzIGluZm9ybWF0aXphZG9zLiAKPGJyPjxicj4KMi4gQSBjb25jb3Jkw6JuY2lhIGNvbSBlc3RhIGxpY2Vuw6dhIHRlbSBjb21vIGNvbnNlcXXDqm5jaWEgYSB0cmFuc2ZlcsOqbmNpYSwgYSB0w610dWxvIG7Do28tZXhjbHVzaXZvIGUgbsOjby1vbmVyb3NvLCBpc2VudGEgZG8gcGFnYW1lbnRvIGRlIHJveWFsdGllcyBvdSBxdWFscXVlciBvdXRyYSBjb250cmFwcmVzdGHDp8OjbywgcGVjdW5pw6FyaWEgb3UgbsOjbywgw6AgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgU8OjbyBQYXVsbyAoVU5JRkVTUCkgZG9zIGRpcmVpdG9zIGRlIGFybWF6ZW5hciBkaWdpdGFsbWVudGUsIGRlIHJlcHJvZHV6aXIgZSBkZSBkaXN0cmlidWlyIG5hY2lvbmFsIGUgaW50ZXJuYWNpb25hbG1lbnRlIGEgT2JyYSwgaW5jbHVpbmRvLXNlIG8gc2V1IHJlc3Vtby9hYnN0cmFjdCwgcG9yIG1laW9zIGVsZXRyw7RuaWNvcyBhbyBww7pibGljbyBlbSBnZXJhbCwgZW0gcmVnaW1lIGRlIGFjZXNzbyBhYmVydG8uCjxicj48YnI+CjMuIEEgcHJlc2VudGUgbGljZW7Dp2EgdGFtYsOpbSBhYnJhbmdlLCBub3MgbWVzbW9zIHRlcm1vcyBlc3RhYmVsZWNpZG9zIG5vIGl0ZW0gMiwgc3VwcmEsIHF1YWxxdWVyIGRpcmVpdG8gZGUgY29tdW5pY2HDp8OjbyBhbyBww7pibGljbyBjYWLDrXZlbCBlbSByZWxhw6fDo28gw6AgT2JyYSBvcmEgZGVwb3NpdGFkYSwgaW5jbHVpbmRvLXNlIG9zIHVzb3MgcmVmZXJlbnRlcyDDoCByZXByZXNlbnRhw6fDo28gcMO6YmxpY2EgZS9vdSBleGVjdcOnw6NvIHDDumJsaWNhLCBiZW0gY29tbyBxdWFscXVlciBvdXRyYSBtb2RhbGlkYWRlIGRlIGNvbXVuaWNhw6fDo28gYW8gcMO6YmxpY28gcXVlIGV4aXN0YSBvdSB2ZW5oYSBhIGV4aXN0aXIsIG5vcyB0ZXJtb3MgZG8gYXJ0aWdvIDY4IGUgc2VndWludGVzIGRhIExlaSA5LjYxMC85OCwgbmEgZXh0ZW5zw6NvIHF1ZSBmb3IgYXBsaWPDoXZlbCBhb3Mgc2VydmnDp29zIHByZXN0YWRvcyBhbyBww7pibGljbyBwZWxhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIFPDo28gUGF1bG8gKFVOSUZFU1ApLgo8YnI+PGJyPgo0LiBFc3RhIGxpY2Vuw6dhIGFicmFuZ2UsIGFpbmRhLCBub3MgbWVzbW9zIHRlcm1vcyBlc3RhYmVsZWNpZG9zIG5vIGl0ZW0gMiwgc3VwcmEsIHRvZG9zIG9zIGRpcmVpdG9zIGNvbmV4b3MgZGUgYXJ0aXN0YXMgaW50w6lycHJldGVzIG91IGV4ZWN1dGFudGVzLCBwcm9kdXRvcmVzIGZvbm9ncsOhZmljb3Mgb3UgZW1wcmVzYXMgZGUgcmFkaW9kaWZ1c8OjbyBxdWUgZXZlbnR1YWxtZW50ZSBzZWphbSBhcGxpY8OhdmVpcyBlbSByZWxhw6fDo28gw6Agb2JyYSBkZXBvc2l0YWRhLCBlbSBjb25mb3JtaWRhZGUgY29tIG8gcmVnaW1lIGZpeGFkbyBubyBUw610dWxvIFYgZGEgTGVpIDkuNjEwLzk4Lgo8YnI+PGJyPgo1LiBTZSBhIE9icmEgZGVwb3NpdGFkYSBmb2kgb3Ugw6kgb2JqZXRvIGRlIGZpbmFuY2lhbWVudG8gcG9yIGluc3RpdHVpw6fDtWVzIGRlIGZvbWVudG8gw6AgcGVzcXVpc2Egb3UgcXVhbHF1ZXIgb3V0cmEgc2VtZWxoYW50ZSwgdm9jw6ogb3UgbyB0aXR1bGFyIGFzc2VndXJhIHF1ZSBjdW1wcml1IHRvZGFzIGFzIG9icmlnYcOnw7VlcyBxdWUgbGhlIGZvcmFtIGltcG9zdGFzIHBlbGEgaW5zdGl0dWnDp8OjbyBmaW5hbmNpYWRvcmEgZW0gcmF6w6NvIGRvIGZpbmFuY2lhbWVudG8sIGUgcXVlIG7Do28gZXN0w6EgY29udHJhcmlhbmRvIHF1YWxxdWVyIGRpc3Bvc2nDp8OjbyBjb250cmF0dWFsIHJlZmVyZW50ZSDDoCBwdWJsaWNhw6fDo28gZG8gY29udGXDumRvIG9yYSBzdWJtZXRpZG8gYW8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgVU5JRkVTUC4KPGJyPjxicj4KNi4gQXV0b3JpemEgYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBTw6NvIFBhdWxvIGEgZGlzcG9uaWJpbGl6YXIgYSBvYnJhIG5vIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIFVOSUZFU1AgZGUgZm9ybWEgZ3JhdHVpdGEsIGRlIGFjb3JkbyBjb20gYSBsaWNlbsOnYSBww7pibGljYSBDcmVhdGl2ZSBDb21tb25zOiBBdHJpYnVpw6fDo28tU2VtIERlcml2YcOnw7Vlcy1TZW0gRGVyaXZhZG9zIDQuMCBJbnRlcm5hY2lvbmFsIChDQyBCWS1OQy1ORCksIHBlcm1pdGluZG8gc2V1IGxpdnJlIGFjZXNzbywgdXNvIGUgY29tcGFydGlsaGFtZW50bywgZGVzZGUgcXVlIGNpdGFkYSBhIGZvbnRlLiBBIG9icmEgY29udGludWEgcHJvdGVnaWRhIHBvciBEaXJlaXRvcyBBdXRvcmFpcyBlL291IHBvciBvdXRyYXMgbGVpcyBhcGxpY8OhdmVpcy4gUXVhbHF1ZXIgdXNvIGRhIG9icmEsIHF1ZSBuw6NvIG8gYXV0b3JpemFkbyBzb2IgZXN0YSBsaWNlbsOnYSBvdSBwZWxhIGxlZ2lzbGHDp8OjbyBhdXRvcmFsLCDDqSBwcm9pYmlkby4gIAo8YnI+PGJyPgo3LiBBdGVzdGEgcXVlIGEgT2JyYSBzdWJtZXRpZGEgbsOjbyBjb250w6ltIHF1YWxxdWVyIGluZm9ybWHDp8OjbyBjb25maWRlbmNpYWwgc3VhIG91IGRlIHRlcmNlaXJvcy4KPGJyPjxicj4KOC4gQXRlc3RhIHF1ZSBvIHRyYWJhbGhvIHN1Ym1ldGlkbyDDqSBvcmlnaW5hbCBlIGZvaSBlbGFib3JhZG8gcmVzcGVpdGFuZG8gb3MgcHJpbmPDrXBpb3MgZGEgbW9yYWwgZSBkYSDDqXRpY2EgZSBuw6NvIHZpb2xvdSBxdWFscXVlciBkaXJlaXRvIGRlIHByb3ByaWVkYWRlIGludGVsZWN0dWFsLCBzb2IgcGVuYSBkZSByZXNwb25kZXIgY2l2aWwsIGNyaW1pbmFsLCDDqXRpY2EgZSBwcm9maXNzaW9uYWxtZW50ZSBwb3IgbWV1cyBhdG9zOwo8YnI+PGJyPgo5LiBBdGVzdGEgcXVlIGEgdmVyc8OjbyBkbyB0cmFiYWxobyBwcmVzZW50ZSBubyBhcnF1aXZvIHN1Ym1ldGlkbywgZW0gY2Fzb3MgZGUgdHJhYmFsaG9zIHF1ZSBleGlnaXJhbSBvcmllbnRhw6fDo28sIMOpIGEgdmVyc8OjbyBkZWZpbml0aXZhIHF1ZSBpbmNsdWkgYXMgYWx0ZXJhw6fDtWVzIGRlY29ycmVudGVzIGRhIGRlZmVzYSwgc29saWNpdGFkYXMgcGVsYSBiYW5jYSwgc2UgaG91dmUgYWxndW1hLCBvdSBzb2xpY2l0YWRhcyBwb3IgcGFydGUgZGUgb3JpZW50YcOnw6NvIGRvY2VudGUgcmVzcG9uc8OhdmVsLiBBdGVzdG8gYWluZGEgcXVlIG8gdHJhYmFsaG8gb2J0ZXZlIGF1dG9yaXphw6fDo28gZGUgcHVibGljYcOnw6NvIGUgYWNlc3NvIGRvIChhKSBvcmllbnRhZG9yIChhKSBkZSBhY29yZG8gY29tIGFzIGluZm9ybWHDp8O1ZXMgYXF1aSBwcmVzdGFkYXM7Cjxicj48YnI+CjEwLiBDb25jZWRlIMOgIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIFPDo28gUGF1bG8gKFVOSUZFU1ApIG8gZGlyZWl0byBuw6NvIGV4Y2x1c2l2byBkZSByZWFsaXphciBxdWFpc3F1ZXIgYWx0ZXJhw6fDtWVzIG5hIG3DrWRpYSBvdSBubyBmb3JtYXRvIGRvIGFycXVpdm8gcGFyYSBwcm9ww7NzaXRvcyBkZSBwcmVzZXJ2YcOnw6NvIGRpZ2l0YWwsIGRlIGFjZXNzaWJpbGlkYWRlIGUgZGUgbWVsaG9yIGlkZW50aWZpY2HDp8OjbyBkbyB0cmFiYWxobyBzdWJtZXRpZG8sIGRlc2RlIHF1ZSBuw6NvIHNlamEgYWx0ZXJhZG8gc2V1IGNvbnRlw7pkbyBpbnRlbGVjdHVhbC4KPGJyPjxicj4KQW8gY29uY2x1aXIgYXMgZXRhcGFzIGRvIHByb2Nlc3NvIGRlIHN1Ym1pc3PDo28gZGUgYXJxdWl2b3Mgbm8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgVU5JRkVTUCwgYXRlc3RvIHF1ZSBsaSBlIGNvbmNvcmRlaSBpbnRlZ3JhbG1lbnRlIGNvbSBvcyB0ZXJtb3MgYWNpbWEgZGVsaW1pdGFkb3MsIHNlbSBmYXplciBxdWFscXVlciByZXNlcnZhIGUgbm92YW1lbnRlIGNvbmZpcm1hbmRvIHF1ZSBjdW1wcm8gb3MgcmVxdWlzaXRvcyBpbmRpY2Fkb3Mgbm9zIGl0ZW5zIG1lbmNpb25hZG9zIGFudGVyaW9ybWVudGUuCjxicj48YnI+CkhhdmVuZG8gcXVhbHF1ZXIgZGlzY29yZMOibmNpYSBlbSByZWxhw6fDo28gYSBwcmVzZW50ZSBsaWNlbsOnYSBvdSBuw6NvIHNlIHZlcmlmaWNhbmRvIG8gZXhpZ2lkbyBub3MgaXRlbnMgYW50ZXJpb3Jlcywgdm9jw6ogZGV2ZSBpbnRlcnJvbXBlciBpbWVkaWF0YW1lbnRlIG8gcHJvY2Vzc28gZGUgc3VibWlzc8Ojby4gQSBjb250aW51aWRhZGUgZG8gcHJvY2Vzc28gZXF1aXZhbGUgw6AgY29uY29yZMOibmNpYSBlIMOgIGFzc2luYXR1cmEgZGVzdGUgZG9jdW1lbnRvLCBjb20gdG9kYXMgYXMgY29uc2VxdcOqbmNpYXMgbmVsZSBwcmV2aXN0YXMsIHN1amVpdGFuZG8tc2UgbyBzaWduYXTDoXJpbyBhIHNhbsOnw7VlcyBjaXZpcyBlIGNyaW1pbmFpcyBjYXNvIG7Do28gc2VqYSB0aXR1bGFyIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBwYXRyaW1vbmlhaXMgZS9vdSBjb25leG9zIGFwbGljw6F2ZWlzIMOgIE9icmEgZGVwb3NpdGFkYSBkdXJhbnRlIGVzdGUgcHJvY2Vzc28sIG91IGNhc28gbsOjbyB0ZW5oYSBvYnRpZG8gcHLDqXZpYSBlIGV4cHJlc3NhIGF1dG9yaXphw6fDo28gZG8gdGl0dWxhciBwYXJhIG8gZGVww7NzaXRvIGUgdG9kb3Mgb3MgdXNvcyBkYSBPYnJhIGVudm9sdmlkb3MuCjxicj48YnI+ClNlIHRpdmVyIHF1YWxxdWVyIGTDunZpZGEgcXVhbnRvIGFvcyB0ZXJtb3MgZGUgbGljZW5jaWFtZW50byBlIHF1YW50byBhbyBwcm9jZXNzbyBkZSBzdWJtaXNzw6NvLCBlbnRyZSBlbSBjb250YXRvIGNvbSBhIGJpYmxpb3RlY2EgZG8gc2V1IGNhbXB1cyAoY29uc3VsdGUgZW06IDxhIGhyZWY9Imh0dHBzOi8vYmlibGlvdGVjYXMudW5pZmVzcC5ici9iaWJsaW90ZWNhcy1kYS1yZWRlIj5odHRwczovL2JpYmxpb3RlY2FzLnVuaWZlc3AuYnIvYmlibGlvdGVjYXMtZGEtcmVkZTwvYT4pIAo8YnI+PGJyPgpTw6NvIFBhdWxvLCBNb24gSmFuIDE4IDIxOjQ5OjE4IEJSU1QgMjAyMS4K
dc.title.none.fl_str_mv Integrando modelos transformer e stpa: uma abordagem automatizada para geração de perdas, perigos e restrições a partir de documentos de conops
dc.title.alternative.none.fl_str_mv Integrating transformer models and stpa: an automated approach for loss, hazard and constraint generation from conops documents
title Integrando modelos transformer e stpa: uma abordagem automatizada para geração de perdas, perigos e restrições a partir de documentos de conops
spellingShingle Integrando modelos transformer e stpa: uma abordagem automatizada para geração de perdas, perigos e restrições a partir de documentos de conops
Pacheco, Gabriel Nogueira [UNIFESP]
Processamento de linguagem natural
Grandes modelos de linguagem
STPA
ConOps
Ajuste fino
Não se aplica
title_short Integrando modelos transformer e stpa: uma abordagem automatizada para geração de perdas, perigos e restrições a partir de documentos de conops
title_full Integrando modelos transformer e stpa: uma abordagem automatizada para geração de perdas, perigos e restrições a partir de documentos de conops
title_fullStr Integrando modelos transformer e stpa: uma abordagem automatizada para geração de perdas, perigos e restrições a partir de documentos de conops
title_full_unstemmed Integrando modelos transformer e stpa: uma abordagem automatizada para geração de perdas, perigos e restrições a partir de documentos de conops
title_sort Integrando modelos transformer e stpa: uma abordagem automatizada para geração de perdas, perigos e restrições a partir de documentos de conops
author Pacheco, Gabriel Nogueira [UNIFESP]
author_facet Pacheco, Gabriel Nogueira [UNIFESP]
author_role author
dc.contributor.advisor-coLattes.none.fl_str_mv http://lattes.cnpq.br/9070607576528017
dc.contributor.advisorLattes.none.fl_str_mv http://lattes.cnpq.br/0203910403476737
dc.contributor.authorLattes.none.fl_str_mv http://lattes.cnpq.br/1871704115297627
dc.contributor.author.fl_str_mv Pacheco, Gabriel Nogueira [UNIFESP]
dc.contributor.advisor1.fl_str_mv Martins, Luiz Eduardo Galvão [UNIFESP]
dc.contributor.advisor-co1.fl_str_mv da Silva, Ana Estela Antunes [UNICAMP]
contributor_str_mv Martins, Luiz Eduardo Galvão [UNIFESP]
da Silva, Ana Estela Antunes [UNICAMP]
dc.subject.por.fl_str_mv Processamento de linguagem natural
Grandes modelos de linguagem
STPA
ConOps
Ajuste fino
topic Processamento de linguagem natural
Grandes modelos de linguagem
STPA
ConOps
Ajuste fino
Não se aplica
dc.subject.ods.none.fl_str_mv Não se aplica
description Este trabalho aborda os desafios nas metodologias de análise de segurança, particularmente a análise manual de documentos críticos para a segurança, ao propor uma abordagem inovadora que utiliza técnicas avançadas de processamento de linguagem natural (PLN). Focando no método System-Theoretic Process Analysis (STPA), introduzimos um pipeline que utiliza documentos de Concept of Operations (ConOps) como entrada para Grandes Modelos de Linguagem (LLM) a fim de automatizar a extração de perdas, perigos e restrições. Para alcançar este objetivo, criamos o dataset SHACO (STPA Hazard Analysis from ConOps), que contém documentos ConOps reais e gerados sinteticamente, pareados com suas respectivas análises STPA. Em seguida, empregamos o ajuste fino supervisionado para treinar os LLMs, especificamente o Llama3.1 e o Longformer Encoder-Decoder (LED), neste dataset para desenvolver nossos modelos. Nossa avaliação experimental, utilizando a métrica BERT-Score, demonstrou que nosso modelo resultante, o SHACO-Llama, alcançou um desempenho superior (F1-score: 80%) em comparação com o SHACO-LED (F1-score: 75%). A avaliação também identificou áreas específicas para melhoria na formulação das perdas e dos perigos. Este trabalho contribui para o avanço da análise de segurança de sistemas complexos ao oferecer uma metodologia mais eficiente e acessível, com a justificativa de superar as limitações da análise manual por meio de uma abordagem adaptativa e escalável.
publishDate 2025
dc.date.accessioned.fl_str_mv 2025-08-05T13:35:32Z
dc.date.available.fl_str_mv 2025-08-05T13:35:32Z
dc.date.issued.fl_str_mv 2025-06-26
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/11600/74736
dc.identifier.dark.fl_str_mv ark:/48912/001300001m32w
url https://hdl.handle.net/11600/74736
identifier_str_mv ark:/48912/001300001m32w
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 150 f.
dc.coverage.spatial.none.fl_str_mv São José dos Campos, SP
dc.publisher.none.fl_str_mv Universidade Federal de São Paulo
publisher.none.fl_str_mv Universidade Federal de São Paulo
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNIFESP
instname:Universidade Federal de São Paulo (UNIFESP)
instacron:UNIFESP
instname_str Universidade Federal de São Paulo (UNIFESP)
instacron_str UNIFESP
institution UNIFESP
reponame_str Repositório Institucional da UNIFESP
collection Repositório Institucional da UNIFESP
bitstream.url.fl_str_mv https://repositorio.unifesp.br/bitstreams/0d124805-a3b1-437e-b3b4-21d2a7b53141/download
https://repositorio.unifesp.br/bitstreams/3275c721-a328-47b5-8cd3-e38b33dcb3e5/download
https://repositorio.unifesp.br/bitstreams/9875278a-fc23-400c-b524-2572aea95995/download
https://repositorio.unifesp.br/bitstreams/66281f64-5466-4dd3-905e-384ff28293a1/download
bitstream.checksum.fl_str_mv 5424dae3d4451d764dfdc0d2fbb13272
79881d6dea480587c66312d1102a8942
3269fb825a3549ea99ce9d972bd64eca
ad48e1b2169683e203aeb387fbc9b92e
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UNIFESP - Universidade Federal de São Paulo (UNIFESP)
repository.mail.fl_str_mv biblioteca.csp@unifesp.br
_version_ 1863845870354563072