Integrando modelos transformer e stpa: uma abordagem automatizada para geração de perdas, perigos e restrições a partir de documentos de conops
| Ano de defesa: | 2025 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Dissertação |
| Tipo de acesso: | Acesso aberto |
| dARK ID: | ark:/48912/001300001m32w |
| Idioma: | eng |
| Instituição de defesa: |
Universidade Federal de São Paulo
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://hdl.handle.net/11600/74736 |
Resumo: | Este trabalho aborda os desafios nas metodologias de análise de segurança, particularmente a análise manual de documentos críticos para a segurança, ao propor uma abordagem inovadora que utiliza técnicas avançadas de processamento de linguagem natural (PLN). Focando no método System-Theoretic Process Analysis (STPA), introduzimos um pipeline que utiliza documentos de Concept of Operations (ConOps) como entrada para Grandes Modelos de Linguagem (LLM) a fim de automatizar a extração de perdas, perigos e restrições. Para alcançar este objetivo, criamos o dataset SHACO (STPA Hazard Analysis from ConOps), que contém documentos ConOps reais e gerados sinteticamente, pareados com suas respectivas análises STPA. Em seguida, empregamos o ajuste fino supervisionado para treinar os LLMs, especificamente o Llama3.1 e o Longformer Encoder-Decoder (LED), neste dataset para desenvolver nossos modelos. Nossa avaliação experimental, utilizando a métrica BERT-Score, demonstrou que nosso modelo resultante, o SHACO-Llama, alcançou um desempenho superior (F1-score: 80%) em comparação com o SHACO-LED (F1-score: 75%). A avaliação também identificou áreas específicas para melhoria na formulação das perdas e dos perigos. Este trabalho contribui para o avanço da análise de segurança de sistemas complexos ao oferecer uma metodologia mais eficiente e acessível, com a justificativa de superar as limitações da análise manual por meio de uma abordagem adaptativa e escalável. |
| id |
UFSP_2d3e2913042cf66a9887e3caacbe5735 |
|---|---|
| oai_identifier_str |
oai:repositorio.unifesp.br:11600/74736 |
| network_acronym_str |
UFSP |
| network_name_str |
Repositório Institucional da UNIFESP |
| repository_id_str |
|
| spelling |
http://lattes.cnpq.br/9070607576528017http://lattes.cnpq.br/0203910403476737Pacheco, Gabriel Nogueira [UNIFESP]http://lattes.cnpq.br/1871704115297627Martins, Luiz Eduardo Galvão [UNIFESP]da Silva, Ana Estela Antunes [UNICAMP]São José dos Campos, SP2025-08-05T13:35:32Z2025-08-05T13:35:32Z2025-06-26Este trabalho aborda os desafios nas metodologias de análise de segurança, particularmente a análise manual de documentos críticos para a segurança, ao propor uma abordagem inovadora que utiliza técnicas avançadas de processamento de linguagem natural (PLN). Focando no método System-Theoretic Process Analysis (STPA), introduzimos um pipeline que utiliza documentos de Concept of Operations (ConOps) como entrada para Grandes Modelos de Linguagem (LLM) a fim de automatizar a extração de perdas, perigos e restrições. Para alcançar este objetivo, criamos o dataset SHACO (STPA Hazard Analysis from ConOps), que contém documentos ConOps reais e gerados sinteticamente, pareados com suas respectivas análises STPA. Em seguida, empregamos o ajuste fino supervisionado para treinar os LLMs, especificamente o Llama3.1 e o Longformer Encoder-Decoder (LED), neste dataset para desenvolver nossos modelos. Nossa avaliação experimental, utilizando a métrica BERT-Score, demonstrou que nosso modelo resultante, o SHACO-Llama, alcançou um desempenho superior (F1-score: 80%) em comparação com o SHACO-LED (F1-score: 75%). A avaliação também identificou áreas específicas para melhoria na formulação das perdas e dos perigos. Este trabalho contribui para o avanço da análise de segurança de sistemas complexos ao oferecer uma metodologia mais eficiente e acessível, com a justificativa de superar as limitações da análise manual por meio de uma abordagem adaptativa e escalável.This work addresses the challenges in safety analysis methodologies, particularly the manual analysis of safety-critical documents, by proposing an innovative approach that leverages advanced natural language processing (NLP) techniques. Focusing on the System-Theoretic Process Analysis (STPA) method, we introduce a pipeline that uses Concept of Operations (ConOps) documents as input for Large Language Models (LLM) to automate the extraction of losses, hazards, and constraints. To achieve this, we created the SHACO (STPA Hazard Analysis from ConOps) dataset, which contains real and synthetically generated ConOps documents paired with their respective STPA analyses. We then employed supervised fine-tuning to train LLMs, specifically Llama3.1 and the Longformer Encoder-Decoder (LED), on this dataset to develop our models. Our experimental evaluation, using BERT-Score metrics, demonstrated that our resulting model, SHACO-Llama, achieved superior performance (F1-score: 80%) compared to SHACO-LED (F1-score: 75%). The evaluation also identified specific areas for improvement in the formulation of losses and hazards. This work contributes to advancing safety analysis for complex systems by offering a more efficient and accessible methodology, with the rationale being to overcome the limitations of manual analysis through an adaptive and scalable approach.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)88887.715361/2022-00legmartins@unifesp.br150 f.https://hdl.handle.net/11600/74736ark:/48912/001300001m32wengUniversidade Federal de São Pauloinfo:eu-repo/semantics/openAccessNão se aplicaProcessamento de linguagem naturalGrandes modelos de linguagemSTPAConOpsAjuste finoIntegrando modelos transformer e stpa: uma abordagem automatizada para geração de perdas, perigos e restrições a partir de documentos de conopsIntegrating transformer models and stpa: an automated approach for loss, hazard and constraint generation from conops documentsinfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersionreponame:Repositório Institucional da UNIFESPinstname:Universidade Federal de São Paulo (UNIFESP)instacron:UNIFESPInstituto de Ciência e Tecnologia (ICT)Ciência da ComputaçãoCiência da ComputaçãoProcessamento de Linguagem NaturalORIGINALdissertacao_gabriel_pacheco_v7-1.pdfdissertacao_gabriel_pacheco_v7-1.pdfapplication/pdf2916239https://repositorio.unifesp.br/bitstreams/0d124805-a3b1-437e-b3b4-21d2a7b53141/download5424dae3d4451d764dfdc0d2fbb13272MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-86456https://repositorio.unifesp.br/bitstreams/3275c721-a328-47b5-8cd3-e38b33dcb3e5/download79881d6dea480587c66312d1102a8942MD52TEXTdissertacao_gabriel_pacheco_v7-1.pdf.txtdissertacao_gabriel_pacheco_v7-1.pdf.txtExtracted texttext/plain100538https://repositorio.unifesp.br/bitstreams/9875278a-fc23-400c-b524-2572aea95995/download3269fb825a3549ea99ce9d972bd64ecaMD53THUMBNAILdissertacao_gabriel_pacheco_v7-1.pdf.jpgdissertacao_gabriel_pacheco_v7-1.pdf.jpgGenerated Thumbnailimage/jpeg3923https://repositorio.unifesp.br/bitstreams/66281f64-5466-4dd3-905e-384ff28293a1/downloadad48e1b2169683e203aeb387fbc9b92eMD5411600/747362025-08-06 04:01:33.127oai:repositorio.unifesp.br:11600/74736https://repositorio.unifesp.brRepositório InstitucionalPUBhttp://www.repositorio.unifesp.br/oai/requestbiblioteca.csp@unifesp.bropendoar:34652025-08-06T04:01:33Repositório Institucional da UNIFESP - Universidade Federal de São Paulo (UNIFESP)falsePGgxPjxzdHJvbmc+TGljZW7Dp2EgZGlzdHJpYnXDrWRhPC9zdHJvbmc+PC9oMT4KPGJyPjxicj4KTm8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgVW5pZmVzcCwgcGFyYSByZXByb2R1emlyLCB0cmFkdXppciBlIGRpc3RyaWJ1aXIgc3VhIHN1Ym1pc3PDo28gZW0gdG9kbyBvIG11bmRvLCB2b2PDqiBkZXZlIGNvbmNvcmRhciBjb20gb3MgdGVybW9zIGEgc2VndWlyLgo8YnI+PGJyPgpQYXJhIGNvbmNlZGVyIGEgbGljZW7Dp2EgZGUgZGlzdHJpYnVpw6fDo28gcGFkcsOjbywgYXDDs3MgYSBsZWl0dXJhIGRvcyB0ZXJtb3MsIHNlbGVjaW9uZTogIkV1IGNvbmNlZG8gYSBMaWNlbsOnYSIgZSBjbGlxdWUgZW0gIkZpbmFsaXphciBzdWJtaXNzw6NvIi4KPGJyPjxicj4KVEVSTU9TIEUgQ09OREnDh8OVRVMgUEFSQSBPIExJQ0VOQ0lBTUVOVE8gRE8gQVJRVUlWQU1FTlRPLCBSRVBST0RVw4fDg08gRSBESVZVTEdBw4fDg08gUMOaQkxJQ0EgREUgQ09OVEXDmkRPIE5PIFJFUE9TSVTDk1JJTyBJTlNUSVRVQ0lPTkFMIFVOSUZFU1AuCjxicj48YnI+CjEuIEV1LCByZXNwb25zw6F2ZWwgcGVsbyB0cmFiYWxobyBlL291IHVzdcOhcmlvLWRlcG9zaXRhbnRlIG5vIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIFVOSUZFU1AsIGFzc2VndXJvIG5vIHByZXNlbnRlIGF0byBxdWUgc291IHRpdHVsYXIgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhdHJpbW9uaWFpcyBlL291IGRpcmVpdG9zIGNvbmV4b3MgcmVmZXJlbnRlcyDDoCB0b3RhbGlkYWRlIGRhIE9icmEgb3JhIGRlcG9zaXRhZGEgZW0gZm9ybWF0byBkaWdpdGFsLCBiZW0gY29tbyBkZSBzZXVzIGNvbXBvbmVudGVzIG1lbm9yZXMsIGVtIHNlIHRyYXRhbmRvIGRlIG9icmEgY29sZXRpdmEsIGNvbmZvcm1lIG8gcHJlY2VpdHVhZG8gcGVsYSBMZWkgOS42MTAvOTggZS9vdSBMZWkgOS42MDkvOTguIE7Do28gc2VuZG8gZXN0ZSBvIGNhc28sIGFzc2VndXJvIHRlciBvYnRpZG8gZGlyZXRhbWVudGUgZG9zIGRldmlkb3MgdGl0dWxhcmVzIGF1dG9yaXphw6fDo28gcHLDqXZpYSBlIGV4cHJlc3NhIHBhcmEgbyBkZXDDs3NpdG8gZSBwYXJhIGEgZGl2dWxnYcOnw6NvIGRhIE9icmEsIGFicmFuZ2VuZG8gdG9kb3Mgb3MgZGlyZWl0b3MgYXV0b3JhaXMgZSBjb25leG9zIGFmZXRhZG9zIHBlbGEgYXNzaW5hdHVyYSBkbyBwcmVzZW50ZSB0ZXJtbyBkZSBsaWNlbmNpYW1lbnRvLCBkZSBtb2RvIGEgZWZldGl2YW1lbnRlIGlzZW50YXIgYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBTw6NvIFBhdWxvIChVTklGRVNQKSBlIHNldXMgZnVuY2lvbsOhcmlvcyBkZSBxdWFscXVlciByZXNwb25zYWJpbGlkYWRlIHBlbG8gdXNvIG7Do28tYXV0b3JpemFkbyBkbyBtYXRlcmlhbCBkZXBvc2l0YWRvLCBzZWphIGVtIHZpbmN1bGHDp8OjbyBhbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBVTklGRVNQLCBzZWphIGVtIHZpbmN1bGHDp8OjbyBhIHF1YWlzcXVlciBzZXJ2acOnb3MgZGUgYnVzY2EgZSBkZSBkaXN0cmlidWnDp8OjbyBkZSBjb250ZcO6ZG8gcXVlIGZhw6dhbSB1c28gZGFzIGludGVyZmFjZXMgZSBlc3Bhw6dvIGRlIGFybWF6ZW5hbWVudG8gcHJvdmlkZW5jaWFkb3MgcGVsYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBTw6NvIFBhdWxvIChVTklGRVNQKSBwb3IgbWVpbyBkZSBzZXVzIHNpc3RlbWFzIGluZm9ybWF0aXphZG9zLiAKPGJyPjxicj4KMi4gQSBjb25jb3Jkw6JuY2lhIGNvbSBlc3RhIGxpY2Vuw6dhIHRlbSBjb21vIGNvbnNlcXXDqm5jaWEgYSB0cmFuc2ZlcsOqbmNpYSwgYSB0w610dWxvIG7Do28tZXhjbHVzaXZvIGUgbsOjby1vbmVyb3NvLCBpc2VudGEgZG8gcGFnYW1lbnRvIGRlIHJveWFsdGllcyBvdSBxdWFscXVlciBvdXRyYSBjb250cmFwcmVzdGHDp8OjbywgcGVjdW5pw6FyaWEgb3UgbsOjbywgw6AgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgU8OjbyBQYXVsbyAoVU5JRkVTUCkgZG9zIGRpcmVpdG9zIGRlIGFybWF6ZW5hciBkaWdpdGFsbWVudGUsIGRlIHJlcHJvZHV6aXIgZSBkZSBkaXN0cmlidWlyIG5hY2lvbmFsIGUgaW50ZXJuYWNpb25hbG1lbnRlIGEgT2JyYSwgaW5jbHVpbmRvLXNlIG8gc2V1IHJlc3Vtby9hYnN0cmFjdCwgcG9yIG1laW9zIGVsZXRyw7RuaWNvcyBhbyBww7pibGljbyBlbSBnZXJhbCwgZW0gcmVnaW1lIGRlIGFjZXNzbyBhYmVydG8uCjxicj48YnI+CjMuIEEgcHJlc2VudGUgbGljZW7Dp2EgdGFtYsOpbSBhYnJhbmdlLCBub3MgbWVzbW9zIHRlcm1vcyBlc3RhYmVsZWNpZG9zIG5vIGl0ZW0gMiwgc3VwcmEsIHF1YWxxdWVyIGRpcmVpdG8gZGUgY29tdW5pY2HDp8OjbyBhbyBww7pibGljbyBjYWLDrXZlbCBlbSByZWxhw6fDo28gw6AgT2JyYSBvcmEgZGVwb3NpdGFkYSwgaW5jbHVpbmRvLXNlIG9zIHVzb3MgcmVmZXJlbnRlcyDDoCByZXByZXNlbnRhw6fDo28gcMO6YmxpY2EgZS9vdSBleGVjdcOnw6NvIHDDumJsaWNhLCBiZW0gY29tbyBxdWFscXVlciBvdXRyYSBtb2RhbGlkYWRlIGRlIGNvbXVuaWNhw6fDo28gYW8gcMO6YmxpY28gcXVlIGV4aXN0YSBvdSB2ZW5oYSBhIGV4aXN0aXIsIG5vcyB0ZXJtb3MgZG8gYXJ0aWdvIDY4IGUgc2VndWludGVzIGRhIExlaSA5LjYxMC85OCwgbmEgZXh0ZW5zw6NvIHF1ZSBmb3IgYXBsaWPDoXZlbCBhb3Mgc2VydmnDp29zIHByZXN0YWRvcyBhbyBww7pibGljbyBwZWxhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIFPDo28gUGF1bG8gKFVOSUZFU1ApLgo8YnI+PGJyPgo0LiBFc3RhIGxpY2Vuw6dhIGFicmFuZ2UsIGFpbmRhLCBub3MgbWVzbW9zIHRlcm1vcyBlc3RhYmVsZWNpZG9zIG5vIGl0ZW0gMiwgc3VwcmEsIHRvZG9zIG9zIGRpcmVpdG9zIGNvbmV4b3MgZGUgYXJ0aXN0YXMgaW50w6lycHJldGVzIG91IGV4ZWN1dGFudGVzLCBwcm9kdXRvcmVzIGZvbm9ncsOhZmljb3Mgb3UgZW1wcmVzYXMgZGUgcmFkaW9kaWZ1c8OjbyBxdWUgZXZlbnR1YWxtZW50ZSBzZWphbSBhcGxpY8OhdmVpcyBlbSByZWxhw6fDo28gw6Agb2JyYSBkZXBvc2l0YWRhLCBlbSBjb25mb3JtaWRhZGUgY29tIG8gcmVnaW1lIGZpeGFkbyBubyBUw610dWxvIFYgZGEgTGVpIDkuNjEwLzk4Lgo8YnI+PGJyPgo1LiBTZSBhIE9icmEgZGVwb3NpdGFkYSBmb2kgb3Ugw6kgb2JqZXRvIGRlIGZpbmFuY2lhbWVudG8gcG9yIGluc3RpdHVpw6fDtWVzIGRlIGZvbWVudG8gw6AgcGVzcXVpc2Egb3UgcXVhbHF1ZXIgb3V0cmEgc2VtZWxoYW50ZSwgdm9jw6ogb3UgbyB0aXR1bGFyIGFzc2VndXJhIHF1ZSBjdW1wcml1IHRvZGFzIGFzIG9icmlnYcOnw7VlcyBxdWUgbGhlIGZvcmFtIGltcG9zdGFzIHBlbGEgaW5zdGl0dWnDp8OjbyBmaW5hbmNpYWRvcmEgZW0gcmF6w6NvIGRvIGZpbmFuY2lhbWVudG8sIGUgcXVlIG7Do28gZXN0w6EgY29udHJhcmlhbmRvIHF1YWxxdWVyIGRpc3Bvc2nDp8OjbyBjb250cmF0dWFsIHJlZmVyZW50ZSDDoCBwdWJsaWNhw6fDo28gZG8gY29udGXDumRvIG9yYSBzdWJtZXRpZG8gYW8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgVU5JRkVTUC4KPGJyPjxicj4KNi4gQXV0b3JpemEgYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBTw6NvIFBhdWxvIGEgZGlzcG9uaWJpbGl6YXIgYSBvYnJhIG5vIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIFVOSUZFU1AgZGUgZm9ybWEgZ3JhdHVpdGEsIGRlIGFjb3JkbyBjb20gYSBsaWNlbsOnYSBww7pibGljYSBDcmVhdGl2ZSBDb21tb25zOiBBdHJpYnVpw6fDo28tU2VtIERlcml2YcOnw7Vlcy1TZW0gRGVyaXZhZG9zIDQuMCBJbnRlcm5hY2lvbmFsIChDQyBCWS1OQy1ORCksIHBlcm1pdGluZG8gc2V1IGxpdnJlIGFjZXNzbywgdXNvIGUgY29tcGFydGlsaGFtZW50bywgZGVzZGUgcXVlIGNpdGFkYSBhIGZvbnRlLiBBIG9icmEgY29udGludWEgcHJvdGVnaWRhIHBvciBEaXJlaXRvcyBBdXRvcmFpcyBlL291IHBvciBvdXRyYXMgbGVpcyBhcGxpY8OhdmVpcy4gUXVhbHF1ZXIgdXNvIGRhIG9icmEsIHF1ZSBuw6NvIG8gYXV0b3JpemFkbyBzb2IgZXN0YSBsaWNlbsOnYSBvdSBwZWxhIGxlZ2lzbGHDp8OjbyBhdXRvcmFsLCDDqSBwcm9pYmlkby4gIAo8YnI+PGJyPgo3LiBBdGVzdGEgcXVlIGEgT2JyYSBzdWJtZXRpZGEgbsOjbyBjb250w6ltIHF1YWxxdWVyIGluZm9ybWHDp8OjbyBjb25maWRlbmNpYWwgc3VhIG91IGRlIHRlcmNlaXJvcy4KPGJyPjxicj4KOC4gQXRlc3RhIHF1ZSBvIHRyYWJhbGhvIHN1Ym1ldGlkbyDDqSBvcmlnaW5hbCBlIGZvaSBlbGFib3JhZG8gcmVzcGVpdGFuZG8gb3MgcHJpbmPDrXBpb3MgZGEgbW9yYWwgZSBkYSDDqXRpY2EgZSBuw6NvIHZpb2xvdSBxdWFscXVlciBkaXJlaXRvIGRlIHByb3ByaWVkYWRlIGludGVsZWN0dWFsLCBzb2IgcGVuYSBkZSByZXNwb25kZXIgY2l2aWwsIGNyaW1pbmFsLCDDqXRpY2EgZSBwcm9maXNzaW9uYWxtZW50ZSBwb3IgbWV1cyBhdG9zOwo8YnI+PGJyPgo5LiBBdGVzdGEgcXVlIGEgdmVyc8OjbyBkbyB0cmFiYWxobyBwcmVzZW50ZSBubyBhcnF1aXZvIHN1Ym1ldGlkbywgZW0gY2Fzb3MgZGUgdHJhYmFsaG9zIHF1ZSBleGlnaXJhbSBvcmllbnRhw6fDo28sIMOpIGEgdmVyc8OjbyBkZWZpbml0aXZhIHF1ZSBpbmNsdWkgYXMgYWx0ZXJhw6fDtWVzIGRlY29ycmVudGVzIGRhIGRlZmVzYSwgc29saWNpdGFkYXMgcGVsYSBiYW5jYSwgc2UgaG91dmUgYWxndW1hLCBvdSBzb2xpY2l0YWRhcyBwb3IgcGFydGUgZGUgb3JpZW50YcOnw6NvIGRvY2VudGUgcmVzcG9uc8OhdmVsLiBBdGVzdG8gYWluZGEgcXVlIG8gdHJhYmFsaG8gb2J0ZXZlIGF1dG9yaXphw6fDo28gZGUgcHVibGljYcOnw6NvIGUgYWNlc3NvIGRvIChhKSBvcmllbnRhZG9yIChhKSBkZSBhY29yZG8gY29tIGFzIGluZm9ybWHDp8O1ZXMgYXF1aSBwcmVzdGFkYXM7Cjxicj48YnI+CjEwLiBDb25jZWRlIMOgIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIFPDo28gUGF1bG8gKFVOSUZFU1ApIG8gZGlyZWl0byBuw6NvIGV4Y2x1c2l2byBkZSByZWFsaXphciBxdWFpc3F1ZXIgYWx0ZXJhw6fDtWVzIG5hIG3DrWRpYSBvdSBubyBmb3JtYXRvIGRvIGFycXVpdm8gcGFyYSBwcm9ww7NzaXRvcyBkZSBwcmVzZXJ2YcOnw6NvIGRpZ2l0YWwsIGRlIGFjZXNzaWJpbGlkYWRlIGUgZGUgbWVsaG9yIGlkZW50aWZpY2HDp8OjbyBkbyB0cmFiYWxobyBzdWJtZXRpZG8sIGRlc2RlIHF1ZSBuw6NvIHNlamEgYWx0ZXJhZG8gc2V1IGNvbnRlw7pkbyBpbnRlbGVjdHVhbC4KPGJyPjxicj4KQW8gY29uY2x1aXIgYXMgZXRhcGFzIGRvIHByb2Nlc3NvIGRlIHN1Ym1pc3PDo28gZGUgYXJxdWl2b3Mgbm8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgVU5JRkVTUCwgYXRlc3RvIHF1ZSBsaSBlIGNvbmNvcmRlaSBpbnRlZ3JhbG1lbnRlIGNvbSBvcyB0ZXJtb3MgYWNpbWEgZGVsaW1pdGFkb3MsIHNlbSBmYXplciBxdWFscXVlciByZXNlcnZhIGUgbm92YW1lbnRlIGNvbmZpcm1hbmRvIHF1ZSBjdW1wcm8gb3MgcmVxdWlzaXRvcyBpbmRpY2Fkb3Mgbm9zIGl0ZW5zIG1lbmNpb25hZG9zIGFudGVyaW9ybWVudGUuCjxicj48YnI+CkhhdmVuZG8gcXVhbHF1ZXIgZGlzY29yZMOibmNpYSBlbSByZWxhw6fDo28gYSBwcmVzZW50ZSBsaWNlbsOnYSBvdSBuw6NvIHNlIHZlcmlmaWNhbmRvIG8gZXhpZ2lkbyBub3MgaXRlbnMgYW50ZXJpb3Jlcywgdm9jw6ogZGV2ZSBpbnRlcnJvbXBlciBpbWVkaWF0YW1lbnRlIG8gcHJvY2Vzc28gZGUgc3VibWlzc8Ojby4gQSBjb250aW51aWRhZGUgZG8gcHJvY2Vzc28gZXF1aXZhbGUgw6AgY29uY29yZMOibmNpYSBlIMOgIGFzc2luYXR1cmEgZGVzdGUgZG9jdW1lbnRvLCBjb20gdG9kYXMgYXMgY29uc2VxdcOqbmNpYXMgbmVsZSBwcmV2aXN0YXMsIHN1amVpdGFuZG8tc2UgbyBzaWduYXTDoXJpbyBhIHNhbsOnw7VlcyBjaXZpcyBlIGNyaW1pbmFpcyBjYXNvIG7Do28gc2VqYSB0aXR1bGFyIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBwYXRyaW1vbmlhaXMgZS9vdSBjb25leG9zIGFwbGljw6F2ZWlzIMOgIE9icmEgZGVwb3NpdGFkYSBkdXJhbnRlIGVzdGUgcHJvY2Vzc28sIG91IGNhc28gbsOjbyB0ZW5oYSBvYnRpZG8gcHLDqXZpYSBlIGV4cHJlc3NhIGF1dG9yaXphw6fDo28gZG8gdGl0dWxhciBwYXJhIG8gZGVww7NzaXRvIGUgdG9kb3Mgb3MgdXNvcyBkYSBPYnJhIGVudm9sdmlkb3MuCjxicj48YnI+ClNlIHRpdmVyIHF1YWxxdWVyIGTDunZpZGEgcXVhbnRvIGFvcyB0ZXJtb3MgZGUgbGljZW5jaWFtZW50byBlIHF1YW50byBhbyBwcm9jZXNzbyBkZSBzdWJtaXNzw6NvLCBlbnRyZSBlbSBjb250YXRvIGNvbSBhIGJpYmxpb3RlY2EgZG8gc2V1IGNhbXB1cyAoY29uc3VsdGUgZW06IDxhIGhyZWY9Imh0dHBzOi8vYmlibGlvdGVjYXMudW5pZmVzcC5ici9iaWJsaW90ZWNhcy1kYS1yZWRlIj5odHRwczovL2JpYmxpb3RlY2FzLnVuaWZlc3AuYnIvYmlibGlvdGVjYXMtZGEtcmVkZTwvYT4pIAo8YnI+PGJyPgpTw6NvIFBhdWxvLCBNb24gSmFuIDE4IDIxOjQ5OjE4IEJSU1QgMjAyMS4K |
| dc.title.none.fl_str_mv |
Integrando modelos transformer e stpa: uma abordagem automatizada para geração de perdas, perigos e restrições a partir de documentos de conops |
| dc.title.alternative.none.fl_str_mv |
Integrating transformer models and stpa: an automated approach for loss, hazard and constraint generation from conops documents |
| title |
Integrando modelos transformer e stpa: uma abordagem automatizada para geração de perdas, perigos e restrições a partir de documentos de conops |
| spellingShingle |
Integrando modelos transformer e stpa: uma abordagem automatizada para geração de perdas, perigos e restrições a partir de documentos de conops Pacheco, Gabriel Nogueira [UNIFESP] Processamento de linguagem natural Grandes modelos de linguagem STPA ConOps Ajuste fino Não se aplica |
| title_short |
Integrando modelos transformer e stpa: uma abordagem automatizada para geração de perdas, perigos e restrições a partir de documentos de conops |
| title_full |
Integrando modelos transformer e stpa: uma abordagem automatizada para geração de perdas, perigos e restrições a partir de documentos de conops |
| title_fullStr |
Integrando modelos transformer e stpa: uma abordagem automatizada para geração de perdas, perigos e restrições a partir de documentos de conops |
| title_full_unstemmed |
Integrando modelos transformer e stpa: uma abordagem automatizada para geração de perdas, perigos e restrições a partir de documentos de conops |
| title_sort |
Integrando modelos transformer e stpa: uma abordagem automatizada para geração de perdas, perigos e restrições a partir de documentos de conops |
| author |
Pacheco, Gabriel Nogueira [UNIFESP] |
| author_facet |
Pacheco, Gabriel Nogueira [UNIFESP] |
| author_role |
author |
| dc.contributor.advisor-coLattes.none.fl_str_mv |
http://lattes.cnpq.br/9070607576528017 |
| dc.contributor.advisorLattes.none.fl_str_mv |
http://lattes.cnpq.br/0203910403476737 |
| dc.contributor.authorLattes.none.fl_str_mv |
http://lattes.cnpq.br/1871704115297627 |
| dc.contributor.author.fl_str_mv |
Pacheco, Gabriel Nogueira [UNIFESP] |
| dc.contributor.advisor1.fl_str_mv |
Martins, Luiz Eduardo Galvão [UNIFESP] |
| dc.contributor.advisor-co1.fl_str_mv |
da Silva, Ana Estela Antunes [UNICAMP] |
| contributor_str_mv |
Martins, Luiz Eduardo Galvão [UNIFESP] da Silva, Ana Estela Antunes [UNICAMP] |
| dc.subject.por.fl_str_mv |
Processamento de linguagem natural Grandes modelos de linguagem STPA ConOps Ajuste fino |
| topic |
Processamento de linguagem natural Grandes modelos de linguagem STPA ConOps Ajuste fino Não se aplica |
| dc.subject.ods.none.fl_str_mv |
Não se aplica |
| description |
Este trabalho aborda os desafios nas metodologias de análise de segurança, particularmente a análise manual de documentos críticos para a segurança, ao propor uma abordagem inovadora que utiliza técnicas avançadas de processamento de linguagem natural (PLN). Focando no método System-Theoretic Process Analysis (STPA), introduzimos um pipeline que utiliza documentos de Concept of Operations (ConOps) como entrada para Grandes Modelos de Linguagem (LLM) a fim de automatizar a extração de perdas, perigos e restrições. Para alcançar este objetivo, criamos o dataset SHACO (STPA Hazard Analysis from ConOps), que contém documentos ConOps reais e gerados sinteticamente, pareados com suas respectivas análises STPA. Em seguida, empregamos o ajuste fino supervisionado para treinar os LLMs, especificamente o Llama3.1 e o Longformer Encoder-Decoder (LED), neste dataset para desenvolver nossos modelos. Nossa avaliação experimental, utilizando a métrica BERT-Score, demonstrou que nosso modelo resultante, o SHACO-Llama, alcançou um desempenho superior (F1-score: 80%) em comparação com o SHACO-LED (F1-score: 75%). A avaliação também identificou áreas específicas para melhoria na formulação das perdas e dos perigos. Este trabalho contribui para o avanço da análise de segurança de sistemas complexos ao oferecer uma metodologia mais eficiente e acessível, com a justificativa de superar as limitações da análise manual por meio de uma abordagem adaptativa e escalável. |
| publishDate |
2025 |
| dc.date.accessioned.fl_str_mv |
2025-08-05T13:35:32Z |
| dc.date.available.fl_str_mv |
2025-08-05T13:35:32Z |
| dc.date.issued.fl_str_mv |
2025-06-26 |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/11600/74736 |
| dc.identifier.dark.fl_str_mv |
ark:/48912/001300001m32w |
| url |
https://hdl.handle.net/11600/74736 |
| identifier_str_mv |
ark:/48912/001300001m32w |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
150 f. |
| dc.coverage.spatial.none.fl_str_mv |
São José dos Campos, SP |
| dc.publisher.none.fl_str_mv |
Universidade Federal de São Paulo |
| publisher.none.fl_str_mv |
Universidade Federal de São Paulo |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UNIFESP instname:Universidade Federal de São Paulo (UNIFESP) instacron:UNIFESP |
| instname_str |
Universidade Federal de São Paulo (UNIFESP) |
| instacron_str |
UNIFESP |
| institution |
UNIFESP |
| reponame_str |
Repositório Institucional da UNIFESP |
| collection |
Repositório Institucional da UNIFESP |
| bitstream.url.fl_str_mv |
https://repositorio.unifesp.br/bitstreams/0d124805-a3b1-437e-b3b4-21d2a7b53141/download https://repositorio.unifesp.br/bitstreams/3275c721-a328-47b5-8cd3-e38b33dcb3e5/download https://repositorio.unifesp.br/bitstreams/9875278a-fc23-400c-b524-2572aea95995/download https://repositorio.unifesp.br/bitstreams/66281f64-5466-4dd3-905e-384ff28293a1/download |
| bitstream.checksum.fl_str_mv |
5424dae3d4451d764dfdc0d2fbb13272 79881d6dea480587c66312d1102a8942 3269fb825a3549ea99ce9d972bd64eca ad48e1b2169683e203aeb387fbc9b92e |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UNIFESP - Universidade Federal de São Paulo (UNIFESP) |
| repository.mail.fl_str_mv |
biblioteca.csp@unifesp.br |
| _version_ |
1863845870354563072 |