Predicting occupationa laccidents in Brazil: a machine learning based approach

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Toledo, Jefferson de Morais
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://repositorio.ifpb.edu.br/jspui/handle/177683/4846
Resumo: Acidentes de trabalho representam um s?rio problema social no Brasil, muitas vezes causando mortes de trabalhadores ou incapacidade permanente para o trabalho. Portanto, ? necess?rio estudar distribui??o estat?stica desses acidentes no pa?s e avaliar a possibilidade de prever a ocorr?ncia desses fen?menos. Neste trabalho, obtemos um conjunto de dados unificado, que chamamos de BrStats, com dados estat?sticos de todas as cidades brasileiras, integrando dados p?blicos relacionados ? popula??o, economia, educa??o e sa?de. Em seguida, usamos o BrStats e adicionamos mais dados relacionados a acidentes de trabalho, inspe??es trabalhistas e emprego para obter conjuntos de dados que s?o usados para treinar modelos de aprendizado de m?quina (ML) para prever a ocorr?ncia de acidentes de trabalho no Brasil. Primeiramente, prevemos o n?mero de acidentes de trabalho em cada atividade econ?mica nos estados brasileiros treinando modelos de regress?o linear, m?quina de vetores de suporte (SVM), XGBoost e LightGBM. Neste cen?rio, obtemos valores de R2 pr?ximos a 0,9. Prevemos, ent?o, o n?mero de acidentes de trabalho em cidades brasileiras usando regress?o linear como baseline, al?m de algoritmos de ?rvores de decis?o e gradient boosting (Gradient Boosting, LightGBM, XGBoost e CatBoost), com a ado??o de otimiza??o bayesiana para ajustar os hiperpar?metros dos algoritmos. Tamb?m usamos uma t?cnica de sele??o de features baseada na import?ncia das features para avaliar quais vari?veis apresentam maior signific?ncia nas predi??es. Os modelos apresentam alto desempenho, com a m?trica R-quadrado atingindo valores superiores a 0,90. Os resultados obtidos neste trabalho podem auxiliar o governo e as empresas a adotarem a??es preventivas para evitar acidentes de trabalho, reduzindo os custos humanos e previdenci?rios do pa?s.
id IFPB_f8fae2f0e1ed2cd3777ed0740aa00309
oai_identifier_str oai:repositorio.ifpb.edu.br:177683/4846
network_acronym_str IFPB
network_name_str Repositório Institucional do IFPB
repository_id_str
spelling Toledo, Jefferson de Morais2025-10-23T11:27:10Z2025-10-23T11:27:10Z2025-10-23http://repositorio.ifpb.edu.br/jspui/handle/177683/4846Acidentes de trabalho representam um s?rio problema social no Brasil, muitas vezes causando mortes de trabalhadores ou incapacidade permanente para o trabalho. Portanto, ? necess?rio estudar distribui??o estat?stica desses acidentes no pa?s e avaliar a possibilidade de prever a ocorr?ncia desses fen?menos. Neste trabalho, obtemos um conjunto de dados unificado, que chamamos de BrStats, com dados estat?sticos de todas as cidades brasileiras, integrando dados p?blicos relacionados ? popula??o, economia, educa??o e sa?de. Em seguida, usamos o BrStats e adicionamos mais dados relacionados a acidentes de trabalho, inspe??es trabalhistas e emprego para obter conjuntos de dados que s?o usados para treinar modelos de aprendizado de m?quina (ML) para prever a ocorr?ncia de acidentes de trabalho no Brasil. Primeiramente, prevemos o n?mero de acidentes de trabalho em cada atividade econ?mica nos estados brasileiros treinando modelos de regress?o linear, m?quina de vetores de suporte (SVM), XGBoost e LightGBM. Neste cen?rio, obtemos valores de R2 pr?ximos a 0,9. Prevemos, ent?o, o n?mero de acidentes de trabalho em cidades brasileiras usando regress?o linear como baseline, al?m de algoritmos de ?rvores de decis?o e gradient boosting (Gradient Boosting, LightGBM, XGBoost e CatBoost), com a ado??o de otimiza??o bayesiana para ajustar os hiperpar?metros dos algoritmos. Tamb?m usamos uma t?cnica de sele??o de features baseada na import?ncia das features para avaliar quais vari?veis apresentam maior signific?ncia nas predi??es. Os modelos apresentam alto desempenho, com a m?trica R-quadrado atingindo valores superiores a 0,90. Os resultados obtidos neste trabalho podem auxiliar o governo e as empresas a adotarem a??es preventivas para evitar acidentes de trabalho, reduzindo os custos humanos e previdenci?rios do pa?s.Submitted by Coordena??o Mestrado em Tecnologia da Informa??o (coordenacao.ppgti@ifpb.edu.br) on 2025-10-23T10:28:30Z No. of bitstreams: 1 Disserta??o - Jefferson - final.pdf: 2718589 bytes, checksum: e13b1fdfc1b74f9e1d414d63468d3c1f (MD5)Approved for entry into archive by Josinete Nobrega Araujo (josinete@ifpb.edu.br) on 2025-10-23T11:27:10Z (GMT) No. of bitstreams: 1 Disserta??o - Jefferson - final.pdf: 2718589 bytes, checksum: e13b1fdfc1b74f9e1d414d63468d3c1f (MD5)Made available in DSpace on 2025-10-23T11:27:10Z (GMT). No. of bitstreams: 1 Disserta??o - Jefferson - final.pdf: 2718589 bytes, checksum: e13b1fdfc1b74f9e1d414d63468d3c1f (MD5) Previous issue date: 2025-10-23Acidentes de trabalhoAprendizado de m?quinaAlgoritmos de regress?oPredicting occupationa laccidents in Brazil: a machine learning based approachinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisengreponame:Repositório Institucional do IFPBinstname:Instituto Federal da Paraíba (IFPB)instacron:IFPBinfo:eu-repo/semantics/openAccessDisserta??oInstituto Federal da Para?baORIGINALDisserta??o - Jefferson - final.pdfDisserta??o - Jefferson - final.pdfapplication/pdf2718589http://repositorio.ifpb.edu.br/jspui/bitstream/177683/4846/1/Disserta%C3%A7%C3%A3o+-+Jefferson+-+final.pdfe13b1fdfc1b74f9e1d414d63468d3c1fMD51177683/48462025-10-23 08:27:10.243oai:repositorio.ifpb.edu.br:177683/4846Repositório InstitucionalPUBhttp://repositorio.ifpb.edu.br/oai/requestrepositoriodigital@ifpb.edu.bropendoar:2025-10-23T11:27:10Repositório Institucional do IFPB - Instituto Federal da Paraíba (IFPB)false
dc.title.pt_BR.fl_str_mv Predicting occupationa laccidents in Brazil: a machine learning based approach
title Predicting occupationa laccidents in Brazil: a machine learning based approach
spellingShingle Predicting occupationa laccidents in Brazil: a machine learning based approach
Toledo, Jefferson de Morais
Acidentes de trabalho
Aprendizado de m?quina
Algoritmos de regress?o
title_short Predicting occupationa laccidents in Brazil: a machine learning based approach
title_full Predicting occupationa laccidents in Brazil: a machine learning based approach
title_fullStr Predicting occupationa laccidents in Brazil: a machine learning based approach
title_full_unstemmed Predicting occupationa laccidents in Brazil: a machine learning based approach
title_sort Predicting occupationa laccidents in Brazil: a machine learning based approach
author Toledo, Jefferson de Morais
author_facet Toledo, Jefferson de Morais
author_role author
dc.contributor.author.fl_str_mv Toledo, Jefferson de Morais
dc.subject.por.fl_str_mv Acidentes de trabalho
Aprendizado de m?quina
Algoritmos de regress?o
topic Acidentes de trabalho
Aprendizado de m?quina
Algoritmos de regress?o
description Acidentes de trabalho representam um s?rio problema social no Brasil, muitas vezes causando mortes de trabalhadores ou incapacidade permanente para o trabalho. Portanto, ? necess?rio estudar distribui??o estat?stica desses acidentes no pa?s e avaliar a possibilidade de prever a ocorr?ncia desses fen?menos. Neste trabalho, obtemos um conjunto de dados unificado, que chamamos de BrStats, com dados estat?sticos de todas as cidades brasileiras, integrando dados p?blicos relacionados ? popula??o, economia, educa??o e sa?de. Em seguida, usamos o BrStats e adicionamos mais dados relacionados a acidentes de trabalho, inspe??es trabalhistas e emprego para obter conjuntos de dados que s?o usados para treinar modelos de aprendizado de m?quina (ML) para prever a ocorr?ncia de acidentes de trabalho no Brasil. Primeiramente, prevemos o n?mero de acidentes de trabalho em cada atividade econ?mica nos estados brasileiros treinando modelos de regress?o linear, m?quina de vetores de suporte (SVM), XGBoost e LightGBM. Neste cen?rio, obtemos valores de R2 pr?ximos a 0,9. Prevemos, ent?o, o n?mero de acidentes de trabalho em cidades brasileiras usando regress?o linear como baseline, al?m de algoritmos de ?rvores de decis?o e gradient boosting (Gradient Boosting, LightGBM, XGBoost e CatBoost), com a ado??o de otimiza??o bayesiana para ajustar os hiperpar?metros dos algoritmos. Tamb?m usamos uma t?cnica de sele??o de features baseada na import?ncia das features para avaliar quais vari?veis apresentam maior signific?ncia nas predi??es. Os modelos apresentam alto desempenho, com a m?trica R-quadrado atingindo valores superiores a 0,90. Os resultados obtidos neste trabalho podem auxiliar o governo e as empresas a adotarem a??es preventivas para evitar acidentes de trabalho, reduzindo os custos humanos e previdenci?rios do pa?s.
publishDate 2025
dc.date.accessioned.fl_str_mv 2025-10-23T11:27:10Z
dc.date.available.fl_str_mv 2025-10-23T11:27:10Z
dc.date.issued.fl_str_mv 2025-10-23
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://repositorio.ifpb.edu.br/jspui/handle/177683/4846
url http://repositorio.ifpb.edu.br/jspui/handle/177683/4846
dc.language.iso.fl_str_mv eng
language eng
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Repositório Institucional do IFPB
instname:Instituto Federal da Paraíba (IFPB)
instacron:IFPB
instname_str Instituto Federal da Paraíba (IFPB)
instacron_str IFPB
institution IFPB
reponame_str Repositório Institucional do IFPB
collection Repositório Institucional do IFPB
bitstream.url.fl_str_mv http://repositorio.ifpb.edu.br/jspui/bitstream/177683/4846/1/Disserta%C3%A7%C3%A3o+-+Jefferson+-+final.pdf
bitstream.checksum.fl_str_mv e13b1fdfc1b74f9e1d414d63468d3c1f
bitstream.checksumAlgorithm.fl_str_mv MD5
repository.name.fl_str_mv Repositório Institucional do IFPB - Instituto Federal da Paraíba (IFPB)
repository.mail.fl_str_mv repositoriodigital@ifpb.edu.br
_version_ 1854303751428374528