Aplicação de machine learning para análise dos fatores de ocorrências de crimes entre o período 2008 à 2012 nos municípios do Estado de São Paulo

Detalhes bibliográficos
Ano de defesa: 2025
Autor(a) principal: Fernandes, Danilo Douradinho
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/12/12139/tde-14072025-153939/
Resumo: A criminalidade é um fenômeno multifacetado que afeta diversas esferas sociais e econômicas, tornando-se um desafio significativo para as políticas públicas. O avanço da ciência de dados e das técnicas de Machine Learning (ML) tem permitido novas abordagens para a análise e previsão de padrões criminais. Neste contexto, a presente tese tem como objetivo analisar os fatores socioeconômicos associados às ocorrências criminais nos municípios do Estado de São Paulo entre os anos de 2008 e 2012, utilizando algoritmos de aprendizado de máquina para identificar padrões e desenvolver modelos preditivos. Para a realização do estudo, foram utilizados dados de Boletins de Ocorrência (BOs) disponibilizados pela Secretaria de Segurança Pública do Estado de São Paulo (SSP-SP), combinados com dados socioeconômicos do Índice Paulista de Responsabilidade Social (IPRS), fornecido pela Assembleia Legislativa do Estado de São Paulo (ALESP). A metodologia envolveu a coleta, pré-processamento e integração dessas bases de dados, seguidos pela aplicação do algoritmo Extreme Gradient Boosting (XGBoost), amplamente reconhecido por sua capacidade de lidar com grandes volumes de dados e variáveis complexas. Os dados foram analisados com o objetivo de encontrar padrões ocultos de criminalidade, considerando variáveis como taxa de desemprego, escolaridade, infraestrutura urbana e densidade populacional. O modelo foi avaliado por métricas como RMSE, MAE e R2, permitindo aferir sua precisão e confiabilidade. A análise revelou padrões complexos que modelos tradicionais não capturam plenamente, evidenciando a importância de técnicas avançadas de análise de dados para identificar determinantes críticos. Os resultados indicam que Municípios com maior vulnerabilidade socioeconômica tendem a registrar taxas mais elevadas de criminalidade, evidenciando a necessidade de políticas públicas voltadas para a redução das desigualdades e o aumento da segurança comunitária. A análise preditiva revelou que os modelos de ML podem fornecer suporte valioso para a alocação eficiente de recursos de segurança pública, permitindo a identificação proativa de áreas de risco. Assim, a utilização de técnicas de aprendizado de máquina na análise da criminalidade oferece uma abordagem promissora para a formulação de políticas públicas baseadas em dados concretos. O estudo contribui para a literatura acadêmica ao demonstrar como a integração de dados socioeconômicos e criminais, aliada a modelos preditivos avançados, pode aprimorar a compreensão dos fatores que influenciam a segurança pública.
id USP_b6fab167651b41a4831a6881f58a014e
oai_identifier_str oai:teses.usp.br:tde-14072025-153939
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str
spelling Aplicação de machine learning para análise dos fatores de ocorrências de crimes entre o período 2008 à 2012 nos municípios do Estado de São PauloMachine learning application for analysis of factors relating to crime occurrences between 2008 and 2012 in municipalities of the State of São PauloAprendizado de máquinaArtificial intelligenceCiência de dadosCrimeCriminalidadeData scienceInteligência artificialMachine learningPublic securitySegurança públicaA criminalidade é um fenômeno multifacetado que afeta diversas esferas sociais e econômicas, tornando-se um desafio significativo para as políticas públicas. O avanço da ciência de dados e das técnicas de Machine Learning (ML) tem permitido novas abordagens para a análise e previsão de padrões criminais. Neste contexto, a presente tese tem como objetivo analisar os fatores socioeconômicos associados às ocorrências criminais nos municípios do Estado de São Paulo entre os anos de 2008 e 2012, utilizando algoritmos de aprendizado de máquina para identificar padrões e desenvolver modelos preditivos. Para a realização do estudo, foram utilizados dados de Boletins de Ocorrência (BOs) disponibilizados pela Secretaria de Segurança Pública do Estado de São Paulo (SSP-SP), combinados com dados socioeconômicos do Índice Paulista de Responsabilidade Social (IPRS), fornecido pela Assembleia Legislativa do Estado de São Paulo (ALESP). A metodologia envolveu a coleta, pré-processamento e integração dessas bases de dados, seguidos pela aplicação do algoritmo Extreme Gradient Boosting (XGBoost), amplamente reconhecido por sua capacidade de lidar com grandes volumes de dados e variáveis complexas. Os dados foram analisados com o objetivo de encontrar padrões ocultos de criminalidade, considerando variáveis como taxa de desemprego, escolaridade, infraestrutura urbana e densidade populacional. O modelo foi avaliado por métricas como RMSE, MAE e R2, permitindo aferir sua precisão e confiabilidade. A análise revelou padrões complexos que modelos tradicionais não capturam plenamente, evidenciando a importância de técnicas avançadas de análise de dados para identificar determinantes críticos. Os resultados indicam que Municípios com maior vulnerabilidade socioeconômica tendem a registrar taxas mais elevadas de criminalidade, evidenciando a necessidade de políticas públicas voltadas para a redução das desigualdades e o aumento da segurança comunitária. A análise preditiva revelou que os modelos de ML podem fornecer suporte valioso para a alocação eficiente de recursos de segurança pública, permitindo a identificação proativa de áreas de risco. Assim, a utilização de técnicas de aprendizado de máquina na análise da criminalidade oferece uma abordagem promissora para a formulação de políticas públicas baseadas em dados concretos. O estudo contribui para a literatura acadêmica ao demonstrar como a integração de dados socioeconômicos e criminais, aliada a modelos preditivos avançados, pode aprimorar a compreensão dos fatores que influenciam a segurança pública.Crime is a multifaceted phenomenon that affects various social and economic spheres, posing a significant challenge to public policies. The advancement of data science and Machine Learning (ML) techniques has enabled new approaches to the analysis and prediction of crime patterns. In this context, the present thesis aims to analyze the socioeconomic factors associated with criminal occurrences in the municipalities of the State of São Paulo between the years 2008 and 2012, using machine learning algorithms to identify patterns and develop predictive models. For the development of the study, data from Police Reports (BOs) provided by the São Paulo State Public Security Department (SSP-SP) were used, combined with socioeconomic data from the Paulista Social Responsibility Index (IPRS), supplied by the Legislative Assembly of the State of São Paulo (ALESP). The methodology involved data collection, preprocessing, and integration of these datasets, followed by the application of the Extreme Gradient Boosting (XGBoost) algorithm, widely recognized for its ability to handle large volumes of data and complex variables. The data were analyzed with the objective of uncovering hidden crime patterns, considering variables such as unemployment rate, education level, urban infrastructure, and population density. The model was evaluated using metrics such as RMSE, MAE, and R!, enabling an assessment of its accuracy and reliability. The analysis revealed complex patterns that traditional models do not fully capture, highlighting the importance of advanced data analysis techniques to identify critical determinants. The results indicate that municipalities with greater socioeconomic vulnerability tend to record higher crime rates, emphasizing the need for public policies aimed at reducing inequalities and increasing community security. Predictive analysis demonstrated that ML models can provide valuable support for the efficient allocation of public security resources, allowing proactive identification of high-risk areas. Thus, the use of machine learning techniques in crime analysis offers a promising approach to the formulation of data-driven public policies. This study contributes to the academic literature by demonstrating how the integration of socioeconomic and crime data, combined with advanced predictive models, can enhance the understanding of factors influencing public security.Biblioteca Digitais de Teses e Dissertações da USPMontini, Alessandra de ÁvilaFernandes, Danilo Douradinho2025-05-13info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/12/12139/tde-14072025-153939/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2025-07-18T14:28:01Zoai:teses.usp.br:tde-14072025-153939Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-07-18T14:28:01Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Aplicação de machine learning para análise dos fatores de ocorrências de crimes entre o período 2008 à 2012 nos municípios do Estado de São Paulo
Machine learning application for analysis of factors relating to crime occurrences between 2008 and 2012 in municipalities of the State of São Paulo
title Aplicação de machine learning para análise dos fatores de ocorrências de crimes entre o período 2008 à 2012 nos municípios do Estado de São Paulo
spellingShingle Aplicação de machine learning para análise dos fatores de ocorrências de crimes entre o período 2008 à 2012 nos municípios do Estado de São Paulo
Fernandes, Danilo Douradinho
Aprendizado de máquina
Artificial intelligence
Ciência de dados
Crime
Criminalidade
Data science
Inteligência artificial
Machine learning
Public security
Segurança pública
title_short Aplicação de machine learning para análise dos fatores de ocorrências de crimes entre o período 2008 à 2012 nos municípios do Estado de São Paulo
title_full Aplicação de machine learning para análise dos fatores de ocorrências de crimes entre o período 2008 à 2012 nos municípios do Estado de São Paulo
title_fullStr Aplicação de machine learning para análise dos fatores de ocorrências de crimes entre o período 2008 à 2012 nos municípios do Estado de São Paulo
title_full_unstemmed Aplicação de machine learning para análise dos fatores de ocorrências de crimes entre o período 2008 à 2012 nos municípios do Estado de São Paulo
title_sort Aplicação de machine learning para análise dos fatores de ocorrências de crimes entre o período 2008 à 2012 nos municípios do Estado de São Paulo
author Fernandes, Danilo Douradinho
author_facet Fernandes, Danilo Douradinho
author_role author
dc.contributor.none.fl_str_mv Montini, Alessandra de Ávila
dc.contributor.author.fl_str_mv Fernandes, Danilo Douradinho
dc.subject.por.fl_str_mv Aprendizado de máquina
Artificial intelligence
Ciência de dados
Crime
Criminalidade
Data science
Inteligência artificial
Machine learning
Public security
Segurança pública
topic Aprendizado de máquina
Artificial intelligence
Ciência de dados
Crime
Criminalidade
Data science
Inteligência artificial
Machine learning
Public security
Segurança pública
description A criminalidade é um fenômeno multifacetado que afeta diversas esferas sociais e econômicas, tornando-se um desafio significativo para as políticas públicas. O avanço da ciência de dados e das técnicas de Machine Learning (ML) tem permitido novas abordagens para a análise e previsão de padrões criminais. Neste contexto, a presente tese tem como objetivo analisar os fatores socioeconômicos associados às ocorrências criminais nos municípios do Estado de São Paulo entre os anos de 2008 e 2012, utilizando algoritmos de aprendizado de máquina para identificar padrões e desenvolver modelos preditivos. Para a realização do estudo, foram utilizados dados de Boletins de Ocorrência (BOs) disponibilizados pela Secretaria de Segurança Pública do Estado de São Paulo (SSP-SP), combinados com dados socioeconômicos do Índice Paulista de Responsabilidade Social (IPRS), fornecido pela Assembleia Legislativa do Estado de São Paulo (ALESP). A metodologia envolveu a coleta, pré-processamento e integração dessas bases de dados, seguidos pela aplicação do algoritmo Extreme Gradient Boosting (XGBoost), amplamente reconhecido por sua capacidade de lidar com grandes volumes de dados e variáveis complexas. Os dados foram analisados com o objetivo de encontrar padrões ocultos de criminalidade, considerando variáveis como taxa de desemprego, escolaridade, infraestrutura urbana e densidade populacional. O modelo foi avaliado por métricas como RMSE, MAE e R2, permitindo aferir sua precisão e confiabilidade. A análise revelou padrões complexos que modelos tradicionais não capturam plenamente, evidenciando a importância de técnicas avançadas de análise de dados para identificar determinantes críticos. Os resultados indicam que Municípios com maior vulnerabilidade socioeconômica tendem a registrar taxas mais elevadas de criminalidade, evidenciando a necessidade de políticas públicas voltadas para a redução das desigualdades e o aumento da segurança comunitária. A análise preditiva revelou que os modelos de ML podem fornecer suporte valioso para a alocação eficiente de recursos de segurança pública, permitindo a identificação proativa de áreas de risco. Assim, a utilização de técnicas de aprendizado de máquina na análise da criminalidade oferece uma abordagem promissora para a formulação de políticas públicas baseadas em dados concretos. O estudo contribui para a literatura acadêmica ao demonstrar como a integração de dados socioeconômicos e criminais, aliada a modelos preditivos avançados, pode aprimorar a compreensão dos fatores que influenciam a segurança pública.
publishDate 2025
dc.date.none.fl_str_mv 2025-05-13
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/12/12139/tde-14072025-153939/
url https://www.teses.usp.br/teses/disponiveis/12/12139/tde-14072025-153939/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1865492286213718016