Aplicação de machine learning para análise dos fatores de ocorrências de crimes entre o período 2008 à 2012 nos municípios do Estado de São Paulo
| Ano de defesa: | 2025 |
|---|---|
| Autor(a) principal: | |
| Orientador(a): | |
| Banca de defesa: | |
| Tipo de documento: | Tese |
| Tipo de acesso: | Acesso aberto |
| Idioma: | por |
| Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: | |
| Link de acesso: | https://www.teses.usp.br/teses/disponiveis/12/12139/tde-14072025-153939/ |
Resumo: | A criminalidade é um fenômeno multifacetado que afeta diversas esferas sociais e econômicas, tornando-se um desafio significativo para as políticas públicas. O avanço da ciência de dados e das técnicas de Machine Learning (ML) tem permitido novas abordagens para a análise e previsão de padrões criminais. Neste contexto, a presente tese tem como objetivo analisar os fatores socioeconômicos associados às ocorrências criminais nos municípios do Estado de São Paulo entre os anos de 2008 e 2012, utilizando algoritmos de aprendizado de máquina para identificar padrões e desenvolver modelos preditivos. Para a realização do estudo, foram utilizados dados de Boletins de Ocorrência (BOs) disponibilizados pela Secretaria de Segurança Pública do Estado de São Paulo (SSP-SP), combinados com dados socioeconômicos do Índice Paulista de Responsabilidade Social (IPRS), fornecido pela Assembleia Legislativa do Estado de São Paulo (ALESP). A metodologia envolveu a coleta, pré-processamento e integração dessas bases de dados, seguidos pela aplicação do algoritmo Extreme Gradient Boosting (XGBoost), amplamente reconhecido por sua capacidade de lidar com grandes volumes de dados e variáveis complexas. Os dados foram analisados com o objetivo de encontrar padrões ocultos de criminalidade, considerando variáveis como taxa de desemprego, escolaridade, infraestrutura urbana e densidade populacional. O modelo foi avaliado por métricas como RMSE, MAE e R2, permitindo aferir sua precisão e confiabilidade. A análise revelou padrões complexos que modelos tradicionais não capturam plenamente, evidenciando a importância de técnicas avançadas de análise de dados para identificar determinantes críticos. Os resultados indicam que Municípios com maior vulnerabilidade socioeconômica tendem a registrar taxas mais elevadas de criminalidade, evidenciando a necessidade de políticas públicas voltadas para a redução das desigualdades e o aumento da segurança comunitária. A análise preditiva revelou que os modelos de ML podem fornecer suporte valioso para a alocação eficiente de recursos de segurança pública, permitindo a identificação proativa de áreas de risco. Assim, a utilização de técnicas de aprendizado de máquina na análise da criminalidade oferece uma abordagem promissora para a formulação de políticas públicas baseadas em dados concretos. O estudo contribui para a literatura acadêmica ao demonstrar como a integração de dados socioeconômicos e criminais, aliada a modelos preditivos avançados, pode aprimorar a compreensão dos fatores que influenciam a segurança pública. |
| id |
USP_b6fab167651b41a4831a6881f58a014e |
|---|---|
| oai_identifier_str |
oai:teses.usp.br:tde-14072025-153939 |
| network_acronym_str |
USP |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
| repository_id_str |
|
| spelling |
Aplicação de machine learning para análise dos fatores de ocorrências de crimes entre o período 2008 à 2012 nos municípios do Estado de São PauloMachine learning application for analysis of factors relating to crime occurrences between 2008 and 2012 in municipalities of the State of São PauloAprendizado de máquinaArtificial intelligenceCiência de dadosCrimeCriminalidadeData scienceInteligência artificialMachine learningPublic securitySegurança públicaA criminalidade é um fenômeno multifacetado que afeta diversas esferas sociais e econômicas, tornando-se um desafio significativo para as políticas públicas. O avanço da ciência de dados e das técnicas de Machine Learning (ML) tem permitido novas abordagens para a análise e previsão de padrões criminais. Neste contexto, a presente tese tem como objetivo analisar os fatores socioeconômicos associados às ocorrências criminais nos municípios do Estado de São Paulo entre os anos de 2008 e 2012, utilizando algoritmos de aprendizado de máquina para identificar padrões e desenvolver modelos preditivos. Para a realização do estudo, foram utilizados dados de Boletins de Ocorrência (BOs) disponibilizados pela Secretaria de Segurança Pública do Estado de São Paulo (SSP-SP), combinados com dados socioeconômicos do Índice Paulista de Responsabilidade Social (IPRS), fornecido pela Assembleia Legislativa do Estado de São Paulo (ALESP). A metodologia envolveu a coleta, pré-processamento e integração dessas bases de dados, seguidos pela aplicação do algoritmo Extreme Gradient Boosting (XGBoost), amplamente reconhecido por sua capacidade de lidar com grandes volumes de dados e variáveis complexas. Os dados foram analisados com o objetivo de encontrar padrões ocultos de criminalidade, considerando variáveis como taxa de desemprego, escolaridade, infraestrutura urbana e densidade populacional. O modelo foi avaliado por métricas como RMSE, MAE e R2, permitindo aferir sua precisão e confiabilidade. A análise revelou padrões complexos que modelos tradicionais não capturam plenamente, evidenciando a importância de técnicas avançadas de análise de dados para identificar determinantes críticos. Os resultados indicam que Municípios com maior vulnerabilidade socioeconômica tendem a registrar taxas mais elevadas de criminalidade, evidenciando a necessidade de políticas públicas voltadas para a redução das desigualdades e o aumento da segurança comunitária. A análise preditiva revelou que os modelos de ML podem fornecer suporte valioso para a alocação eficiente de recursos de segurança pública, permitindo a identificação proativa de áreas de risco. Assim, a utilização de técnicas de aprendizado de máquina na análise da criminalidade oferece uma abordagem promissora para a formulação de políticas públicas baseadas em dados concretos. O estudo contribui para a literatura acadêmica ao demonstrar como a integração de dados socioeconômicos e criminais, aliada a modelos preditivos avançados, pode aprimorar a compreensão dos fatores que influenciam a segurança pública.Crime is a multifaceted phenomenon that affects various social and economic spheres, posing a significant challenge to public policies. The advancement of data science and Machine Learning (ML) techniques has enabled new approaches to the analysis and prediction of crime patterns. In this context, the present thesis aims to analyze the socioeconomic factors associated with criminal occurrences in the municipalities of the State of São Paulo between the years 2008 and 2012, using machine learning algorithms to identify patterns and develop predictive models. For the development of the study, data from Police Reports (BOs) provided by the São Paulo State Public Security Department (SSP-SP) were used, combined with socioeconomic data from the Paulista Social Responsibility Index (IPRS), supplied by the Legislative Assembly of the State of São Paulo (ALESP). The methodology involved data collection, preprocessing, and integration of these datasets, followed by the application of the Extreme Gradient Boosting (XGBoost) algorithm, widely recognized for its ability to handle large volumes of data and complex variables. The data were analyzed with the objective of uncovering hidden crime patterns, considering variables such as unemployment rate, education level, urban infrastructure, and population density. The model was evaluated using metrics such as RMSE, MAE, and R!, enabling an assessment of its accuracy and reliability. The analysis revealed complex patterns that traditional models do not fully capture, highlighting the importance of advanced data analysis techniques to identify critical determinants. The results indicate that municipalities with greater socioeconomic vulnerability tend to record higher crime rates, emphasizing the need for public policies aimed at reducing inequalities and increasing community security. Predictive analysis demonstrated that ML models can provide valuable support for the efficient allocation of public security resources, allowing proactive identification of high-risk areas. Thus, the use of machine learning techniques in crime analysis offers a promising approach to the formulation of data-driven public policies. This study contributes to the academic literature by demonstrating how the integration of socioeconomic and crime data, combined with advanced predictive models, can enhance the understanding of factors influencing public security.Biblioteca Digitais de Teses e Dissertações da USPMontini, Alessandra de ÁvilaFernandes, Danilo Douradinho2025-05-13info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/12/12139/tde-14072025-153939/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2025-07-18T14:28:01Zoai:teses.usp.br:tde-14072025-153939Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212025-07-18T14:28:01Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
| dc.title.none.fl_str_mv |
Aplicação de machine learning para análise dos fatores de ocorrências de crimes entre o período 2008 à 2012 nos municípios do Estado de São Paulo Machine learning application for analysis of factors relating to crime occurrences between 2008 and 2012 in municipalities of the State of São Paulo |
| title |
Aplicação de machine learning para análise dos fatores de ocorrências de crimes entre o período 2008 à 2012 nos municípios do Estado de São Paulo |
| spellingShingle |
Aplicação de machine learning para análise dos fatores de ocorrências de crimes entre o período 2008 à 2012 nos municípios do Estado de São Paulo Fernandes, Danilo Douradinho Aprendizado de máquina Artificial intelligence Ciência de dados Crime Criminalidade Data science Inteligência artificial Machine learning Public security Segurança pública |
| title_short |
Aplicação de machine learning para análise dos fatores de ocorrências de crimes entre o período 2008 à 2012 nos municípios do Estado de São Paulo |
| title_full |
Aplicação de machine learning para análise dos fatores de ocorrências de crimes entre o período 2008 à 2012 nos municípios do Estado de São Paulo |
| title_fullStr |
Aplicação de machine learning para análise dos fatores de ocorrências de crimes entre o período 2008 à 2012 nos municípios do Estado de São Paulo |
| title_full_unstemmed |
Aplicação de machine learning para análise dos fatores de ocorrências de crimes entre o período 2008 à 2012 nos municípios do Estado de São Paulo |
| title_sort |
Aplicação de machine learning para análise dos fatores de ocorrências de crimes entre o período 2008 à 2012 nos municípios do Estado de São Paulo |
| author |
Fernandes, Danilo Douradinho |
| author_facet |
Fernandes, Danilo Douradinho |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Montini, Alessandra de Ávila |
| dc.contributor.author.fl_str_mv |
Fernandes, Danilo Douradinho |
| dc.subject.por.fl_str_mv |
Aprendizado de máquina Artificial intelligence Ciência de dados Crime Criminalidade Data science Inteligência artificial Machine learning Public security Segurança pública |
| topic |
Aprendizado de máquina Artificial intelligence Ciência de dados Crime Criminalidade Data science Inteligência artificial Machine learning Public security Segurança pública |
| description |
A criminalidade é um fenômeno multifacetado que afeta diversas esferas sociais e econômicas, tornando-se um desafio significativo para as políticas públicas. O avanço da ciência de dados e das técnicas de Machine Learning (ML) tem permitido novas abordagens para a análise e previsão de padrões criminais. Neste contexto, a presente tese tem como objetivo analisar os fatores socioeconômicos associados às ocorrências criminais nos municípios do Estado de São Paulo entre os anos de 2008 e 2012, utilizando algoritmos de aprendizado de máquina para identificar padrões e desenvolver modelos preditivos. Para a realização do estudo, foram utilizados dados de Boletins de Ocorrência (BOs) disponibilizados pela Secretaria de Segurança Pública do Estado de São Paulo (SSP-SP), combinados com dados socioeconômicos do Índice Paulista de Responsabilidade Social (IPRS), fornecido pela Assembleia Legislativa do Estado de São Paulo (ALESP). A metodologia envolveu a coleta, pré-processamento e integração dessas bases de dados, seguidos pela aplicação do algoritmo Extreme Gradient Boosting (XGBoost), amplamente reconhecido por sua capacidade de lidar com grandes volumes de dados e variáveis complexas. Os dados foram analisados com o objetivo de encontrar padrões ocultos de criminalidade, considerando variáveis como taxa de desemprego, escolaridade, infraestrutura urbana e densidade populacional. O modelo foi avaliado por métricas como RMSE, MAE e R2, permitindo aferir sua precisão e confiabilidade. A análise revelou padrões complexos que modelos tradicionais não capturam plenamente, evidenciando a importância de técnicas avançadas de análise de dados para identificar determinantes críticos. Os resultados indicam que Municípios com maior vulnerabilidade socioeconômica tendem a registrar taxas mais elevadas de criminalidade, evidenciando a necessidade de políticas públicas voltadas para a redução das desigualdades e o aumento da segurança comunitária. A análise preditiva revelou que os modelos de ML podem fornecer suporte valioso para a alocação eficiente de recursos de segurança pública, permitindo a identificação proativa de áreas de risco. Assim, a utilização de técnicas de aprendizado de máquina na análise da criminalidade oferece uma abordagem promissora para a formulação de políticas públicas baseadas em dados concretos. O estudo contribui para a literatura acadêmica ao demonstrar como a integração de dados socioeconômicos e criminais, aliada a modelos preditivos avançados, pode aprimorar a compreensão dos fatores que influenciam a segurança pública. |
| publishDate |
2025 |
| dc.date.none.fl_str_mv |
2025-05-13 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
| format |
doctoralThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/12/12139/tde-14072025-153939/ |
| url |
https://www.teses.usp.br/teses/disponiveis/12/12139/tde-14072025-153939/ |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.relation.none.fl_str_mv |
|
| dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.coverage.none.fl_str_mv |
|
| dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
| instname_str |
Universidade de São Paulo (USP) |
| instacron_str |
USP |
| institution |
USP |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
| collection |
Biblioteca Digital de Teses e Dissertações da USP |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
| repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
| _version_ |
1865492286213718016 |