Violência no Rio: a economia importa?

No mês de dezembro, iremos lançar uma nova versão do Clube do Código, que se chamará Clube AM. O projeto de compartilhamento de códigos da Análise Macro vai avançar para uma versão 2.0, que incluirá a existência de um grupo fechado no Whatsapp, de modo a reunir os membros do Novo Clube, compartilhando com eles todos os códigos dos nossos posts feitos aqui no Blog, exercícios de análise de dados de maior fôlego, bem como tirar dúvidas sobre todos os nossos projetos, exercícios e nossos Cursos e Formações.

Para ilustrar o que vamos compartilhar lá nesse novo ambiente, estou publicando nesse espaço alguns dos nossos exercícios de análise de dados. Esses exercícios fazem parte do repositório atual do Clube do Código, que deixará de existir. Além de todos os exercícios existentes no Clube do Código, vamos adicionar novos exercícios e códigos toda semana, mantendo os membros atualizados sobre o que há de mais avançado em análise de dados, econometria, machine learning, forecasting e R.

Hoje, graças à excelente base de dados do Instituto de Segurança Pública (ISP), vamos falar da relação entre violência e desemprego. Quando se trata de violência carioca, uma pergunta imediata é quais seriam os fatores relevantes para explicar os diversos aspectos da criminalidade no Rio de Janeiro. Pensando nisso, resolvemos fazer um exercício empírico no âmbito do Clube do Código.

Becker (1968) define a decisão de cometer um crime como um processo racional, onde o potencial criminoso calcularia custos e benefícios para então decidir se vai em frente ou não. A partir desse trabalho seminal, uma extensa literatura teórica e empírica tem sido desenvolvida, relacionando diversos fatores econômicos que impactam nos custos e benefícios da decisão de cometer um crime.

O script, então, começa com alguns pacotes.


library(readr)
library(lubridate)
library(magrittr)
library(dplyr)
library(ggplot2)
library(scales)
library(sidrar)
library(corrplot)
library(forecast)
library(dplyr)
library(dynlm)
library(lmtest)
library(CADFtest)
library(gridExtra)
library(stargazer)

Na sequência, nós importamos os dados que precisaremos. Vamos basicamente importar uma planilha disponível no ISP que contém diversas séries temporais envolvendo crimes no Rio de Janeiro. Além disso, vamos importar a taxa de desemprego, disponível no site do SIDRA/IBGE.


url = 'http://www.ispdados.rj.gov.br/Arquivos/DOMensalEstadoDesde1991.csv'
download.file(url, destfile='basededados.csv', mode='wb')
data = read_csv2('basededados.csv') %>%
mutate(date = make_datetime(ano, mes))

desemprego = ts(get_sidra(api='/t/6381/n1/all/v/4099/p/all/d/v4099%201')$Valor,
start=c(2012,03), freq=12)

Uma vez que pegamos os dados que precisamos, nós podemos fazer algum tratamento dos mesmos.


data_ts = ts(data[,-c(1,2,57)], start=c(1991,01), freq=12)
data_ts = ts.intersect(data_ts, desemprego)
colnames(data_ts) = c(colnames(data[,-c(1,2,57)]), 'desemprego')

Com os dados tratados, podemos fazer um gráfico de correlação entre a série de desemprego e as séries de total de roubos e homicídios dolosos.

Os gráficos acima relacionam o total de roubos e os homicídios dolosos no Rio de Janeiro à taxa de desemprego medida pela PNAD Contínua. O desemprego funciona como uma proxy para a situação econômica do país. Como é possível ver, há uma diferença importante na correlação entre os dois tipos de crimes. Enquanto os homicídios são apenas levemente correlacionados com o desemprego, há uma correlação mais forte entre esta e o total de roubos.

Com base nessas variáveis, nós podemos criar um modelo de regressão linear que relaciona as variáveis de crime à taxa de desemprego. A tabela abaixo traz, por seu turno, os resultados das regressões do total de roubos e dos homicídios dolosos contra a taxa de desemprego. De modo a prevenir regressões espúrias, no exercício completo disponível no repositório do Clube do Código, nós testamos as especificações usando o teste CADF, de onde conseguimos rejeitar a hipótese nula de ausência de cointegração. Os modelos, contudo, são bastante distintos em termos de ajuste. Enquanto o desemprego (e mais uma dummy) explicam parte importante da variação do total de roubos, ele explica muito pouco da variação dos homicídios dolosos. Esses resultados, a propósito, estão em linha com Levitt (1997), que mostrou que a taxa de desemprego afeta os crimes contra a propriedade, mas não os crimes violentos.

Dependent variable:
total_roubos hom_doloso
(1) (2)
desemprego 1,116.398*** 1.425
(125.847) (2.420)
dummy -8,374.023**
(3,193.210)
Constant 3,351.565** 368.084***
(1,294.057) (24.961)
Observations 102 102
R2 0.450 0.003
Adjusted R2 0.439 -0.007
Residual Std. Error 3,151.768 (df = 99) 61.098 (df = 100)
F Statistic 40.484*** (df = 2; 99) 0.347 (df = 1; 100)
Note: *p<0.1; **p<0.05; ***p<0.01

 

__________________

(*) Cadastre-se aqui na nossa Lista VIP para receber um super desconto na abertura das Turmas 2021.

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Como usar Modelos de Linguagem no R com o pacote {elmer}

Na análise de dados contemporânea, o uso de Modelos de Linguagem (LLMs) vem se consolidando como uma ferramenta poderosa para automatizar e aprimorar tarefas analíticas. Ao integrarmos LLMs a pacotes como o ellmer, podemos ampliar nossas capacidades de extração, interpretação e automação de dados no ambiente R. Neste post, exploramos o papel desses modelos e detalhamos como o ellmer opera dentro do universo da linguagem de programação R.

Introdução ao AutoGen: Agentes Inteligentes na Análise Financeira

O AutoGen é um framework da Microsoft que permite criar agentes de IA colaborativos. Na área financeira, pode automatizar a coleta de dados, cálculos de indicadores e geração de relatórios. Este artigo apresenta os conceitos básicos e um exemplo aplicado a ações de empresas.

Como usar LangGraph e LLMs para prever a inflação no Brasil

Este post apresenta um estudo de caso sobre como utilizar o LangGraph e modelos de linguagem para estruturar um sistema multiagente voltado à previsão do IPCA. O exercício cria um sistema que utiliza-se de personas analíticas que trabalham em paralelo, permitindo validar previsões, calcular métricas de erro e consolidar relatórios automatizados. A abordagem demonstra como fluxos multiagentes podem apoiar a análise econômica, oferecendo múltiplas perspectivas e maior consistência nos resultados.

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.