Qual o impacto do gasto de segurança no crime?

Diversos métodos econométricos têm como principal finalidade melhorar o processo de investigar o efeito de uma variável sobre a outra, e um importante método encontra-se no uso de Variáveis Instrumentais na análise de regressão linear. Mas como podemos utilizar essa ferramenta para auxiliar no estudo da avaliação de impacto?

Neste post, oferecemos uma breve introdução a esse importante método da área de inferência causal, acompanhado de um estudo de caso para uma compreensão mais aprofundada de sua aplicação. Os resultados foram obtidos por meio da implementação em Python, como parte integrante do nosso curso sobre Avaliação de Políticas Públicas utilizando esta linguagem de programação.

Variáveis Instrumentais

As variáveis instrumentais (VI), é um método presente no arcabouço econométrico e estatístico, que oferece uma abordagem para lidar com problemas de endogeneidade e viés de variáveis omitidas em modelos de regressão. Quando variáveis independentes estão correlacionadas com o erro de um modelo de regressão, os estimadores de mínimos quadrados ordinários (MQO) se tornam enviesados e inconsistentes, invalidando as inferências estatísticas.

As variáveis instrumentais ajudam a superar esses desafios introduzindo variáveis adicionais, chamadas instrumentos, que estão correlacionadas com as variáveis independentes problemáticas, mas não com o erro do modelo. Essencialmente, os instrumentos servem como proxies confiáveis para as variáveis endógenas, permitindo a obtenção de estimativas consistentes dos parâmetros do modelo.

Uma forma comum de introduzir VI é através do método dos mínimos quadrados em dois estágios (MQ2E ou 2SLS). Neste método, no primeiro estágio, as VI são utilizadas para estimar a variável endógena. No segundo estágio, a variável endógena estimada é então usada como variável independente no modelo de interesse. Isso ajuda a resolver o problema de endogeneidade, permitindo estimativas consistentes dos parâmetros de interesse.

Equação de cálculo do método dos mínimos quadrados em dois estágios:

Seja o modelo de regressão original:

    \[Y = X\beta + u\]

Onde:
- Y é a variável dependente.
- X é a matriz de variáveis independentes, incluindo tanto variáveis endógenas quanto exógenas.
- \beta é o vetor de parâmetros.
- u é o termo de erro aleatório.

Suponha que X contenha variáveis endógenas que são correlacionadas com u. Para lidar com isso, vamos introduzir variáveis instrumentais Z, onde Z é um conjunto de variáveis que são correlacionadas com as variáveis endógenas, mas não com o erro u.

No primeiro estágio do MQ2E, estimamos a variável endógena X utilizando as variáveis instrumentais Z. Isso nos dá a variável instrumental estimada \hat{X}.

No segundo estágio, substituímos X por \hat{X} na equação original e estimamos o modelo final usando a equação:

    \[Y = \hat{X}\beta + \varepsilon\]

Onde \varepsilon é o novo termo de erro, que agora deve estar não correlacionado com \hat{X}. Isso nos permite estimar os parâmetros de interesse de forma consistente, mesmo em presença de endogeneidade.

Qual o impacto do gasto de segurança no crime?

Quer saber como essa análise foi construída? Seja aluno do nosso curso Avaliação de Políticas Públicas usando Python, e tenha acesso às aulas teóricas e práticas, com o código disponibilizado em Python.

Agora, digamos que queremos estimar o impacto do gasto em segurança pública no crime.Aqui também há um problema de endogeneidade, dessa vez causado pela simultaneidade, dado que embora a segurança pública possa afetar o crime, os governos locais podem reagir ao crime aumentando o gasto na área. Assim, se fossemos estimar o efeito, teríamos um importante viés.

Alguns instrumentos foram propostos ao longo do tempo para esse tipo de problema, sendo o mais famoso o uso de ciclos eleitorais (Levitt 1995).

A lógica pra utilização dessa variável é que gestores costumam aumentar a contratação de profissionais de segurança em períodos de véspera de eleição. Uma possível crítica a esse instrumento é que outras despesas também crescem nessa época e podem afetar o nível de crimes, como em educação, empregos e gastos sociais.

Para replicarmos esse problema, iremos estimar o efeito dos gastos em segurança pública (Finbra) nos dados de furtos de veículo (SSP) nos municípios de São Paulo de 2013 a 2019.

Para evitar complicações adicionais de estimar um modelo de painel, pré-selecionamos aleatoriamente um ano para cada município. A variável de furtos está disposta em número a cada 100.000 habitantes. Já a despesa com segurança está medida per capita. A nossa variável de ciclo eleitoral é uma variável binária que retorna 1, em caso de ano eleitoral ou pré-eleitoral e 0, caso contrário.

ano id_municipio furto_pc gasto_pc eleicao
0 2018 3500105 34.193879 9.898786 0
1 2018 3500303 28.417972 45.835687 0
2 2019 3500501 161.298995 5.796817 1
3 2019 3500600 88.757396 283.155917 1
4 2018 3500709 92.190889 21.157348 0

Pelo mapa e gráfico de dispersão, é possível ver que há uma correlação positiva entre as duas variáveis, apesar de pequena.

Assim, estimamos a regressão ordinária e por método de dois estágios para compararmos os resultados dos parâmetros.

Veja que na estimativa por OLS, por causa do viés de endogeneidade, o resultado indica o contrário do que se espera: gastos em segurança causam mais furtos.

Quando rodamos pelo método de 2SLS, o efeito inverte de sinal, apesar de não ser significante estatisticamente. Muito provavelmente a inclusão de variáveis de controle ou o uso de um instrumento mais adequado fariam o parâmetro ser negativo e significante.

===============================================
                              OLS          2SLS
-----------------------------------------------
Dep. Variable            furto_pc      furto_pc
Estimator                     OLS       IV-2SLS
No. Observations              313           313
Cov. Est.                  robust        robust
R-squared                  0.0549       -3.0659
Adj. R-squared             0.0519       -3.0790
F-statistic                14.906        1.6454
P-value (F-stat)           0.0001        0.1996
==================     ==========   ===========
Intercept                  93.162        247.66
                         (14.334)      (2.3783)
gasto_pc                   0.3664       -2.3950
                         (3.8608)     (-1.2827)
==================== ============ =============
Instruments                             eleicao
-----------------------------------------------

T-stats reported in parentheses

REFERÊNCIAS

Levitt, Steven D. 1995. «Using electoral cycles in police hiring to estimate the effect of policeon crime». National Bureau of Economic Research.

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Criando um Dashboard de análise de Ações no Python

Um Dashboard é um painel de controle que consolida uma variedade de informações sobre um determinado objeto de estudo em um ou mais painéis. Ele simplifica significativamente o processo de análise de dados, oferecendo uma visão global e fácil de entender. Uma maneira simples de construir um Dashboard para acompanhar uma ação específica é utilizando duas ferramentas: Quarto e Python. Neste post, mostramos o resultado da criação de um Dashboard de Ação.

Analisando séries temporais no Python e esquecendo de vez o Excel

Séries temporais representam uma disciplina extremamente importante em diversas áreas, principalmente na economia e na ciência de dados. Mas, afinal, como lidar com esses dados que se apresentam ao longo do tempo? Neste exercício, demonstraremos como compreender uma série temporal e como o Python se destaca como uma das melhores ferramentas para analisar esse tipo de dado.

Cálculo do Retorno Econômico de uma Política Pública

Como podemos traduzir os efeitos de uma política pública para valores monetários? Essa é uma tarefa árdua que requer algumas premissas, entretanto, com métodos bem definidos, é possível obter estimativas precisas dos ganhos e os gastos de uma política pública.

Neste exercício, demonstramos tal método usando a política hipotética "Mãe Paranense”, um conjunto de ações que visam reduzir a mortalidade materna e infantil no estado. Usamos a linguagem R como ferramenta para analisar os dados.

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.