Efeito Causal Dinâmico no R

Como estimar os efeitos de uma mudança em uma variável Y no presente e no futuro dado uma mudança em X? No post de hoje, iremos utilizar um modelo de defasagens distribuídas para estimar o efeito dinâmico de ondas de frios no preço de suco de laranja na Flórida, usando o R como ferramenta.

Efeitos Causais e séries temporais

Em estudos de efeitos causais, é comum a prática de experimentos controlados, no qual há a separação de grupo de controle e tratamento. É possível utilizar como exemplo para esses casos o uso de fertilizante em plantações: um produtor possui duas plantações do mesmo cultivo e pode escolher aplicar o fertilizante em uma e na outra não aplicar o fertilizante. A partir do resultado desse controle, é possível comparar o efeito do fertilizante, isso o efeito causal de seu uso.

Em séries temporais, principalmente séries econômicas, esse tipo de controle é impossível. Imagine por exemplo a tentativa de estimar o efeito sobre o PIB dado uma mudança do juros de curto prazo de um país. O ideal, obviamente, seria poder ter disposto diversos países iguais e pode aplicar as mudanças da taxa de juros de curto prazo em cada um, com diferentes magnitudes e obter impacto sobre o PIB. Obviamente, não vivemos em nenhuma ficção cientifica para podermos ter diversos universos paralelos, portanto, esse método é impraticável com séries temporais.

Entretanto, em séries temporais, apesar de não termos um clone do mesmo país, temos a possibilidade de obter as mudanças de taxas de juros (ou quaisquer outras variáveis) ao longo do tempo. Com isso, podemos usar o tempo a favor de obter o efeito da mudança de uma variável X sobre uma variável Y.

Laranjas e dias gelados em Orlando

A cidade de Orlando, na Flórida, é um cidade relativamente ensolarada e quente, sendo usada para a plantação de laranjas. Essas laranjas são utilizadas na indústria local para a produção de suco de laranjas concentrados. Entretanto, em épocas diferentes do ano, há a ocorrência de ondas de frio, que levam a uma redução de produção de laranjas na cidade, o que obviamente leva ao encarecimento do preço do suco de laranja.

Vejamos, com o uso do dataset FrozenJuice, disponível no R, o gráfico da variação percentual do preço do suco de laranja mensal e o número de dias gelados no mês, ambos na Flórida.

Para obter o código de importação do dataset, da construção dos gráficos e também dos códigos subsequentes, faça parte do Clube AM, o repositório especial da Análise Macro.

Vemos que os movimentos de crescimento do preço coincidem com o dias gelados, portanto, podemos averiguar por meio de uma Regressão Linear via MQO o efeito contemporâneo ou imediato (o efeito do mesmo ponto de observação no tempo) do dias gelado sobre o preço do suco de laranja.

Obs: O erro padrão aqui utilizado é o HAC, heteroskedasticity- and autocorrelation-consistent. Isso devido que a regressão que temos aqui possui o termo de erro e os regressores são autocorrelacionados.

Além do efeito contemporâneo, devemos lembrar que os dados são coletados ao longo do tempo, portanto, é possível estimar a trajetória temporal do efeito sobre o resultado de interesse do tratamento. As vezes há dias gelados, e as vezes não, e por vezes, o efeito dos dias gelados, possuem efeitos residuais nos dias seguintes. Isso corresponde em estimar o efeito não somente contemporâneo, mas também dinâmico.

Efeitos dinâmicos e modelos de defasagens distribuídas

O modelo econométrico para o efeito dinâmico causal necessita incorporar as defasagens do valor de X. Portanto, podemos expressar como:

 $Y_t = \beta_0 + \beta_{1}X_t + \beta_{2}X_t  + \dots + \beta_{r+1}X_{t-r} + u_t $

onde $u_t$ é um termo que inclui o erro de mensuração de $Y_t$ e o efeito dos valores das variáveis omitidas na equação. A equação acima é chamada de modelo de defasagens distribuídas.

Ao aplicar nos dados de FrozenJuice, com 6 defasagens, possuímos o seguinte resultado:

Dois tipos de Exogeneidade

Um variável exógena é aquela em que a variável usada no modelo não é correlacionada com o termo de erro da regressão, enquanto o termo endógeno, representa a variável que é correlacionada com o termo de erro.

Isso representa que a variável endógena refere-se ao que é determinado dentro do modelo, enquanto exógeno é determinado fora do modelo.

Se estamos estimando usando um modelo de defasagem distribuída, o X da regressão não pode ser correlacionado com o termo de erro, portanto, é necessário o uso de uma variável exógena.

Entretanto, há dois tipos de exogeneidade em séries temporais:

  • A que refere-se aos valores do passado e do presente (exogeneidade), em que:
    •   $E(u_{i}|X_{t}, X_{t-1}, X_{t-2}, \dots) = 0$
  • A que refere-se aos valores do passado, do presente e do futuro (exogeneidade estrita), em que:
    •  $E(u_{i}|X_{t+2}, X+{t+1}, X_{t}, X_{t-1}, X_{t-2}, \dots) = 0$

Estimação dos efeitos causais dinâmicos com regressores exógenos

Se X é exógeno, portanto, o seu efeito causal sobre Y pode ser estimado via MQO com base na equação de regressão defasada distribuída.  Para certificar que a inferência estatística seja valida, é necessário tomar algumas suposições.

Suposições

Ao criar o modelo de defasagem distribuída, devemos levar em conta algumas condições:

  1. X é exógeno, isto é,   $E(u_{i}|X_{t}, X_{t-1}, X_{t-2}, \dots) = 0$
  2.  (a)  A variáveis aleatórias Y e X possuem uma distribuição estacionária; (b) ($Y_t$, $X_t$) e ($Y_{t-j}, $X_{t-j}), tornam-se independentes a medida que j aumenta;
  3.  Valores extremos na amostra não são desejados;
  4. Não existe multicolineariedade perfeita.

Multiplicadores dinâmicos e Multiplicadores Dinâmicos acumulados.

Outro nome dado para o efeito causal dinâmico é o multiplicador dinâmico. O multiplicador dinâmico acumulado é o efeito causal acumulado, até uma determinada defasagem, portanto, representa o efeito acumulado de uma mudança de X em Y.

Multiplicador Dinâmico

O efeito de uma unidade de mudança de X em Y depois de h períodos, em que $\beta_{h_1}$, é chamada de multiplicador dinâmico em h períodos. Esse termo refere-se aos coeficientes estimados do efeito de X em Y na equação de regressão.

Vejamos o cálculo do efeito de dias congelantes sobre a variação do preço do suco em Orlando.

Multiplicador Dinâmico Acumulado

O Multiplicador Dinâmico Acumulado em períodos é o efeito acumulado da mudança de X em Y em h períodos. Em outras palavras, isso o Multiplicador Dinâmico acumulado é a soma do Multiplicador Dinâmico, isso é, a soma dos coeficientes das defasagens. A soma de todos os coeficiente $\beta_1 + \beta_1 + \dots + \beta_r+1$, é o efeitos de longo prazo acumulado de Y dado uma mudança de X.

________________________________________________

Quer se aprofundar no assunto?

Alunos da trilha de Ciência de dados para Economia e Finanças podem aprender a como construir projetos que envolvem dados reais usando modelos econométricos e de Machine Learning com o R.

Referências

Stock, J.H. e Watson, M.W. (2007). Introduction to Econometrics, 2nd ed. Boston: Addison Wesley.

Hanck, C.; Arnold, M., Gerber, A.; Schmelzer, M.. Introduction to Econometrics with R. Acessado em: "https://www.econometrics-with-r.org/index.html".

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Estimando a volatilidade da taxa de câmbio

O que é Volatilidade? Como podemos calcular essa métrica? Este artigo apresenta uma breve introdução à volatilidade, descreve como podemos calcular a volatilidade utilizando Modelos de Volatilidade Condicional e demonstra a aplicação prática dessa abordagem para estimar a volatilidade da taxa de câmbio BRL/USD por meio da linguagem de programação Python.

Como analisar o Núcleo de Inflação no Brasil usando Python?

O Python se destaca como uma ferramenta robusta para análise de dados, permitindo a aplicação de uma ampla gama de técnicas em dados econômico-financeiros. Neste exercício, destacamos como a linguagem oferece uma facilidade muito grande na coleta de dados dos núcleos do IPCA diretamente do site do Banco Central, na manipulação eficiente desses dados e na construção de gráficos que facilitam a compreensão dos indicadores.

Propensity Score com Múltiplas Variáveis no R

O escore de propensão é provavelmente a maneira mais comum de agregar múltiplas variáveis de correspondência em um único valor que pode ser correspondido, ou seja, muito útil para a realização de pareamento.

O escore de propensão é a probabilidade estimada de que uma determinada observação teria sido tratada. A correspondência de escore de propensão muitas vezes significa selecionar um conjunto de observações de controle correspondidas com valores semelhantes do escore de propensão.

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.