Efeito Causal Dinâmico no R

Como estimar os efeitos de uma mudança em uma variável Y no presente e no futuro dado uma mudança em X? No post de hoje, iremos utilizar um modelo de defasagens distribuídas para estimar o efeito dinâmico de ondas de frios no preço de suco de laranja na Flórida, usando o R como ferramenta.

Efeitos Causais e séries temporais

Em estudos de efeitos causais, é comum a prática de experimentos controlados, no qual há a separação de grupo de controle e tratamento. É possível utilizar como exemplo para esses casos o uso de fertilizante em plantações: um produtor possui duas plantações do mesmo cultivo e pode escolher aplicar o fertilizante em uma e na outra não aplicar o fertilizante. A partir do resultado desse controle, é possível comparar o efeito do fertilizante, isso o efeito causal de seu uso.

Em séries temporais, principalmente séries econômicas, esse tipo de controle é impossível. Imagine por exemplo a tentativa de estimar o efeito sobre o PIB dado uma mudança do juros de curto prazo de um país. O ideal, obviamente, seria poder ter disposto diversos países iguais e pode aplicar as mudanças da taxa de juros de curto prazo em cada um, com diferentes magnitudes e obter impacto sobre o PIB. Obviamente, não vivemos em nenhuma ficção cientifica para podermos ter diversos universos paralelos, portanto, esse método é impraticável com séries temporais.

Entretanto, em séries temporais, apesar de não termos um clone do mesmo país, temos a possibilidade de obter as mudanças de taxas de juros (ou quaisquer outras variáveis) ao longo do tempo. Com isso, podemos usar o tempo a favor de obter o efeito da mudança de uma variável X sobre uma variável Y.

Laranjas e dias gelados em Orlando

A cidade de Orlando, na Flórida, é um cidade relativamente ensolarada e quente, sendo usada para a plantação de laranjas. Essas laranjas são utilizadas na indústria local para a produção de suco de laranjas concentrados. Entretanto, em épocas diferentes do ano, há a ocorrência de ondas de frio, que levam a uma redução de produção de laranjas na cidade, o que obviamente leva ao encarecimento do preço do suco de laranja.

Vejamos, com o uso do dataset FrozenJuice, disponível no R, o gráfico da variação percentual do preço do suco de laranja mensal e o número de dias gelados no mês, ambos na Flórida.

Para obter o código de importação do dataset, da construção dos gráficos e também dos códigos subsequentes, faça parte do Clube AM, o repositório especial da Análise Macro.

Vemos que os movimentos de crescimento do preço coincidem com o dias gelados, portanto, podemos averiguar por meio de uma Regressão Linear via MQO o efeito contemporâneo ou imediato (o efeito do mesmo ponto de observação no tempo) do dias gelado sobre o preço do suco de laranja.

Obs: O erro padrão aqui utilizado é o HAC, heteroskedasticity- and autocorrelation-consistent. Isso devido que a regressão que temos aqui possui o termo de erro e os regressores são autocorrelacionados.

Além do efeito contemporâneo, devemos lembrar que os dados são coletados ao longo do tempo, portanto, é possível estimar a trajetória temporal do efeito sobre o resultado de interesse do tratamento. As vezes há dias gelados, e as vezes não, e por vezes, o efeito dos dias gelados, possuem efeitos residuais nos dias seguintes. Isso corresponde em estimar o efeito não somente contemporâneo, mas também dinâmico.

Efeitos dinâmicos e modelos de defasagens distribuídas

O modelo econométrico para o efeito dinâmico causal necessita incorporar as defasagens do valor de X. Portanto, podemos expressar como:

 $Y_t = \beta_0 + \beta_{1}X_t + \beta_{2}X_t  + \dots + \beta_{r+1}X_{t-r} + u_t $

onde $u_t$ é um termo que inclui o erro de mensuração de $Y_t$ e o efeito dos valores das variáveis omitidas na equação. A equação acima é chamada de modelo de defasagens distribuídas.

Ao aplicar nos dados de FrozenJuice, com 6 defasagens, possuímos o seguinte resultado:

Dois tipos de Exogeneidade

Um variável exógena é aquela em que a variável usada no modelo não é correlacionada com o termo de erro da regressão, enquanto o termo endógeno, representa a variável que é correlacionada com o termo de erro.

Isso representa que a variável endógena refere-se ao que é determinado dentro do modelo, enquanto exógeno é determinado fora do modelo.

Se estamos estimando usando um modelo de defasagem distribuída, o X da regressão não pode ser correlacionado com o termo de erro, portanto, é necessário o uso de uma variável exógena.

Entretanto, há dois tipos de exogeneidade em séries temporais:

  • A que refere-se aos valores do passado e do presente (exogeneidade), em que:
    •   $E(u_{i}|X_{t}, X_{t-1}, X_{t-2}, \dots) = 0$
  • A que refere-se aos valores do passado, do presente e do futuro (exogeneidade estrita), em que:
    •  $E(u_{i}|X_{t+2}, X+{t+1}, X_{t}, X_{t-1}, X_{t-2}, \dots) = 0$

Estimação dos efeitos causais dinâmicos com regressores exógenos

Se X é exógeno, portanto, o seu efeito causal sobre Y pode ser estimado via MQO com base na equação de regressão defasada distribuída.  Para certificar que a inferência estatística seja valida, é necessário tomar algumas suposições.

Suposições

Ao criar o modelo de defasagem distribuída, devemos levar em conta algumas condições:

  1. X é exógeno, isto é,   $E(u_{i}|X_{t}, X_{t-1}, X_{t-2}, \dots) = 0$
  2.  (a)  A variáveis aleatórias Y e X possuem uma distribuição estacionária; (b) ($Y_t$, $X_t$) e ($Y_{t-j}, $X_{t-j}), tornam-se independentes a medida que j aumenta;
  3.  Valores extremos na amostra não são desejados;
  4. Não existe multicolineariedade perfeita.

Multiplicadores dinâmicos e Multiplicadores Dinâmicos acumulados.

Outro nome dado para o efeito causal dinâmico é o multiplicador dinâmico. O multiplicador dinâmico acumulado é o efeito causal acumulado, até uma determinada defasagem, portanto, representa o efeito acumulado de uma mudança de X em Y.

Multiplicador Dinâmico

O efeito de uma unidade de mudança de X em Y depois de h períodos, em que $\beta_{h_1}$, é chamada de multiplicador dinâmico em h períodos. Esse termo refere-se aos coeficientes estimados do efeito de X em Y na equação de regressão.

Vejamos o cálculo do efeito de dias congelantes sobre a variação do preço do suco em Orlando.

Multiplicador Dinâmico Acumulado

O Multiplicador Dinâmico Acumulado em períodos é o efeito acumulado da mudança de X em Y em h períodos. Em outras palavras, isso o Multiplicador Dinâmico acumulado é a soma do Multiplicador Dinâmico, isso é, a soma dos coeficientes das defasagens. A soma de todos os coeficiente $\beta_1 + \beta_1 + \dots + \beta_r+1$, é o efeitos de longo prazo acumulado de Y dado uma mudança de X.

________________________________________________

Quer se aprofundar no assunto?

Alunos da trilha de Ciência de dados para Economia e Finanças podem aprender a como construir projetos que envolvem dados reais usando modelos econométricos e de Machine Learning com o R.

Referências

Stock, J.H. e Watson, M.W. (2007). Introduction to Econometrics, 2nd ed. Boston: Addison Wesley.

Hanck, C.; Arnold, M., Gerber, A.; Schmelzer, M.. Introduction to Econometrics with R. Acessado em: "https://www.econometrics-with-r.org/index.html".

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Como treinar e selecionar os melhores modelos de previsão no Python?

Em previsão, há uma infinidade de modelos que podem ser usados. O processo de escolha do(s) modelo(s) deve ser empírico-científico, usando métodos que visem avaliar a generalização dos algoritmos para dados novos. Neste artigo, mostramos como implementar a metodologia de validação cruzada com algoritmos de machine learning no Python, exemplificando para a previsão do IPCA.

Como selecionar variáveis para modelos de previsão no Python?

Em oposição à crença popular, grande parte dos modelos de machine learning não produzem previsões magicamente. É papel do cientista de dados executar uma boa engenharia de variáveis para não cair no clássico problema de “garbage in, garbage out” (GIGO) em aprendizado de máquina. Neste sentido, aprender a fazer uma boa seleção de variáveis é fundamental e neste artigo exploramos algumas possibilidades práticas usando o Python.

Resultado IPCA-15 - Novembro/2024

A Análise Macro apresenta os resultados do IPCA-15 de Novembro de 2024, com gráficos elaborados em Python para coleta, tratamento e visualização de dados. Todo o conteúdo, disponível exclusivamente no Clube AM, foi desenvolvido com base nos métodos ensinados nos cursos da Análise Macro, permitindo aos assinantes acesso aos códigos e replicação das análises.

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.