Efeito Causal Dinâmico no R

Como estimar os efeitos de uma mudança em uma variável Y no presente e no futuro dado uma mudança em X? No post de hoje, iremos utilizar um modelo de defasagens distribuídas para estimar o efeito dinâmico de ondas de frios no preço de suco de laranja na Flórida, usando o R como ferramenta.

Efeitos Causais e séries temporais

Em estudos de efeitos causais, é comum a prática de experimentos controlados, no qual há a separação de grupo de controle e tratamento. É possível utilizar como exemplo para esses casos o uso de fertilizante em plantações: um produtor possui duas plantações do mesmo cultivo e pode escolher aplicar o fertilizante em uma e na outra não aplicar o fertilizante. A partir do resultado desse controle, é possível comparar o efeito do fertilizante, isso o efeito causal de seu uso.

Em séries temporais, principalmente séries econômicas, esse tipo de controle é impossível. Imagine por exemplo a tentativa de estimar o efeito sobre o PIB dado uma mudança do juros de curto prazo de um país. O ideal, obviamente, seria poder ter disposto diversos países iguais e pode aplicar as mudanças da taxa de juros de curto prazo em cada um, com diferentes magnitudes e obter impacto sobre o PIB. Obviamente, não vivemos em nenhuma ficção cientifica para podermos ter diversos universos paralelos, portanto, esse método é impraticável com séries temporais.

Entretanto, em séries temporais, apesar de não termos um clone do mesmo país, temos a possibilidade de obter as mudanças de taxas de juros (ou quaisquer outras variáveis) ao longo do tempo. Com isso, podemos usar o tempo a favor de obter o efeito da mudança de uma variável X sobre uma variável Y.

Laranjas e dias gelados em Orlando

A cidade de Orlando, na Flórida, é um cidade relativamente ensolarada e quente, sendo usada para a plantação de laranjas. Essas laranjas são utilizadas na indústria local para a produção de suco de laranjas concentrados. Entretanto, em épocas diferentes do ano, há a ocorrência de ondas de frio, que levam a uma redução de produção de laranjas na cidade, o que obviamente leva ao encarecimento do preço do suco de laranja.

Vejamos, com o uso do dataset FrozenJuice, disponível no R, o gráfico da variação percentual do preço do suco de laranja mensal e o número de dias gelados no mês, ambos na Flórida.

Para obter o código de importação do dataset, da construção dos gráficos e também dos códigos subsequentes, faça parte do Clube AM, o repositório especial da Análise Macro.

Vemos que os movimentos de crescimento do preço coincidem com o dias gelados, portanto, podemos averiguar por meio de uma Regressão Linear via MQO o efeito contemporâneo ou imediato (o efeito do mesmo ponto de observação no tempo) do dias gelado sobre o preço do suco de laranja.

<br />

Obs: O erro padrão aqui utilizado é o HAC, heteroskedasticity- and autocorrelation-consistent. Isso devido que a regressão que temos aqui possui o termo de erro e os regressores são autocorrelacionados.

Além do efeito contemporâneo, devemos lembrar que os dados são coletados ao longo do tempo, portanto, é possível estimar a trajetória temporal do efeito sobre o resultado de interesse do tratamento. As vezes há dias gelados, e as vezes não, e por vezes, o efeito dos dias gelados, possuem efeitos residuais nos dias seguintes. Isso corresponde em estimar o efeito não somente contemporâneo, mas também dinâmico.

Efeitos dinâmicos e modelos de defasagens distribuídas

O modelo econométrico para o efeito dinâmico causal necessita incorporar as defasagens do valor de X. Portanto, podemos expressar como:

$Y_t = \beta_0 + \beta_{1}X_t + \beta_{2}X_t + \dots + \beta_{r+1}X_{t-r} + u_t$

onde $u_t$ é um termo que inclui o erro de mensuração de $Y_t$ e o efeito dos valores das variáveis omitidas na equação. A equação acima é chamada de modelo de defasagens distribuídas.

Ao aplicar nos dados de FrozenJuice, com 6 defasagens, possuímos o seguinte resultado:

<br />

Dois tipos de Exogeneidade

Um variável exógena é aquela em que a variável usada no modelo não é correlacionada com o termo de erro da regressão, enquanto o termo endógeno, representa a variável que é correlacionada com o termo de erro.

Isso representa que a variável endógena refere-se ao que é determinado dentro do modelo, enquanto exógeno é determinado fora do modelo.

Se estamos estimando usando um modelo de defasagem distribuída, o X da regressão não pode ser correlacionado com o termo de erro, portanto, é necessário o uso de uma variável exógena.

Entretanto, há dois tipos de exogeneidade em séries temporais:

A que refere-se aos valores do passado e do presente (exogeneidade), em que:
- $E(u_{i}|X_{t}, X_{t-1}, X_{t-2}, \dots) = 0$

A que refere-se aos valores do passado, do presente e do futuro (exogeneidade estrita), em que:
- $E(u_{i}|X_{t+2}, X+{t+1}, X_{t}, X_{t-1}, X_{t-2}, \dots) = 0$

Estimação dos efeitos causais dinâmicos com regressores exógenos

Se X é exógeno, portanto, o seu efeito causal sobre Y pode ser estimado via MQO com base na equação de regressão defasada distribuída. Para certificar que a inferência estatística seja valida, é necessário tomar algumas suposições.

Suposições

Ao criar o modelo de defasagem distribuída, devemos levar em conta algumas condições:

X é exógeno, isto é, $E(u_{i}|X_{t}, X_{t-1}, X_{t-2}, \dots) = 0$
(a) A variáveis aleatórias Y e X possuem uma distribuição estacionária; (b) $($Y_t$, $X_t$)$ e $($Y_{t-j}, $X_{t-j})$ , tornam-se independentes a medida que j aumenta;
Valores extremos na amostra não são desejados;
Não existe multicolineariedade perfeita.

Multiplicadores dinâmicos e Multiplicadores Dinâmicos acumulados.

Outro nome dado para o efeito causal dinâmico é o multiplicador dinâmico. O multiplicador dinâmico acumulado é o efeito causal acumulado, até uma determinada defasagem, portanto, representa o efeito acumulado de uma mudança de X em Y.

Multiplicador Dinâmico

O efeito de uma unidade de mudança de X em Y depois de h períodos, em que $\beta_{h_1}$ , é chamada de multiplicador dinâmico em h períodos. Esse termo refere-se aos coeficientes estimados do efeito de X em Y na equação de regressão.

Vejamos o cálculo do efeito de dias congelantes sobre a variação do preço do suco em Orlando.

Multiplicador Dinâmico Acumulado

O Multiplicador Dinâmico Acumulado em períodos é o efeito acumulado da mudança de X em Y em h períodos. Em outras palavras, isso o Multiplicador Dinâmico acumulado é a soma do Multiplicador Dinâmico, isso é, a soma dos coeficientes das defasagens. A soma de todos os coeficiente $\beta_1 + \beta_1 + \dots + \beta_r+1$ , é o efeitos de longo prazo acumulado de Y dado uma mudança de X.

________________________________________________

Quer se aprofundar no assunto?

Alunos da trilha de Ciência de dados para Economia e Finanças podem aprender a como construir projetos que envolvem dados reais usando modelos econométricos e de Machine Learning com o R.

Referências

Stock, J.H. e Watson, M.W. (2007). Introduction to Econometrics, 2nd ed. Boston: Addison Wesley.

Hanck, C.; Arnold, M., Gerber, A.; Schmelzer, M.. Introduction to Econometrics with R. Acessado em: "https://www.econometrics-with-r.org/index.html".

Compartilhe esse artigo

Comente o que achou desse artigo

Boletim AM

Encontre o seu conteúdo

Categorias

Artigos mais acessados

O que é um Vector Database e como criar um com LangChain

Automatizando a Construção de Códigos em Python com LangGraph

Análise de Dados com REPL Tool e LLM usando LangGraph

Frameworks para criar AI Agents

Construindo RAG para Análise do COPOM com SmolAgents

Como criar um Agente de IA?

Outros artigos relacionados

O que é um Vector Database e como criar um com LangChain

Nesta postagem, mostramos como construir um pipeline simples de RAG (Retrieval-Augmented Generation) usando o LangChain, o modelo Gemini 2.0 Flash e o Vector Database Chroma. Utilizamos como exemplo o Relatório de Inflação de junho de 2025 do Banco Central do Brasil. O fluxo envolve o download e leitura do PDF, divisão do texto com RecursiveCharacterTextSplitter, geração de embeddings com Gemini, armazenamento vetorial com Chroma e busca semântica para responder perguntas com base no conteúdo do relatório. É uma aplicação prática e didática para economistas que desejam integrar IA ao seu fluxo de análise.

Automatizando a Construção de Códigos em Python com LangGraph

Neste post, mostramos como construir um agente de código em Python utilizando LangGraph, LangChain e Gemini. A proposta é construir um protótipo para automatizar o ciclo completo de geração, execução e correção de código com o uso de LLMs, organizando o processo em um grafo de estados.

Análise de Dados com REPL Tool e LLM usando LangGraph

Neste post, vamos mostrar como você pode criar um agente que interpreta e executa código Python em tempo real, utilizando o REPL-Tool e um LLM da família Gemini. Começamos com um exemplo genérico e, em seguida, aplicamos a mesma estrutura à análise econômica de uma série histórica do IPCA.

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!