O `EWZ` é um fundo de investimento que replica um índice de ações brasileiras negociadas em Nova York, chamado `iShares MSCI Brazil Capped`, e tenta acompanhar o Ibovespa no Brasil. O `EWZ` é um `Exchange Traded Funds` (ETF) ou simplesmente *fundo de índices*. Por ser o principal ETF brasileiro, o EWZ é utilizado como uma espécie de termômetro da demanda internacional pelas ações brasileiras. Nesse exercício do Clube AM, vamos verificar se existe uma relação estatística entre o `EWZ` e o `Ibovespa`.
Usaremos os seguintes pacotes de R nesse exercício.
A seguir, colocamos um gráfico de correlação como abaixo.
A análise acima parece indicar uma correlação positiva entre as séries, o que era esperado, dada a construção do EWZ. Mas será que essa correlação implica em causalidade? Para testar isso, aplicamos o procedimento de Toda e Yamamoto (1995). De fato, conseguimos rejeitar a hipótese nula de não granger causa quando o sentido é do IBOVESPA para o EWZ, o que indica uma causalidade no sentido de Granger nessa direção. Algo que, por óbvio, era esperado.
____________________
(*) Os códigos completos do exercício estão disponíveis no Clube AM.
Quem trabalha com modelagem e previsão provavelmente já teve que construir modelos baseados em vetores autorregressivos. Nessa Dicas de R - disponível toda quarta-feira aqui no blog da AM -vamos mostrar como é possível implementar esse tipo de modelo no R e utilizá-lo para fins de previsão. Essa aula, inclusive, faz parte do nosso novíssimo Curso de Previsão Macroeconométrica usando o R.
Em análises de séries temporais, é bastante comum considerar simultaneamente duas ou mais séries. Por exemplo, o nível de ociosidade da economia certamente tem influência sobre a taxa de crescimento dos preços, assim como um aumento da taxa de juros tem relação com a taxa de desemprego. Ademais, pode ser necessário em algumas ocasiões avaliar o quanto um choque em afeta . Essas questões, bastante pertinentes no dia a dia, são tratadas dentro do que chamamos de análise multivariada de séries temporais. São objetivos básicos da análise multivariada de séries temporais:
Estudar as relações dinâmicas entre séries diversas;
Melhorar as previsões sobre uma variável específica.
Seja um vetor de dimensão que contém séries temporais observadas em um período de tempo comum. Por exemplo, é o PIB trimestral brasileiro e é a taxa de desemprego também trimestral. Acaso, estudemos e conjuntamente poderemos verificar a dependência contenporânea e passada que existe entre essas duas variáveis. Poderemos verificar o quanto um choque no PIB afeta a taxa de desemprego e quanto tempo isso tende a durar. Analogamente, podemos estar interessados na relação entre a taxa de desemprego e a inflação.
A correlação entre as variáveis é -0,81, bastante elevada, mas isso, claro, não é o bastante para identificarmos a natureza da relação entre elas. Algumas questões devem ser levadas em consideração. Em primeiro lugar, para uma análise econométrica, precisamos definir se as séries são estacionárias. Essa primeira (grande) questão definirá o tipo de análise que faremos entre elas. Vamos supor que elas sejam estacionárias. Podemos, nesse caso, estimar um \textbf{Vetor Autoregressivo} de primeira ordem, de modo que:
(1)
O VAR(1) vai descrever a evolução dinâmica da interação entre a inflação e desemprego. Uma vez estimado esse modelo, poderemos nos perguntar se existe causalidade nessa relação, isto é, se inflação de fato ajuda a prever o desemprego, se o contrário ocorre ou se há uma simultaneidade. Nesse último caso, dizemos que existe uma causalidade bidirecional.
Ademais, esse tipo de análise também irá nos permitir estimar funções de impulso-resposta, onde analisamos a resposta a impulsos em uma das variáveis. Por exemplo, um choque no desemprego tem qual efeito sobre a inflação? E o caso contrário? Uma análise como essa pode ser muito interessante para avaliar a relação que existe entre duas ou mais variáveis, não é mesmo?
Um dos pressupostos, entretanto, do modelo acima é que as variáveis sejam estacionárias, no sentido que discutimos anteriormente. Isso significa que se essa hipótese for violada, teremos que partir para outro tipo de análise. No nosso Curso de Previsão Macroeconométrica usando o R, discutiremos a existência de cointegração entre duas ou mais variáveis, isto é, para o caso em que lidamos com séries não estacionárias, pode ser o caso de nos perguntarmos se existe uma relação entre de longo-prazo entre elas. Para o exemplo acima, se as séries não forem estacionárias, como de fato aparentam não ser, as mesmas podem estar relacionadas ao longo do tempo. Se for esse o caso, dizemos que as séries possuem uma tendência comum, o que nos permite avaliar a relação entre elas ao longo do tempo.
Para além disso, vamos agora ilustrar a aplicação de um modelo VAR a dados reais brasileiros. Estamos, por suposto, interessados em construir um modelo VAR que seja utilizado para fins de previsão da inflação mensal medida pelo IPCA. Para isso, vamos começar, como de praxe, carregando alguns pacotes.
Os dados que precisaremos são coletados com uso do pacote \texttt{BETS} abaixo. Pegamos as séries de inflação, taxa Selic, taxa de câmbio e a produção industrial. Ademais, já tratamos as séries, preparando-as para o modelo VAR.
Esse tipo de modelagem é bastante utilizado entre profissionais que precisam de previsões acuradas no curto prazo para diversos tipos de variáveis. Ela é vista em detalhes nos nossos Cursos avançados de Macro Aplicada e de Análise de Séries Temporais.
____________________
Bolsonaro, enfim, fez o que dele se esperava desde o início do mandato: "dilmou". A demissão do presidente da principal estatal brasileira foi um banho de água fria para investidores domésticos e estrangeiros. O problema aqui vai além da Petrobras em si e afeta praticamente toda a política econômica do atual governo. Em campanha, Bolsonaro flertou com o liberalismo, alimentando-se de um sentimento "antiestadismo" pós-operação Lava Jato. Eleito, porém, era visível o desconforto do Presidente da República com a agenda liberal. Era, portanto, questão de tempo que o seu passado intervencionista desse o ar da graça.
Investidores domésticos e estrangeiros, por óbvio, irão colocar isso no preço. Para ilustrar, vamos nesse Comentário de Conjuntura olhar as ações de três empresas estatais: Banco do Brasil, Eletrobras e Petrobras. Além disso, vamos ver o que aconteceu com o Ibovespa, dados os eventos recentes.
Os membros do Clube AM, como sempre, têm acesso aos códigos completos desse Comentário e também a um vídeo explicativo sobre como rodar os códigos.
Vamos começar, como de praxe, carregando alguns pacotes de R.
Com os dados carregados, nós podemos gerar um gráfico da ação da Petrobras.
A ação da Petrobras sofreu uma queda de 21,5% nessa segunda-feira, mostrando o descontentamento do mercado com a interferência política do Palácio do Planalto sobre a estatal. Para além da Petrobras, será que tivemos queda nas outras estatais? O gráfico abaixo ilustra.
O Banco do Brasil também parece ter sofrido com o "efeito Petrobras": a ação do Banco teve queda de 11,6% nessa segunda-feira. A Eletrobrás, por outro lado, não parece ter sentido impacto relevante, ao menos por enquanto.
E o IBOVESPA?
O Índice Bovespa acabou sendo levado pelo mau humor dos investidores com a interferência política e fechou com queda de quase 5% nessa segunda-feira.
Difícil dizer como acabará o governo Bolsonaro, mas uma coisa parece cada vez mais clara para quem acompanha a política econômica: o flerte com o liberalismo está sepultado.
___________________
(*) Conheça o Clube AM e faça parte de um grupo exclusivo de compartilhamento de códigos e troca de informações entre os membros;
Quem trabalha com modelagem costuma ter que escrever equações de forma bastante rotineira. Para exercícios simples, é bastante tranquilo escrever uma ou outra equação em . O problema é quando você tem muitas equações no mesmo documento. Nessa Dicas de R - disponível toda quarta-feira aqui no blog da AM -vamos divulgar um novo pacote, o equatiomatic, que trata justamente desse problema.
Usei a própria documentação do pacote para exemplificar o seu uso. Primeiro, rodamos um lm qualquer como o abaixo.
m <- lm(bill_length_mm ~ bill_depth_mm + flipper_length_mm, penguins)
Agora, basta usar a função extract_eq para que tenhamos acesso à equação.
extract_eq(m)
(1)
A equação extract_eq contém, inclusive, alguns argumentos que permitem a customização da equação a ser exibida. Para além disso, outra coisa legal do pacote é poder plotar gráficos com equações, como abaixo.
# Fit an lm model
m <- lm(body_mass_g ~ bill_length_mm, penguins)
# extract equation with `ital_vars = TRUE` to avoid the use of `\operatorname`
m_eq <- extract_eq(m, use_coef = TRUE, ital_vars = TRUE)
# swap escaped underscores for dashes
prep_eq <- gsub("\\\\_", "-", m_eq)
# swap display-style
prep_eq <- paste("$", as.character(prep_eq), "$", sep = "")
# Plot
ggplot(penguins, aes(x = bill_length_mm, y = body_mass_g)) +
geom_point() +
geom_smooth(method = "lm") +
labs(title = "Relation between bill length and body mass",
subtitle = TeX(prep_eq))
____________
Um pdf e um script com todo o código desse exercício está disponível para os membros do Clube AM.
Na próxima quinta-feira, às 20h, eu farei uma aula ao vivo sobre estratégias de previsão da inflação mensal medida pelo IPCA. A aula faz parte do lançamento do nosso novo Curso de Previsão Macroeconométrica usando o R. Para garantir sua presença na aula, coloque seu nome na lista aqui para ser avisado. Nesse Comentário de Conjuntura, a propósito, fazemos um raio-x da inflação brasileira, tendo por foco o IPCA. O código completo está disponível para os membros do Clube AM.
Para começar, nós carregamos os pacotes de R que utilizaremos.
Com os pacotes carregados, podemos coletar os dados diretamente do SIDRA/IBGE para o RStudio com o código abaixo. Já aproveito para criar a inflação mensal e a inflação acumulada em 12 meses.
Com os dados dos núcleos disponíveis, nós podemos criar um gráfico como abaixo.
A despeito do avanço da inflação cheia, a média dos sete núcleos do Banco Central ainda se situa abaixo da meta de inflação. A seguir, ilustramos todos os sete núcleos.
Como é possível ver pelo gráfico, todos os sete núcleos situam-se abaixo da meta de inflação, que esse ano é de 3,75%. Na sequência, vemos cada um dos sete grupos, na sua variação mensal.
E a variação acumulada em 12 meses.
Os núcleos de inflação são importantes para expurgar choques que ocorrem sobre o índice cheio. O que se vê pelos gráficos acima é que, de fato, os núcleos ainda estão mais comportados do que a inflação cheia, mas na margem, houve sim uma contaminação.
Outra informação importante é a difusão da inflação, isto é, o percentual de subitens que teve variação positiva no mês. Pelo gráfico acima, é possível ver que na margem há um avanço da difusão, já considerando uma média móvel de 12 meses dos dados.
Na sequência, nós podemos ver a contribuição dos 9 grupos para a inflação cheia. Os dados são coletados diretamente do SIDRA/IBGE.
Na sequência, geramos um gráfico com a variação mensal dos nove grupos.
Como se vê, houve um aumento considerável do grupo Alimentação e bebidas ao longo de 2020, o que contribuiu de forma peremptória para o avanço da inflação ao longo daquele ano. Na sequência, colocamos a contribuição de cada um dos grupos para a inflação mensal.
O gráfico acima ilustra a contribuição do grupo Alimentação e bebidas para a inflação mensal ao longo de 2020. A seguir, baixamos as classificações do IPCA diretamente do Banco Central.
Um gráfico com a variação acumulada em 12 meses é colocado abaixo.
Há uma assimetria entre as classificações do IPCA. Enquanto os preços livres tiveram um avanço nos últimos anos, os monitorados e não comercializáveis seguiram trajetória contrária. Na margem, contudo, essas classificações também mostram algum repique.
Para terminar esse `Raio-x da inflação brasileira`, vamos passar rapidamente pelos Índices Gerais de Preço (IGPs), construídos e divulgados mensalmente pela Fundação Getúlio Vargas. Os (IGPs) são formados por três índices: Índice de Preços por Atacado (IPA), Índice de Preço ao Consumidor (IPC) e Índice Nacional de Custo da Construção Civil (INCC). São divididos por período de coleta em IGP-10, IGP-M e IGP-DI.
Os números-índices do IGP-10, IGP-M e IGP-DI podem ser obtidos aplicando a seguinte fórmula no :
(1)
Onde pode ser 10, M ou DI.
O código a seguir pega os dados diretamente do Banco Central.
Na sequência, colocamos um gráfico que mostra os índices gerais e seus componentes no acumulado em 12 meses.
Como se vê, houve um salto no IPA, o índice de preços no atacado. Como o mesmo representa 60% dos índices gerais, houve um salto grande nesses índices ao longo de 2020. A tabela abaixo mostra a correlação entre os índices gerais, seus componentes e o IPCA.
IGP-10
IGP-DI
IGP-M
INCC
IPA
IPC-Br
IPCA
IGP-10
1.0000000
0.9839832
0.9961309
0.4423330
0.9714577
0.2969412
0.3105496
IGP-DI
0.9839832
1.0000000
0.9947883
0.3984862
0.9930553
0.2648717
0.2771306
IGP-M
0.9961309
0.9947883
1.0000000
0.4198252
0.9855453
0.2778136
0.2909590
INCC
0.4423330
0.3984862
0.4198252
1.0000000
0.3182797
0.4864669
0.5081419
IPA
0.9714577
0.9930553
0.9855453
0.3182797
1.0000000
0.1571463
0.1702913
IPC-Br
0.2969412
0.2648717
0.2778136
0.4864669
0.1571463
1.0000000
0.9866917
IPCA
0.3105496
0.2771306
0.2909590
0.5081419
0.1702913
0.9866917
1.0000000
Para terminar, então, mostramos o gap entre o IPA e o IPCA no gráfico abaixo.