Category

Macroeconometria

Usando um VECM para projetar o Desemprego no Brasil

By | Macroeconometria

A semana termina aqui na Análise Macro com mais uma edição do Clube do Código. Estará disponível no próximo domingo a Edição 68 do Clube, titulada Usando um VECM para projetar o Desemprego no Brasil. Ao longo da semana, os leitores desse espaço acompanharam tanto no Comentário de Conjuntura quanto na divulgação de indicadores feita hoje, uma preocupação com a projeção da taxa de desemprego. Na mais nova edição do Clube, detalhamos mais um modelo de previsão para a taxa de desemprego, utilizando um Vetor de Correção de Erros. O novo modelo de previsão para a taxa de desemprego utiliza pesquisas do Google, seguindo o paper "The predictive power of google search in forecasting US unemployment".

Acima temos um gráfico com as projeções da taxa de desemprego nos próximos seis meses. Abaixo, uma tabela com as previsões geradas pelo modelo.

Previsões para a Taxa de Desemprego
Lower Média Upper
Nov/19 11.2 11.4 11.5
Dez/19 11.0 11.2 11.4
Jan/20 11.1 11.4 11.8
Fev/20 11.3 11.8 12.3
Mar/20 11.5 12.1 12.8
Abr/20 11.1 11.9 12.7

O modelo utiliza as seguintes variáveis: (i) índice coincidente de desemprego da FGV; (ii) índice antecedente de emprego da FGV; (iii) índice de incerteza econômica da FGV; (iv) pesquisas no Google pela palavra 'emprego'; (v) IBC-BR; (vi) taxa de juros Selic.

Na Edição 68 do Clube do Código estão detalhados todos os códigos utilizados no exercício.

_________________________

Quer aprender a construir modelos de séries temporais? Veja nosso Curso de Séries Temporais usando o R.

Uma comparação econométrica entre o CAGED e a PNAD Contínua

By | Macroeconometria

Ontem, eu publiquei um post chamando atenção para a divergência na margem entre o CAGED e a PNAD Contínua. Enquanto o primeiro vinha apontando resultados positivos há cinco meses, a segunda tem apresentado queda na contratação com carteira desde junho. De modo a melhor diagnosticar a relação entre as séries, optei por realizar um exercício um pouco mais aprofundado. Aplicamos três metodologias distintas às séries: (1) a aplicação do procedimento de Toda e Yamamoto (1995); (2) um modelo BVAR; (3) um modelo de correção de erros. Você pode saber mais sobre eles, a propósito, no nosso Curso de Séries Temporais usando o R. Nesse post, resumo os resultados encontrados.

Antes de mais nada, precisamos carregar alguns pacotes. O script de R começa então com os seguintes pacotes:


## Pacotes
library(ecoseries)
library(sidrar)
library(ggplot2)
library(scales)
library(vars)
library(aod)
library(BMR)
### Pacote Seasonal
library(seasonal)
Sys.setenv(X13_PATH = "C:/Séries Temporais/R/Pacotes/seas/x13ashtml")

Os dados são baixados do IPEADATA e do SIDRA/IBGE com o código abaixo:


## Baixar dados
caged = ts(series_ipeadata('272844966',
periodicity = 'M')$serie_272844966$valor,
start=c(1999,05), freq=12)

po = get_sidra(api='/t/6320/n1/all/v/4090/p/all/c11913/allxt')
carteira = po$Valor[po$`Posição na ocupação e categoria do emprego no trabalho principal (Código)`=='31722']
pnad = ts(carteira, start=c(2012,03), freq=12)

A seguir, tratamos os dados com o código abaixo:


## Dessazonalizar Caged
cagedsa <- final(seas(caged))

## Comparar 3 meses
pnad3 = pnad - lag(pnad,-3)
pnad3 = final(seas(pnad3))

cagedsa3 = cagedsa+lag(cagedsa,-1)+lag(cagedsa,-2)

## Juntar dados
data = ts.intersect(cagedsa3/1000, pnad3)
colnames(data) = c('caged', 'pnad')

Observe que no código acima estou comparando a variação de três meses da PNAD Contínua com o acumulado de três meses do CAGED. Isso é necessário porque a primeira é uma pesquisa de estoque enquanto a segunda é uma pesquisa de fluxo. Ademais, a PNAD faz referência a trimestres móveis enquanto o CAGED é mensal. Uma vez devidamente tratados, podemos apresentá-los no gráfico a seguir.

A correlação entre as séries é de 0,75. Na margem, contudo, observe que enquanto a PNAD está caindo, o CAGED acumulado em três meses segue aumentando. De modo a compreender a relação entre as séries, prosseguimos com a modelagem econométrica. Primeiro, aplicamos o procedimento proposto por Toda e Yamamoto (1995). Nesse procedimento, os resultados encontrados sugerem que o CAGED ajuda a explicar a PNAD Contínua, enquanto o inverso não é verdadeiro.

Ao se construir um BVAR com Minnesota Prior e extrair as funções de impulso-resposta, observamos que um choque no CAGED afeta a PNAD positivamente. A figura acima ilustra. A seguir, construímos um modelo de correção de erros entre as séries, já que as mesmas não são estacionárias. Também extraímos as funções de impulso-resposta. Abaixo, ilustramos com um choque no CAGED e o efeito sobre a PNAD.

Por fim, mas não menos importante, fazemos a decomposição de variância entre as séries. Descobrimos que, passados 12 meses, o CAGED explica cerca de 49% da variância da PNAD, enquanto a PNAD explica apenas 1% da variância do CAGED no mesmo horizonte de tempo.

Em outras palavras, os resultados encontrados sugerem que o saldo do CAGED tem precedência temporal sobre a população ocupada com carteira da PNAD Contínua, servindo de base para antecipar os resultados da mesma. O que significa que, na margem, o CAGED pode estar antecipando uma dinâmica futura da PNAD, isto é, a melhora no mercado de trabalho formal.

Esse ponto é importante haja visto que o diagnóstico consensual extraído da PNAD de que o mercado de trabalho aumentou a informalidade nos últimos meses. Isso dá margem para diversas discussões sobre precarização do trabalho e questões similares. À luz dos resultados encontrados nesse exercício, o movimento atual pode ser apenas parte da dinâmica natural do mercado de trabalho, isto é, primeiro há uma melhora do mercado informal, só depois isso se espalha para a formalização.

Um último ponto que queria chamar atenção - e aí, os economistas especializados em mercado de trabalho me corrijam se eu estiver falando bobagem - é que o CAGED capta um rito formal, isto é, o registro de admitidos e demitidos nas empresas, enquanto a PNAD capta questões um pouco mais abstratas, já que está baseada na resposta das pessoas a um questionário. Em outros termos, o CAGED está em melhor posição para capturar, portanto, a tendência do mercado de trabalho. Os resultados encontrados nesse exercício parecem fortalecer esse argumento.

___________________

(*) Os códigos completos desse exercício, a propósito, estarão disponíveis na Edição 67 do Clube do Código.

(**) Quer sugerir exercícios? Manda um e-mail para mim: vitorwilher@analisemacro.com.br.

O Banco Central sob os mandatos de Meirelles, Tombini e Goldfajn

By | Macroeconometria

A Edição 62 do Clube do Código atualiza um exercício feito nesse espaço pelo Ricardo Lima nos idos de 2015, quando comparava as administrações de Henrique Meirelles e Alexandre Tombini à frente do Banco Central. A ideia básica do exercício era verificar a reação do Banco Central a choques na inflação e no desemprego. Nessa atualização, nós adicionamos o período de Ilan Goldfajn à frente da autoridade monetária, mudamos o desemprego pelo hiato do produto e apresentamos os resultados.

Os dados utilizados no exercício foram a taxa básica de juros, a inflação mensal medida pelo IPCA e o Índice de Nível de Atividade do Banco Central, o IBC-Br. Com base nesses dados, nós construímos um BVAR com Minnesota prior. Dividimos a amostra em três subamostras que faziam referência aos períodos de gestão de Meirelles, Tombini e Goldfajn à frente da autoridade monetária. Nessas subamostras, calculamos as funções de impulso-resposta com base em choques no hiato do produto e na inflação. Para ilustrar, abaixo a resposta para um choque na inflação.

A resposta de Meirelles e Goldfajn a choques na inflação são similares, enquanto a resposta da gestão Tombini não parece ser significativa. Abaixo a resposta acumulada.

Os códigos do exercício estarão disponíveis no repositório do Clube na próxima sexta-feira. 

Modelando o IFIX através de Mínimos Quadrados Parciais (PLS)

By | Macroeconometria

A Edição 61 do Clube do Código, que estará disponível para os membros essa semana no repositório privado, busca estimar um modelo via mínimos quadrados parciais para o IFIX, o Índice de Fundos de Investimentos Imobiliários. Segundo a B3, "O IFIX é o resultado de uma carteira teórica de ativos, elaborada de acordo com os critérios estabelecidos nesta metodologia. O objetivo do IFIX é ser o indicador do desempenho médio das cotações dos fundos imobiliários negociados nos mercados de bolsa e de balcão organizado da B3".

A opção por mínimos quadrados parciais para modelar a variável se dá devido a grande quantidade de preditores utilizados, entre variáveis reais de desempenho da economia brasileira e variáveis eminentemente financeiras, com relação entre si. A modelagem via mínimos quadrados ordinários implicaria, assim, em problemas de multicolinearidade.

Uma vez escolhidos os preditores e estimado o modelo dentro da amostra de treino, o ajuste do modelo nos pareceu satisfatório, como mostra o gráfico acima. Isso foi confirmado por medidas de acurácia avaliadas na amostra de teste.

____________________________

O Clube do Código é o projeto de compartilhamento de códigos da Análise Macro. Conheça e apoie o projeto! 

Por que temos juros tão altos: uma resposta econométrica

By | Macroeconometria

Na Edição 60 do Clube do Código, construímos um modelo simples que explica a trajetória do spread bancário no Brasil. O spread é a diferença entre as taxas de captação e de empréstimo bancário, que é sistematicamente mais elevado no país do que a evidência internacional. De modo a entender essa anomalia, utilizamos como variáveis explicativas para o spread as provisões dos bancos, compulsórios bancários, taxa de inadimplência, taxa Selic e taxa de desemprego. Abaixo o ajuste do modelo.

O modelo que construímos tem um R^2 de 0,96, o que significa que o mesmo consegue explicar 96% da variação na nossa variável de interesse. Abaixo, colocamos uma tabela que resume os resultados encontrados.

Dependent variable:
spread
provisoes 1.232**
(0.512)
compulsorio 0.007**
(0.003)
inadimplencia 1.338***
(0.386)
selic 0.559***
(0.030)
desemprego 0.559***
(0.115)
Constant -7.509***
(1.426)
Observations 84
R2 0.962
Adjusted R2 0.960
Note: *p<0.1; **p<0.05; ***p<0.01

Como se depreende da tabela, todas as variáveis foram estatisticamente significativas para explicar o spread bancário. Em particular, os resultados encontrados sugerem que um aumento de 1 p.p. na taxa de inadimplência faz o spread bancário aumentar em 1,33 p.p.

Como de praxe, os códigos do exercício estão disponíveis no repositório do Clube do Código.

____________________

ps: estamos aqui na Análise Macro com inscrições abertas para os cursos de Macro Aplicada e para a Formação em Produção de Trabalhos Empíricos usando o R, onde você aprende a lidar com dados da forma que eu mostrei no post com o uso do R. O primeiro lote está com 30% de desconto, mas deve acabar logo, então corre e se inscreve logo!  

Cadastre-se na newsletter
e receba nossas novidades em primeira mão!