Uma comparação econométrica entre o CAGED e a PNAD Contínua

Ontem, eu publiquei um post chamando atenção para a divergência na margem entre o CAGED e a PNAD Contínua. Enquanto o primeiro vinha apontando resultados positivos há cinco meses, a segunda tem apresentado queda na contratação com carteira desde junho. De modo a melhor diagnosticar a relação entre as séries, optei por realizar um exercício um pouco mais aprofundado. Aplicamos três metodologias distintas às séries: (1) a aplicação do procedimento de Toda e Yamamoto (1995); (2) um modelo BVAR; (3) um modelo de correção de erros. Você pode saber mais sobre eles, a propósito, no nosso Curso de Séries Temporais usando o R. Nesse post, resumo os resultados encontrados.

Antes de mais nada, precisamos carregar alguns pacotes. O script de R começa então com os seguintes pacotes:


## Pacotes
library(ecoseries)
library(sidrar)
library(ggplot2)
library(scales)
library(vars)
library(aod)
library(BMR)
### Pacote Seasonal
library(seasonal)
Sys.setenv(X13_PATH = "C:/Séries Temporais/R/Pacotes/seas/x13ashtml")

Os dados são baixados do IPEADATA e do SIDRA/IBGE com o código abaixo:


## Baixar dados
caged = ts(series_ipeadata('272844966',
periodicity = 'M')$serie_272844966$valor,
start=c(1999,05), freq=12)

po = get_sidra(api='/t/6320/n1/all/v/4090/p/all/c11913/allxt')
carteira = po$Valor[po$`Posição na ocupação e categoria do emprego no trabalho principal (Código)`=='31722']
pnad = ts(carteira, start=c(2012,03), freq=12)

A seguir, tratamos os dados com o código abaixo:


## Dessazonalizar Caged
cagedsa <- final(seas(caged))

## Comparar 3 meses
pnad3 = pnad - lag(pnad,-3)
pnad3 = final(seas(pnad3))

cagedsa3 = cagedsa+lag(cagedsa,-1)+lag(cagedsa,-2)

## Juntar dados
data = ts.intersect(cagedsa3/1000, pnad3)
colnames(data) = c('caged', 'pnad')

Observe que no código acima estou comparando a variação de três meses da PNAD Contínua com o acumulado de três meses do CAGED. Isso é necessário porque a primeira é uma pesquisa de estoque enquanto a segunda é uma pesquisa de fluxo. Ademais, a PNAD faz referência a trimestres móveis enquanto o CAGED é mensal. Uma vez devidamente tratados, podemos apresentá-los no gráfico a seguir.

A correlação entre as séries é de 0,75. Na margem, contudo, observe que enquanto a PNAD está caindo, o CAGED acumulado em três meses segue aumentando. De modo a compreender a relação entre as séries, prosseguimos com a modelagem econométrica. Primeiro, aplicamos o procedimento proposto por Toda e Yamamoto (1995). Nesse procedimento, os resultados encontrados sugerem que o CAGED ajuda a explicar a PNAD Contínua, enquanto o inverso não é verdadeiro.

Ao se construir um BVAR com Minnesota Prior e extrair as funções de impulso-resposta, observamos que um choque no CAGED afeta a PNAD positivamente. A figura acima ilustra. A seguir, construímos um modelo de correção de erros entre as séries, já que as mesmas não são estacionárias. Também extraímos as funções de impulso-resposta. Abaixo, ilustramos com um choque no CAGED e o efeito sobre a PNAD.

Por fim, mas não menos importante, fazemos a decomposição de variância entre as séries. Descobrimos que, passados 12 meses, o CAGED explica cerca de 49% da variância da PNAD, enquanto a PNAD explica apenas 1% da variância do CAGED no mesmo horizonte de tempo.

Em outras palavras, os resultados encontrados sugerem que o saldo do CAGED tem precedência temporal sobre a população ocupada com carteira da PNAD Contínua, servindo de base para antecipar os resultados da mesma. O que significa que, na margem, o CAGED pode estar antecipando uma dinâmica futura da PNAD, isto é, a melhora no mercado de trabalho formal.

Esse ponto é importante haja visto que o diagnóstico consensual extraído da PNAD de que o mercado de trabalho aumentou a informalidade nos últimos meses. Isso dá margem para diversas discussões sobre precarização do trabalho e questões similares. À luz dos resultados encontrados nesse exercício, o movimento atual pode ser apenas parte da dinâmica natural do mercado de trabalho, isto é, primeiro há uma melhora do mercado informal, só depois isso se espalha para a formalização.

Um último ponto que queria chamar atenção - e aí, os economistas especializados em mercado de trabalho me corrijam se eu estiver falando bobagem - é que o CAGED capta um rito formal, isto é, o registro de admitidos e demitidos nas empresas, enquanto a PNAD capta questões um pouco mais abstratas, já que está baseada na resposta das pessoas a um questionário. Em outros termos, o CAGED está em melhor posição para capturar, portanto, a tendência do mercado de trabalho. Os resultados encontrados nesse exercício parecem fortalecer esse argumento.

___________________

(*) Os códigos completos desse exercício, a propósito, estarão disponíveis na Edição 67 do Clube do Código.

(**) Quer sugerir exercícios? Manda um e-mail para mim: vitorwilher@analisemacro.com.br.

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Como automatizar tarefas repetitivas usando Python? Um exemplo para largar o Excel

Manter relatórios diários com dados e análises atualizados é um desafio, pois envolve várias etapas: coleta de dados, tratamento de informações, produção de análises e atualização de relatório. Para superar este desafio algumas ferramentas como Python + Quarto + GitHub podem ser usadas para automatizar tudo que for automatizável. Neste artigo mostramos um exemplo com dados do mercado financeiro.

Criando um Dashboard de análise de Ações no Python

Um Dashboard é um painel de controle que consolida uma variedade de informações sobre um determinado objeto de estudo em um ou mais painéis. Ele simplifica significativamente o processo de análise de dados, oferecendo uma visão global e fácil de entender. Uma maneira simples de construir um Dashboard para acompanhar uma ação específica é utilizando duas ferramentas: Quarto e Python. Neste post, mostramos o resultado da criação de um Dashboard de Ação.

Analisando séries temporais no Python e esquecendo de vez o Excel

Séries temporais representam uma disciplina extremamente importante em diversas áreas, principalmente na economia e na ciência de dados. Mas, afinal, como lidar com esses dados que se apresentam ao longo do tempo? Neste exercício, demonstraremos como compreender uma série temporal e como o Python se destaca como uma das melhores ferramentas para analisar esse tipo de dado.

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.