Uma comparação econométrica entre o CAGED e a PNAD Contínua

Ontem, eu publiquei um post chamando atenção para a divergência na margem entre o CAGED e a PNAD Contínua. Enquanto o primeiro vinha apontando resultados positivos há cinco meses, a segunda tem apresentado queda na contratação com carteira desde junho. De modo a melhor diagnosticar a relação entre as séries, optei por realizar um exercício um pouco mais aprofundado. Aplicamos três metodologias distintas às séries: (1) a aplicação do procedimento de Toda e Yamamoto (1995); (2) um modelo BVAR; (3) um modelo de correção de erros. Você pode saber mais sobre eles, a propósito, no nosso Curso de Séries Temporais usando o R. Nesse post, resumo os resultados encontrados.

Antes de mais nada, precisamos carregar alguns pacotes. O script de R começa então com os seguintes pacotes:


## Pacotes
library(ecoseries)
library(sidrar)
library(ggplot2)
library(scales)
library(vars)
library(aod)
library(BMR)
### Pacote Seasonal
library(seasonal)
Sys.setenv(X13_PATH = "C:/Séries Temporais/R/Pacotes/seas/x13ashtml")

Os dados são baixados do IPEADATA e do SIDRA/IBGE com o código abaixo:


## Baixar dados
caged = ts(series_ipeadata('272844966',
periodicity = 'M')$serie_272844966$valor,
start=c(1999,05), freq=12)

po = get_sidra(api='/t/6320/n1/all/v/4090/p/all/c11913/allxt')
carteira = po$Valor[po$`Posição na ocupação e categoria do emprego no trabalho principal (Código)`=='31722']
pnad = ts(carteira, start=c(2012,03), freq=12)

A seguir, tratamos os dados com o código abaixo:


## Dessazonalizar Caged
cagedsa <- final(seas(caged))

## Comparar 3 meses
pnad3 = pnad - lag(pnad,-3)
pnad3 = final(seas(pnad3))

cagedsa3 = cagedsa+lag(cagedsa,-1)+lag(cagedsa,-2)

## Juntar dados
data = ts.intersect(cagedsa3/1000, pnad3)
colnames(data) = c('caged', 'pnad')

Observe que no código acima estou comparando a variação de três meses da PNAD Contínua com o acumulado de três meses do CAGED. Isso é necessário porque a primeira é uma pesquisa de estoque enquanto a segunda é uma pesquisa de fluxo. Ademais, a PNAD faz referência a trimestres móveis enquanto o CAGED é mensal. Uma vez devidamente tratados, podemos apresentá-los no gráfico a seguir.

A correlação entre as séries é de 0,75. Na margem, contudo, observe que enquanto a PNAD está caindo, o CAGED acumulado em três meses segue aumentando. De modo a compreender a relação entre as séries, prosseguimos com a modelagem econométrica. Primeiro, aplicamos o procedimento proposto por Toda e Yamamoto (1995). Nesse procedimento, os resultados encontrados sugerem que o CAGED ajuda a explicar a PNAD Contínua, enquanto o inverso não é verdadeiro.

Ao se construir um BVAR com Minnesota Prior e extrair as funções de impulso-resposta, observamos que um choque no CAGED afeta a PNAD positivamente. A figura acima ilustra. A seguir, construímos um modelo de correção de erros entre as séries, já que as mesmas não são estacionárias. Também extraímos as funções de impulso-resposta. Abaixo, ilustramos com um choque no CAGED e o efeito sobre a PNAD.

Por fim, mas não menos importante, fazemos a decomposição de variância entre as séries. Descobrimos que, passados 12 meses, o CAGED explica cerca de 49% da variância da PNAD, enquanto a PNAD explica apenas 1% da variância do CAGED no mesmo horizonte de tempo.

Em outras palavras, os resultados encontrados sugerem que o saldo do CAGED tem precedência temporal sobre a população ocupada com carteira da PNAD Contínua, servindo de base para antecipar os resultados da mesma. O que significa que, na margem, o CAGED pode estar antecipando uma dinâmica futura da PNAD, isto é, a melhora no mercado de trabalho formal.

Esse ponto é importante haja visto que o diagnóstico consensual extraído da PNAD de que o mercado de trabalho aumentou a informalidade nos últimos meses. Isso dá margem para diversas discussões sobre precarização do trabalho e questões similares. À luz dos resultados encontrados nesse exercício, o movimento atual pode ser apenas parte da dinâmica natural do mercado de trabalho, isto é, primeiro há uma melhora do mercado informal, só depois isso se espalha para a formalização.

Um último ponto que queria chamar atenção - e aí, os economistas especializados em mercado de trabalho me corrijam se eu estiver falando bobagem - é que o CAGED capta um rito formal, isto é, o registro de admitidos e demitidos nas empresas, enquanto a PNAD capta questões um pouco mais abstratas, já que está baseada na resposta das pessoas a um questionário. Em outros termos, o CAGED está em melhor posição para capturar, portanto, a tendência do mercado de trabalho. Os resultados encontrados nesse exercício parecem fortalecer esse argumento.

___________________

(*) Os códigos completos desse exercício, a propósito, estarão disponíveis na Edição 67 do Clube do Código.

(**) Quer sugerir exercícios? Manda um e-mail para mim: vitorwilher@analisemacro.com.br.

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Como sumarizar divulgações trimestrais de empresas usando IA no Python

Neste exercício, iremos utilizar a inteligência artificial no Python para analisar e sumarizar divulgações trimestrais de empresas. Focaremos no uso de ferramentas como Gemini e técnicas de processamento de linguagem natural para extrair informações de documentos PDF relacionados aos relatórios financeiros das empresas.

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.