PNAD Contínua vs. CAGED: uma análise comparativa com o R

O Brasil possui atualmente duas pesquisas principais, como aprendemos em nosso Curso de Análise de Conjuntura usando o R, sobre o mercado de trabalho. O Cadastro Geral de Empregados e Desempregados (CAGED), do hoje extinto Ministério do Trabalho, cobre o fluxo mensal de admitidos e demitidos em empresas devidamente registradas. Já a Pesquisa Nacional por Amostra de Domicílios Contínua (PNAD Contínua) dá uma dimensão mais abrangente sobre o estoque de pessoas envolvidas (ou não) no mercado de trabalho.

Pode ser interessante, nesse sentido, fazer uma comparação entre as duas pesquisas. O código abaixo, por suposto, utiliza o pacote ecoseries para pegar os dados de admitidos do CAGED diretamente do site do IPEADATA, bem como utiliza o pacote sidrar para pegar os dados da população ocupada com carteira assinada do site do SIDRA/IBGE.


library(ecoseries)
library(sidrar)

## Baixar dados
caged = ts(series_ipeadata('231410417',
periodicity = 'M')$serie_231410417$valor,
start=c(1999,05), freq=12)

po = get_sidra(api='/t/6320/n1/all/v/4090/p/all/c11913/allxt')
carteira = po$Valor[po$`Posição na ocupação e categoria do emprego no trabalho principal (Código)`=='31722']
pnad = ts(carteira, start=c(2012,03), freq=12)

Uma vez de posse desses dados, devemos dessazonalizar os dados do CAGED com o código a seguir, utilizando o pacote seasonal.

library(seasonal)
cagedsa = final(seas(caged))

Com os dados do CAGED dessazonalizados, podemos pegar uma janela dos dados, lembrando que como a PNAD Contínua refere-se a uma média móvel trimestral, há uma defasagem de três meses em relação aos dados do CAGED. O código abaixo operacionaliza.


## Window
cagedsa = window(cagedsa, start=c(2012,06))
pnad = window(pnad, end=c(2018,09))

E por fim plotamos o gráfico de correlação entre as variáveis como abaixo...

Como podemos ver, há uma correlação positiva entre os dados próxima a 0,7. Quer aprender mais sobre como usar o R para fazer esse tipo de análise? Conheça nosso Curso de Análise de Conjuntura usando o R. Corre lá e garanta a sua vaga!

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Análise regional do mercado de trabalho com dados do CAGED usando Python

Os microdados dos CAGED fornecem informações detalhadas a nível de cidade, sexo, raça, nível de instrução, idade, salário e outras sobre os trabalhadores formais do Brasil, possibilitando ricas análises regionais de dados. Neste artigo mostramos como acessar, processar e analisar estes dados utilizando o Python.

Transfer Learning: mostrando porque o Python está na ponta do desenvolvimento

A aprendizagem por transferência (transfer learning) é o reuso de um modelo pré-treinado em um novo problema. Portanto, sua utilização torna-se um avanço enorme para a previsão de diferentes tipos de variáveis, principalmente para aquelas ordenadas no tempo. Mostramos nesta postagem o uso do Transfer Learning com o Python para o caso de Séries Temporais.

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.