PNAD Contínua vs. CAGED: uma análise comparativa com o R

O Brasil possui atualmente duas pesquisas principais, como aprendemos em nosso Curso de Análise de Conjuntura usando o R, sobre o mercado de trabalho. O Cadastro Geral de Empregados e Desempregados (CAGED), do hoje extinto Ministério do Trabalho, cobre o fluxo mensal de admitidos e demitidos em empresas devidamente registradas. Já a Pesquisa Nacional por Amostra de Domicílios Contínua (PNAD Contínua) dá uma dimensão mais abrangente sobre o estoque de pessoas envolvidas (ou não) no mercado de trabalho.

Pode ser interessante, nesse sentido, fazer uma comparação entre as duas pesquisas. O código abaixo, por suposto, utiliza o pacote ecoseries para pegar os dados de admitidos do CAGED diretamente do site do IPEADATA, bem como utiliza o pacote sidrar para pegar os dados da população ocupada com carteira assinada do site do SIDRA/IBGE.


library(ecoseries)
library(sidrar)

## Baixar dados
caged = ts(series_ipeadata('231410417',
periodicity = 'M')$serie_231410417$valor,
start=c(1999,05), freq=12)

po = get_sidra(api='/t/6320/n1/all/v/4090/p/all/c11913/allxt')
carteira = po$Valor[po$`Posição na ocupação e categoria do emprego no trabalho principal (Código)`=='31722']
pnad = ts(carteira, start=c(2012,03), freq=12)

Uma vez de posse desses dados, devemos dessazonalizar os dados do CAGED com o código a seguir, utilizando o pacote seasonal.

library(seasonal)
cagedsa = final(seas(caged))

Com os dados do CAGED dessazonalizados, podemos pegar uma janela dos dados, lembrando que como a PNAD Contínua refere-se a uma média móvel trimestral, há uma defasagem de três meses em relação aos dados do CAGED. O código abaixo operacionaliza.


## Window
cagedsa = window(cagedsa, start=c(2012,06))
pnad = window(pnad, end=c(2018,09))

E por fim plotamos o gráfico de correlação entre as variáveis como abaixo...

Como podemos ver, há uma correlação positiva entre os dados próxima a 0,7. Quer aprender mais sobre como usar o R para fazer esse tipo de análise? Conheça nosso Curso de Análise de Conjuntura usando o R. Corre lá e garanta a sua vaga!

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Análise exploratória para modelagem preditiva no Python

Antes de desenvolver bons modelos preditivos é necessário organizar e conhecer muito bem os dados. Neste artigo, damos algumas dicas de recursos, como gráficos, análises e estatísticas, que podem ser usados para melhorar o entendimento sobre os dados usando Python.

Como usar modelos do Sklearn para previsão? Uma introdução ao Skforecast

Prever séries temporais é uma tarefa frequente em diversas áreas, porém exige conhecimento e ferramentas específicas. Os modelos de machine learning do Sklearn são populadores, porém são difíceis de aplicar em estruturas temporais de dados. Neste sentido, introduzimos a biblioteca Skforecast, que integra os modelos do Sklearn e a previsão de séries temporais de forma simples.

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.