Tag

caged no r Archives - Análise Macro

CAGED vs. PNAD Contínua

By | Clube AM

Há um burburinho no mundinho dos economistas com respeito às diferenças entre o CAGED e a PNAD Contínua. Para muita gente dentro do mercado, o CAGED não estaria sinalizando de forma clara, por diversos problemas metodológicos, a ociosidade na economia. Já a PNAD Contínua retrataria melhor o fundo do poço pelo qual passa no país.

Instigado por esse fato, eu resolvi dar uma aula gratuita na próxima terça-feira, às 21h, sobre como analisar as duas pesquisas com o R. Se você tiver interesse, se inscreve lá no nosso Canal do youtube e ativa o lembrete da aula aqui.

A análise de ambas as pesquisas é ensinada, diga-se, no nosso Curso de Análise de Conjuntura usando o R.

A coleta dos dados é feita via o SIDRA/IBGE e via o IPEADATA. Os dados são devidamente tratados de forma a poderem ser comparados, uma vez que o CAGED se refere a um fluxo e a PNAD se refere a um estoque.

Feito isso, chegamos ao gráfico abaixo.

As séries devidamente tratadas mostram uma situação interessante. A PNAD Contínua acabou por sinalizar mais o tombo em 2020 do que o CAGED. Ademais, em exercício anterior feito no âmbito do antigo Clube do Código, os resultados encontrados sugeriam que o CAGED tinha precedência temporal sobre a população ocupada com carteira da PNAD. Essa precedência parece ter mudado, ao incorporar os novos dados do CAGED: há, agora, uma "causalidade" nos dois sentidos. Tanto a população ocupada da PNAD influencia o CAGED, quanto o contrário.

A decomposição de variância entre as séries também mudou bastante. Antes, a variância do CAGED era explicada  basicamente pela própria série (quando incluíamos as duas séries em um modelo VEC), hoje cerca de 44% da variância é explicada pela PNAD Contínua. Já a PNAD, antes 44% da variância era explicada pelo CAGEd e o restante pela própria série. Agora, 75% da variância é explicada pela própria série.

Os resultados encontrados sugerem, diga-se, que houve uma mudança significativa na relação entre as duas séries, de modo que a PNAD Contínua pode ter se tornado um sinalizador melhor do que está ocorrendo com o mercado de trabalho.

Uma possível explicação para isso está, claro, na mudança metodológica feita no CAGED em janeiro de 2020, que passou a ter como fonte dos seus dados o eSocial.

O novo exercício será publicado no Clube AM na próxima semana.

Membros do Clube AM, por suposto, têm acesso a todos os códigos de ambos os exercícios.

____________________________

Baixando planilhas do Novo CAGED com o R

By | Mercado de Trabalho

No nosso Curso de Análise de Conjuntura usando o R, ensino os alunos a baixarem os dados agregados do Novo CAGED pelo IPEADATA usando o pacote de R ecoseries. O problema é que a atualização lá não parece ser em tempo real. Assim, para quem trabalha com dados de conjuntura, pode ser necessário baixar as horríveis planilhas do Novo CAGED diretamente do site do Ministério da Economia. Hoje pela manhã, acabei escrevendo um script para isso. Abaixo, o início dele.


########################################################
######## Baixar planilha CAGED #########################

library(readxl)
library(tidyverse)

url = 'http://pdet.mte.gov.br/images/Novo_CAGED/Ago2020/3-tabelas.xlsx'
download.file(url, destfile='caged.xlsx', mode='wb')
data = read_excel('caged.xlsx', sheet = 'Tabela 5.1',
range="B5:F13") %>%
mutate(`Mês` = parse_date(`Mês`, format='%B/%Y', locale=locale('pt')))

Para quem se interessar em ir conferir as planilhas, verá que de fato elas não são nada agradáveis para uma análise séria de dados. Por exemplo, o autor da planilha preenche com um traço os dados faltantes até dezembro/2020, bem como coloca o formato da data como, por exemplo, "Janeiro/2020", dentre outras coisas. Isso exige algum código para ler os dados. No exemplo acima, eu estou lendo uma das planilhas que traz a série de dados agregados de janeiro a agosto com uma função do pacote readxl. E para não ler as tais linhas com traços, acabei setando o argumento range. Também alterei a coluna de datas da tal planilha, através da função parse_date, de modo a poder produzir um gráfico como o abaixo.

Dada a precariedade da série, os números precisam ser vistos com cautela. É preciso levar em consideração, por exemplo, a sazonalidade. Mas, para o que importa para a gente, o importante é ter o dado disponível...

Tomare que nada mude no Ministério da Economia e o script sirva para o mês que vem, né PG?

________________

(*) Para ter acesso aos códigos completos do exercício, cadastre-se na nossa Lista VIP aqui.

(**) Inscrições abertas para as Turmas Especiais dos nossos Cursos de Macro Aplicada.

Versão 4.0 do Curso de Análise de Conjuntura: inscrições abertas!

By | Cursos da Análise Macro

As inscrições para a versão 4.0 do nosso Curso de Análise de Conjuntura usando o R estão abertas! O curso cobre a construção automatizada de scripts que coletam, tratam e visualizam dados macroeconômicos. Todo o material para essa versão foi revisado, de forma a simplificar os scripts, mostrar o passo a passo dos códigos, linha por linha. Entre as demais inovações dessa versão, estão:

  • Coleta automatizada de dados macroeconômicos;
  • Códigos tidyverse para tratamento dos dados;
  • Visualização dos dados com o pacote ggplot2;
  • Inclusão da seção Construção de Cenários Macroeconômicos;
  • Construção de apresentações RMarkdown em todas as seções do curso;
  • Videoaulas das seções foram subdivididas em tópicos menores, tornando o aprendizado mais dinâmico;
  • Inclusão de uma seção extra com a construção de uma apresentação completa de conjuntura econômica feita em RMarkdown;
  • Suporte customizado através de plataforma tira-dúvidas e mentorias exclusivas com o professor do Curso.

Voltado para estudantes de graduação e pós-graduação, professores e profissionais de mercado, a quarta versão do nosso Curso de Análise de Conjuntura usando o R irá lhe ensinar a lidar com dados de verdade usando o que há de mais sofisticado da linguagem. Você aprenderá a coletar e tratar dados de inflação, nível de atividade, mercado de trabalho, crédito, política fiscal, política monetária, setor externo e economia internacional de forma 100% intuitiva e didática.

O curso inclui ainda um super bônus com 21 exemplos práticos de gráficos usando o pacote ggplot2. Scripts com o passo a passo de todos os gráficos serão disponibilizados em módulo independente para os alunos.

Para verificar todas as informações e condições de inscrição, visite a página do Curso aqui.

Versão 4.0 do Curso de Análise de Conjuntura abre inscrições no próximo dia 23/06

By | Cursos da Análise Macro

As inscrições para a versão 4.0 do nosso Curso de Análise de Conjuntura usando o R abrem no próximo dia 23/06. O curso cobre a construção automatizada de scripts que coletam, tratam e visualizam dados macroeconômicos. Todo o material para essa versão foi revisado, de forma a simplificar os scripts, mostrar o passo a passo dos códigos, linha por linha. Entre as demais inovações dessa versão, estão:

  • Coleta automatizada de dados macroeconômicos;
  • Códigos tidyverse para tratamento dos dados;
  • Visualização dos dados com o pacote ggplot2;
  • Inclusão da seção Construção de Cenários Macroeconômicos;
  • Construção de apresentações RMarkdown em todas as seções do curso;
  • Videoaulas das seções foram subdivididas em tópicos menores, tornando o aprendizado mais dinâmico;
  • Inclusão de uma seção extra com a construção de uma apresentação completa de conjuntura econômica feita em RMarkdown;
  • Suporte customizado através de plataforma tira-dúvidas e mentorias exclusivas com o professor do Curso.

Voltado para estudantes de graduação e pós-graduação, professores e profissionais de mercado, a quarta versão do nosso Curso de Análise de Conjuntura usando o R irá lhe ensinar a lidar com dados de verdade usando o que há de mais sofisticado da linguagem. Você aprenderá a coletar e tratar dados de inflação, nível de atividade, mercado de trabalho, crédito, política fiscal, política monetária, setor externo e economia internacional de forma 100% intuitiva e didática.

O curso inclui ainda um super bônus com 21 exemplos práticos de gráficos usando o pacote ggplot2. Scripts com o passo a passo de todos os gráficos serão disponibilizados em módulo independente para os alunos.

Para verificar todas as informações e condições de inscrição, visite a página do Curso aqui.

Análise do CAGED com o R

By | Mercado de Trabalho

O Ministério da Economia, enfim, divulgou os dados do CAGED em 2020. Os resultados, adianto, não são nada bons. Para analisar os dados do saldo do CAGED, podemos usar o pacote ecoseries e pegar os dados do IPEADATA. O código abaixo exemplifica.


library(ecoseries)
df_caged = series_ipeadata('272844966', periodicity = 'M')$serie_272844966

Uma vez que os dados sejam baixados, podemos visualizar os meses de abril de diversos anos com o código abaixo.


library(tidyverse)
library(lubridate)
library(scales)

df_caged_abril = filter(df_caged, month(data) == 4)
ggplot(df_caged_abril, aes(x=data))+
geom_bar(aes(y=valor/1000),
colour = ifelse(df_caged_abril$valor > 0, 'blue', "red"),
fill = ifelse(df_caged_abril$valor > 0, 'blue', "red"),
stat='identity', width = 100)+
geom_hline(yintercept=0, colour='black', linetype='dashed')+
scale_x_date(breaks = date_breaks("1 years"),
labels = date_format("%Y"))+
labs(x='', y='Mil pessoas',
title='Saldo do CAGED nos meses de Abril',
caption='Fonte: analisemacro.com.br com dados do CAGED.')+
theme(plot.title = element_text(size=12, face='bold'),
plot.caption = element_text(size=9),
axis.title.y = element_text(size=9),
axis.text.x=element_text(angle=45, hjust=1))

Os dados indicam que houve um queda líquida de 860,5 mil vagas no mês de abril, refletindo a pandemia do coronavírus. Isso é bastante preocupante, uma vez que existe uma correlação forte entre o CAGED e o crescimento do PIB, como pode ser visto abaixo.

No mês de março, diga-se, houve uma queda líquida de 207,4 mil vagas. O gráfico abaixo ilustra.

Feita a dessazonalização da série, nós obtemos o gráfico abaixo, que ilustra melhor o comportamento do saldo do CAGED e o efeito da pandemia sobre ela.

Como se vê, o impacto sobre a série foi brutal. Haverá algum impacto sobre o PIB do 1º trimestre, mas o maior efeito deverá ser mesmo sobre o PIB do 2º tri. O dado do PIB do 1º trimestre será divulgado nessa sexta-feira. Já o do 2º tri será divulgado apenas em setembro.

A relação entre CAGED e crescimento do PIB foi analisada na edição 58 do Clube do Código.

____________________

(*) Você aprende a coletar, tratar e visualizar dados macroeconômicos no nosso Curso de Análise de Conjuntura usando o R.


____________________

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais
e conteúdos exclusivos sobre Análise de Dados!

Assinar Gratuitamente