Baixando planilhas do Novo CAGED com o R

No nosso Curso de Análise de Conjuntura usando o R, ensino os alunos a baixarem os dados agregados do Novo CAGED pelo IPEADATA usando o pacote de R ecoseries. O problema é que a atualização lá não parece ser em tempo real. Assim, para quem trabalha com dados de conjuntura, pode ser necessário baixar as horríveis planilhas do Novo CAGED diretamente do site do Ministério da Economia. Hoje pela manhã, acabei escrevendo um script para isso. Abaixo, o início dele.


########################################################
######## Baixar planilha CAGED #########################

library(readxl)
library(tidyverse)

url = 'http://pdet.mte.gov.br/images/Novo_CAGED/Ago2020/3-tabelas.xlsx'
download.file(url, destfile='caged.xlsx', mode='wb')
data = read_excel('caged.xlsx', sheet = 'Tabela 5.1',
range="B5:F13") %>%
mutate(`Mês` = parse_date(`Mês`, format='%B/%Y', locale=locale('pt')))

Para quem se interessar em ir conferir as planilhas, verá que de fato elas não são nada agradáveis para uma análise séria de dados. Por exemplo, o autor da planilha preenche com um traço os dados faltantes até dezembro/2020, bem como coloca o formato da data como, por exemplo, "Janeiro/2020", dentre outras coisas. Isso exige algum código para ler os dados. No exemplo acima, eu estou lendo uma das planilhas que traz a série de dados agregados de janeiro a agosto com uma função do pacote readxl. E para não ler as tais linhas com traços, acabei setando o argumento range. Também alterei a coluna de datas da tal planilha, através da função parse_date, de modo a poder produzir um gráfico como o abaixo.

Dada a precariedade da série, os números precisam ser vistos com cautela. É preciso levar em consideração, por exemplo, a sazonalidade. Mas, para o que importa para a gente, o importante é ter o dado disponível...

Tomare que nada mude no Ministério da Economia e o script sirva para o mês que vem, né PG?

________________

(*) Para ter acesso aos códigos completos do exercício, cadastre-se na nossa Lista VIP aqui.

(**) Inscrições abertas para as Turmas Especiais dos nossos Cursos de Macro Aplicada.

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Criando operações SQL com IA Generativa no R com querychat

No universo da análise de dados, a velocidade para obter respostas é um diferencial competitivo. Frequentemente, uma simples pergunta de negócio — “Qual foi nosso produto mais vendido no último trimestre na região Nordeste?” — inicia um processo que envolve abrir o RStudio, escrever código dplyr ou SQL, executar e, finalmente, obter a resposta. E se pudéssemos simplesmente perguntar isso aos nossos dados em português, diretamente no nosso dashboard Shiny?

Dashboard Financeiro com IA e Shiny Python: Análise de Dados Abertos da CVM

Este artigo apresenta um tutorial completo sobre como construir uma ferramenta de análise financeira de ponta. Utilizando Shiny for Python, demonstramos a automação da coleta de dados das Demonstrações Financeiras Padronizadas (DFP) da CVM e o tratamento dessas informações com Pandas. O ponto alto do projeto é a integração da IA Generativa do Google Gemini, que atua como um assistente de análise, interpretando os dados filtrados pelo usuário e fornecendo insights contábeis e financeiros em tempo real. O resultado é um dashboard dinâmico que democratiza a análise de dados complexos e acelera a tomada de decisão.

Econometria, ML ou IA para previsão da PMS?

Prever a Pesquisa Mensal de Serviços (PMS/IBGE) é um desafio por natureza: trata-se de uma série mensal, sujeita a volatilidade e choques que vão de fatores sazonais a mudanças estruturais no setor. Para enfrentar esse problema, realizamos um exercício de comparação entre três abordagens de modelagem: econometria tradicional (ARIMA), machine learning (XGBoost) e inteligência artificial (TimeGPT).

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.