Coletando dados macroeconômicos em R e Python

O objetivo de lidar com dados Macroeconômicos é verificar o comportamento econômico de um determinado país em um dado período tempo, afim de realizar comparações com a Teoria Macroeconômica, bem como analisar o efeito de políticas econômicas, eventos extremos e a conjuntura econômica como um todo. Os dados também são imprescindíveis para a realização de previsões econômicas. Mas como obter esses dados? Explicamos neste post como é possível obter dados Macroeconômicos a partir do R e do Python, de forma fácil e rápida.

Antes de coletar os dados, devemos entender o que é Macroeconomia e o que são de fato os seus dados.

A macroeconomia estuda o comportamento de variáveis agregadas de uma economia. Portanto, é uma junção de decisões e comportamento de indivíduos e empresas. Sendo assim, essas agregações são criadas a partir da compreensão da lógica econômica, do uso intensivo da estatística e da junção dos dados das decisões de diversos agentes econômicos de um país, construindo o que conhecemos como variáveis macroeconômicas. A partir destas variáveis, é possível testar a teoria macroeconômica através da análise e modelagem dos dados.

E como podemos obter essas agregação de decisões e quais são elas? Na macroeconomia, existem variáveis agregadas que possuem uma  importância relativa maior que as outras para se realizar uma análise de dados, muito devido suas respectivas importância na teoria e seus efeitos sobre a população em geral.

As variáveis mais importantes são: o Produto Interno Bruto, que mensura o total de bens e serviços produzidos em um país, sendo um importante indicador de crescimento econômico; A Inflação, sendo a variação generalizada dos preços da economia e no qual é medida por indicadores, como o IPCA, IGP-m e entre outros; Desemprego; Juros; e entre outras variáveis.

Como exemplos utilizaremos três variáveis macroeconômicas coletadas por meio do R e do Python utilizando duas fontes diferentes: Ipeadata e o Sistema Gerenciador de Séries Temporais do Banco Central , duas fontes importantes para se coletar dados econômicos (mas não os únicos).

Dados Macroeconômicos no R

No R, é possível extrair estes dados utilizando os pacotes {ipeadatar} e {rbcb}, que coletam os dados do Ipeadata e Banco Central, respectivamente. A facilidade dos dois pacotes está no fato de que é extremamente fácil encontrar a séries por meio de funções do pacote, além de que os dados são importados de forma já tratadas, o que facilita a vida do analista de dados econômicos. Abaixo, segue os exemplos.

Coletando o PIB com o {ipeadatar}

Para buscar a série do PIB, devemos buscar a série utilizando a função search_series() afim de buscar o seu código. Através da função, busca-se um termo em comum do nome da série, como se fosse utilizado o buscador do site do Ipeadata. Esse processo pode ser um pouco complicado para iniciantes devido ao  fato de não se conhecer o nome da série a primeiro momento. No caso, buscamos pela série do PIB buscando o termo "PIB - preços de mercado". O que resultará em duas séries, uma medida unidades de R$ e outra em índice. Para obter mais detalhes de cada série, é utilizado a função metadata(), passando o código da série.



Coletando dados do IPCA com o {rbcb}

Para coletar os dados do SGS do Banco Central, o pacote {rbcb} nos auxilia, provendo também uma função que permite procurar o código da série, porém, este sendo um gadjet, criado por um Shiny. Outro método para buscar o código da série é através do site do SGS. No exemplo abaixo, buscamos a série da variação mensal do IPCA, reduzimos  a amostra da série para após de 2005, com o argumento start.

Coletando dados macroeconômicos com o Python

Para coletar os dados de ambas as fontes no Python utilizaremos as bibliotecas {ipeadatapy} e {python-bcb}, que possuem sintaxe similares ao do R. Desta vez, buscaremos os dados do Caged, que mensura o saldo de empregados com carteira assinada em um dado mês, através do Ipeadata e a Taxa Meta Selic, que determina os juros básico da economia brasileira, coletada através do SGS do Banco Central.

Coletando dados do Novo Caged com o {ipeadatapy}

Para buscar uma série do Ipeadata com o {ipeadatapy}, utilizamos a função list_series para obter uma lista de todas as séries do Ipedata com seus respectivos códigos. É possível passar dentro da função um termo para especificar a procura de uma série, no caso, como queremos obter a série do Caged, usamos na função a string 'Caged'.

Com a função describe(), obtemos os metadados da série escolhida, no caso, sendo "Empregados - saldo - novo caged".

Por fim, para importar a série, usamos a função timeseries(), veja que utilizamos o código para buscar a série e também filtramos o ano de interesse utilizando o argumento yearGreaterThan, obtendo os dados após 2021 (não é incluído o ano de 2020).

Coletando dados da Selic com o {python-bcb}

Para obter dados do Banco Central, o {python-bcb} (o {rbcb} do R, porém no Python), pode nos auxiliar. Para obter a série, assim como no {rbcb}, precisamos do código da mesma obtida no Sistema Gerenciador de Séries Temporais. Aqui, também é possível escolher a data de interesse utilizando o argumento start.

 

Quer saber mais?

Veja nossos cursos de R e Python para Análise de dados, onde ensinamos nossos alunos a coletar dados macroeconômicos e financeiros.

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Análise regional do mercado de trabalho com dados do CAGED usando Python

Os microdados dos CAGED fornecem informações detalhadas a nível de cidade, sexo, raça, nível de instrução, idade, salário e outras sobre os trabalhadores formais do Brasil, possibilitando ricas análises regionais de dados. Neste artigo mostramos como acessar, processar e analisar estes dados utilizando o Python.

Transfer Learning: mostrando porque o Python está na ponta do desenvolvimento

A aprendizagem por transferência (transfer learning) é o reuso de um modelo pré-treinado em um novo problema. Portanto, sua utilização torna-se um avanço enorme para a previsão de diferentes tipos de variáveis, principalmente para aquelas ordenadas no tempo. Mostramos nesta postagem o uso do Transfer Learning com o Python para o caso de Séries Temporais.

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.