Coletando dados macroeconômicos em R e Python

O objetivo de lidar com dados Macroeconômicos é verificar o comportamento econômico de um determinado país em um dado período tempo, afim de realizar comparações com a Teoria Macroeconômica, bem como analisar o efeito de políticas econômicas, eventos extremos e a conjuntura econômica como um todo. Os dados também são imprescindíveis para a realização de previsões econômicas. Mas como obter esses dados? Explicamos neste post como é possível obter dados Macroeconômicos a partir do R e do Python, de forma fácil e rápida.

Antes de coletar os dados, devemos entender o que é Macroeconomia e o que são de fato os seus dados.

A macroeconomia estuda o comportamento de variáveis agregadas de uma economia. Portanto, é uma junção de decisões e comportamento de indivíduos e empresas. Sendo assim, essas agregações são criadas a partir da compreensão da lógica econômica, do uso intensivo da estatística e da junção dos dados das decisões de diversos agentes econômicos de um país, construindo o que conhecemos como variáveis macroeconômicas. A partir destas variáveis, é possível testar a teoria macroeconômica através da análise e modelagem dos dados.

E como podemos obter essas agregação de decisões e quais são elas? Na macroeconomia, existem variáveis agregadas que possuem uma  importância relativa maior que as outras para se realizar uma análise de dados, muito devido suas respectivas importância na teoria e seus efeitos sobre a população em geral.

As variáveis mais importantes são: o Produto Interno Bruto, que mensura o total de bens e serviços produzidos em um país, sendo um importante indicador de crescimento econômico; A Inflação, sendo a variação generalizada dos preços da economia e no qual é medida por indicadores, como o IPCA, IGP-m e entre outros; Desemprego; Juros; e entre outras variáveis.

Como exemplos utilizaremos três variáveis macroeconômicas coletadas por meio do R e do Python utilizando duas fontes diferentes: Ipeadata e o Sistema Gerenciador de Séries Temporais do Banco Central , duas fontes importantes para se coletar dados econômicos (mas não os únicos).

Dados Macroeconômicos no R

No R, é possível extrair estes dados utilizando os pacotes {ipeadatar} e {rbcb}, que coletam os dados do Ipeadata e Banco Central, respectivamente. A facilidade dos dois pacotes está no fato de que é extremamente fácil encontrar a séries por meio de funções do pacote, além de que os dados são importados de forma já tratadas, o que facilita a vida do analista de dados econômicos. Abaixo, segue os exemplos.

Coletando o PIB com o {ipeadatar}

Para buscar a série do PIB, devemos buscar a série utilizando a função search_series() afim de buscar o seu código. Através da função, busca-se um termo em comum do nome da série, como se fosse utilizado o buscador do site do Ipeadata. Esse processo pode ser um pouco complicado para iniciantes devido ao  fato de não se conhecer o nome da série a primeiro momento. No caso, buscamos pela série do PIB buscando o termo "PIB - preços de mercado". O que resultará em duas séries, uma medida unidades de R$ e outra em índice. Para obter mais detalhes de cada série, é utilizado a função metadata(), passando o código da série.



Coletando dados do IPCA com o {rbcb}

Para coletar os dados do SGS do Banco Central, o pacote {rbcb} nos auxilia, provendo também uma função que permite procurar o código da série, porém, este sendo um gadjet, criado por um Shiny. Outro método para buscar o código da série é através do site do SGS. No exemplo abaixo, buscamos a série da variação mensal do IPCA, reduzimos  a amostra da série para após de 2005, com o argumento start.

Coletando dados macroeconômicos com o Python

Para coletar os dados de ambas as fontes no Python utilizaremos as bibliotecas {ipeadatapy} e {python-bcb}, que possuem sintaxe similares ao do R. Desta vez, buscaremos os dados do Caged, que mensura o saldo de empregados com carteira assinada em um dado mês, através do Ipeadata e a Taxa Meta Selic, que determina os juros básico da economia brasileira, coletada através do SGS do Banco Central.

Coletando dados do Novo Caged com o {ipeadatapy}

Para buscar uma série do Ipeadata com o {ipeadatapy}, utilizamos a função list_series para obter uma lista de todas as séries do Ipedata com seus respectivos códigos. É possível passar dentro da função um termo para especificar a procura de uma série, no caso, como queremos obter a série do Caged, usamos na função a string 'Caged'.

Com a função describe(), obtemos os metadados da série escolhida, no caso, sendo "Empregados - saldo - novo caged".

Por fim, para importar a série, usamos a função timeseries(), veja que utilizamos o código para buscar a série e também filtramos o ano de interesse utilizando o argumento yearGreaterThan, obtendo os dados após 2021 (não é incluído o ano de 2020).

Coletando dados da Selic com o {python-bcb}

Para obter dados do Banco Central, o {python-bcb} (o {rbcb} do R, porém no Python), pode nos auxiliar. Para obter a série, assim como no {rbcb}, precisamos do código da mesma obtida no Sistema Gerenciador de Séries Temporais. Aqui, também é possível escolher a data de interesse utilizando o argumento start.

 

Quer saber mais?

Veja nossos cursos de R e Python para Análise de dados, onde ensinamos nossos alunos a coletar dados macroeconômicos e financeiros.

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Criando um Dashboard de análise de Ações no Python

Um Dashboard é um painel de controle que consolida uma variedade de informações sobre um determinado objeto de estudo em um ou mais painéis. Ele simplifica significativamente o processo de análise de dados, oferecendo uma visão global e fácil de entender. Uma maneira simples de construir um Dashboard para acompanhar uma ação específica é utilizando duas ferramentas: Quarto e Python. Neste post, mostramos o resultado da criação de um Dashboard de Ação.

Analisando séries temporais no Python e esquecendo de vez o Excel

Séries temporais representam uma disciplina extremamente importante em diversas áreas, principalmente na economia e na ciência de dados. Mas, afinal, como lidar com esses dados que se apresentam ao longo do tempo? Neste exercício, demonstraremos como compreender uma série temporal e como o Python se destaca como uma das melhores ferramentas para analisar esse tipo de dado.

Cálculo do Retorno Econômico de uma Política Pública

Como podemos traduzir os efeitos de uma política pública para valores monetários? Essa é uma tarefa árdua que requer algumas premissas, entretanto, com métodos bem definidos, é possível obter estimativas precisas dos ganhos e os gastos de uma política pública.

Neste exercício, demonstramos tal método usando a política hipotética "Mãe Paranense”, um conjunto de ações que visam reduzir a mortalidade materna e infantil no estado. Usamos a linguagem R como ferramenta para analisar os dados.

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.