Coletando dados do IPEADATA com Python

A Coleta de dados econômicos é o primeiro passo para o trabalho de um analista de dados econômicos. Por sorte, o processo é facilitado através da biblioteca ipeadatapy, que permite extrair dados do IPEADATA de forma simples através de sua API. No post de hoje, iremos realizar uma demonstração de como é possível utilizar o pacote.

O Ipeadata é um repositório público que mantém dados de diversas fontes e temas de forma a auxiliar analistas e pesquisadores. É disponibilizado via seu site dados sobre macroeconomia, dados regionais e sociais. O seu site possui uma interface amigável que permite navegar entre os diferentes temas e fontes.

Apesar disto, o processo de extração pode ser melhorado através de sua API, que é disponibilizada pela própria plataforma. Por sorte, foi criado um API Wrapper para o Python, sendo facilitado a extração de dados direto para a linguagem.

Carrega a biblioteca

Lista de séries

O primeiro passo para utilizar o ipeadatapy após sua instalação e importação é conhecer os códigos dos diversos indicadores disponibilizados pelo Ipeadata. Apesar de ser possível conhecer as séries através do site http://www.ipeadata.gov.br/Default.aspx, de fato, conhecer o código da série para a extração não é trivial, sendo assim, utilizamos a função list_series() para obter as informações sobre todas as séries, bem como seus respectivos códigos.

Para obter informações sobre uma série em específico, usamos na função um string buscando um nome em comum dessa. Realizamos o procedimento com o Saldo de Admitidos do novo Caged.

Com o código em mãos, é possível obter maiores informações sobre os metadados da série com a função describe().

Metadados

Um outra função para a busca de informações da série, porém, mais completa, se encontra no metadata(), no qual permite a busca da série, porém, com maiores quantidades de filtros e informações.

Veja que desta vez é retornado 15 colunas, cada uma representando uma descrição sobre as séries. Através das informações das colunas, é possível utilizá-las como argumentos de forma a buscar as séries com as função.

Importação da série

Por fim, para extrair os dados do Ipeadata, utilizamos a função timeseries() em conjunto com o código da série para obter os dados de fato. É importado as colunas com o ano, dia, e mês de cada observação, além do valor da série. A importação também traz a data no índice.

A função também utiliza-se de argumentos que possibilitam ajustar o período de importação dos dados. Com eles, é possível extrair os dados em uma data exata, menor ou maior em relação ao ano, mês e dia escolhidos.

A biblioteca auxilia também no processo de visualização rápida com o método plot(). Abaixo, um exemplo de como utilizar o argumento para o eixo x e o eixo y da função, bem com o tipo do gráfico.

Quer saber mais?

Veja nossos cursos de Python aplicado: R e Python para Economistas, Econometria usando R e Python e Estatística usando R e Python

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Análise de Criptomoedas com Python

Aprenda a estruturar um pipeline de dados financeiros com Python. Ensinamos a construção de um dashboard automatizado para coleta, tratamento e visualização de criptomoedas via API.

Como Construir um Monitor de Política Monetária Automatizado com Python?

Descubra como transformar dados do Banco Central em inteligência de mercado com um Monitor de Política Monetária Automatizado. Neste artigo, exploramos o desenvolvimento de uma solução híbrida (Python + R) que integra análise de sentimento das atas do COPOM, cálculo da Regra de Taylor e monitoramento da taxa Selic. Aprenda a estruturar pipelines ETL eficientes e a visualizar insights econômicos em tempo real através de um dashboard interativo criado com Shiny, elevando o nível das suas decisões de investimento.

Qual o efeito de um choque de juros sobre a inadimplência?

Neste exercício, exploramos a relação dinâmica entre o custo do crédito (juros na ponta) e o risco realizado (taxa de inadimplência) através de uma análise exploratória de dados e modelagem econométrica utilizando a linguagem de programação R.

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.