Modelos ARIMA com o Python

Modelos univariados são bastante utilizados para fins de modelagem e previsão de um amplo conjunto de variáveis. Nesse post, vamos ilustrar a aplicação desses modelos sobre a inflação brasileira medida pelo IPCA utilizando modelos do tipo ARIMA

Criando um Modelo AutoArima no Python

Para criar uma previsão do IPCA usando o Python, devemos proceder através do processo de Análise de Dados, seguindo os seguintes passos:

  • Coleta do IPCA: utilizaremos a biblioteca python-bcb para retirar os dados do IPCA mensal direto do SGS, por meio do código 433;
  • Tratamento e Data Wrangling: Para fins de criação e utilização da biblioteca statsforecast devemos formatar os dados em uma forma ideal, bem como realizar a separação de dados de treino e teste;
  • Análise exploratória: Averiguar por meio de estatísticas descritivas e gráficos o comportamento do IPCA;
  • Modelagem e Previsão: criação do modelo e previsão.

Começamos com o processo de coleta dos dados e tratamento dos dados do IPCA, como demonstrado no código abaixo:


# Coleta do IPCA
ipca_raw = sgs.get(('y', 433), start = '2004-01-01')
# Tratamento do IPCA
ipca = (
    ipca_raw
    .reset_index()
    .assign(unique_id = 'ipca')
    .rename(columns = {'Date' : 'ds' })
)

O objetivo portanto, a partir da coleta e tratamento dos dados, será o de separar a amostra da série do IPCA mensal em teste e treino, utilizar a biblioteca statsforecast para rodar um AutoArima nos dados de testes.

Para entender todo o processo listado acima, com os códigos e video-aula, faça parte do Clube AM, o repositório de código da Análise Macro, contendo exercícios semanais de R e Python.

Vemos o resultado da previsão do AutoArima comparado com os dados de teste:

________________________________________________

Quer se aprofundar no assunto?

Alunos da trilha de Ciência de dados para Economia e Finanças podem aprender a como construir projetos que envolvem dados reais usando modelos econométricos e de Machine Learning com o R.

Referências
Hyndman, R.J., & Athanasopoulos, G. (2021) Forecasting: principles and practice, 3rd edition, OTexts: Melbourne, Australia. OTexts.com/fpp3.

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Transfer Learning: mostrando porque o Python está na ponta do desenvolvimento

A aprendizagem por transferência (transfer learning) é o reuso de um modelo pré-treinado em um novo problema. Portanto, sua utilização torna-se um avanço enorme para a previsão de diferentes tipos de variáveis, principalmente para aquelas ordenadas no tempo. Mostramos nesta postagem o uso do Transfer Learning com o Python para o caso de Séries Temporais.

Criando Tabelas com o Python: mostrando o poder da linguagem sobre o Excel

Nos dias atuais, pessoas que trabalham com dados estão constantemente confrontados com um dilema: criar uma tabela não tão genial no Excel ou manter em um formato ainda pior, como um dataframe, mas mantendo a flexibilidade de obtenção dos dados. Podemos resolver esse grande problema, unindo a flexibilidade e beleza ao usar a biblioteca great_tables do Python.

Análise do Censo Demográfico com o R

Como podemos analisar dados do Censo Demográfico para produzir pesquisas e implementar políticas públicas? Mostramos nesta postagem o resultado de uma breve análise dos dados preliminares do Censo Demográfico de 2022 usando o R.

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.