Como gerar cenários para modelos de previsão no Python?

Gerar cenários para as variáveis exógenas é uma etapa crucial da modelagem preditiva, pois é o que define a trajetória projetada da variável de interesse. Diferentemente dos modelos univariados, aqui precisamos informar os valores futuros das variáveis independentes para prever a variável dependente. Há diversas formas de fazer isso e neste exercício mostramos algumas possibilidades aplicadas à previsão do IPCA usando Python.

Este post faz parte de uma sequência sobre modelagem preditiva de variáveis macroeconômicas usando IA e Python.

Cenarização de variáveis exógenas

Nesta etapa da modelagem preditiva, já coletamos e preparamos os dados, já analisamos as variáveis, treinamos, avaliamos e escolhemos os modelos e, agora, é a hora de gerar previsão. No entanto, devemos fornecer o cenário para as variáveis exógenas do modelo.

Resgatando o exemplo de previsão do IPCA, suponha que você esteja projetando esta variável com base em:

  • Expectativas de inflação
  • Índice de commodities
  • Taxa de câmbio
  • Inércia
  • Dummies e outros

Dessa forma, para cada uma das variáveis acima deve haver valores para o período em que se quer projetar o IPCA. Para as dummies e inércia, é fácil de gerar o cenário, mas para as demais devemos fazer algumas escolhas. Algumas das possibilidades são:

  • Último valor observado constante
  • Média ou mediana histórica
  • Média ou mediana sazonal
  • Evolução linear (ou outra função) do último valor observado até um valor “alvo”
  • Modelos preditivos individuais ou globais para as exógenas
  • Previsões externas
  • Variáveis de alta frequência como proxy

Perceba que são várias as possibilidades, sendo que esta lista não engloba todas, e o analista precisa tomar decisões. No exemplo do modelo de previsão do IPCA, desenvolvido na Análise Macro, priorizamos por usar abordagens simples e automatizáveis, envolvendo:

  • Previsões externas, quando disponíveis
  • Estatísticas históricas/sazonais

Este tipo de abordagem tem funcionando relativamente bem, apesar de sua simplicidade.

Aplicação no Python

Em termos práticos, usamos os dados do Relatório Focus para algumas das variáveis do modelo de previsão e para as demais calculamos alguma estatística histórica/sazonal, replicando para o período de previsão desejado.

Abaixo mostramos como fica a tabela de cenário para as expectativas de inflação:

expec_ipca_top5_curto_prazo
DataReferencia
2024-11-01 0.27
2024-12-01 0.35
2025-01-01 1.00
2025-02-01 0.91
2025-03-01 0.34
2025-04-01 0.47
2025-05-01 0.32
2025-06-01 0.31
2025-07-01 0.24
2025-08-01 0.18
2025-09-01 0.30
2025-10-01 0.41

Já para uma variável em que não há previsões externas facilmente disponíveis, procedimentos estatítiscos são aplicados. Abaixo o exemplo para o preço das commodities:

ic_br
data
2025-04-01 -0.004460
2025-08-01 0.007404
2024-12-01 0.005194
2025-02-01 -0.003234
2025-01-01 0.007846
2025-07-01 -0.004902
2025-06-01 -0.005451
2025-03-01 -0.000405
2025-05-01 0.006529
2024-11-01 0.005847
2025-10-01 0.007650
2025-09-01 0.017643

Seguindo este processo, ao final podemos produzir a previsão para a variável de interesse:

Conclusão

Gerar cenários para as variáveis exógenas é uma etapa crucial da modelagem preditiva, pois é o que define a trajetória projetada da variável de interesse. Diferentemente dos modelos univariados, aqui precisamos informar os valores futuros das variáveis independentes para prever a variável dependente. Há diversas formas de fazer isso e neste exercício mostramos algumas possibilidades aplicadas à previsão do IPCA usando Python.

Tenha acesso ao código e suporte desse e de mais 500 exercícios no Clube AM!

Quer o código desse e de mais de 500 exercícios de análise de dados com ideias validadas por nossos especialistas em problemas reais de análise de dados do seu dia a dia? Além de acesso a vídeos, materiais extras e todo o suporte necessário para você reproduzir esses exercícios? Então, conheça o Clube AM clicando aqui.

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Como fazer previsões para a inflação desagregada medida pelo IPCA?

Neste artigo investigamos se a previsão desagregada da inflação é capaz de gerar previsões mais acuradas do que a previsão agregada. Utilizamos o Índice Nacional de Preços ao Consumidor Amplo (IPCA) como medida de interesse, aplicando um modelo simples e um modelo de passeio aleatório para comparação. Todo o processo pode ser feito de maneira automatizada utilizando a linguagem de programação R.

Qual o melhor modelo para prever a inflação medida pelo IPCA?

Neste exercício, testamos 18 modelos diferentes com um conjunto fixo de regressores para previsão da taxa de inflação, medida pelo IPCA. Implementamos o método da validação cruzada, visando obter resultados robustos para comparação de métricas de performance. Apresentamos os resultados gerais e desagregados por horizontes de previsão, além de automatizar todo o processo utilizando a linguagem Python.

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.