Como gerar cenários para modelos de previsão no Python?

Gerar cenários para as variáveis exógenas é uma etapa crucial da modelagem preditiva, pois é o que define a trajetória projetada da variável de interesse. Diferentemente dos modelos univariados, aqui precisamos informar os valores futuros das variáveis independentes para prever a variável dependente. Há diversas formas de fazer isso e neste exercício mostramos algumas possibilidades aplicadas à previsão do IPCA usando Python.

Este post faz parte de uma sequência sobre modelagem preditiva de variáveis macroeconômicas usando IA e Python.

Cenarização de variáveis exógenas

Nesta etapa da modelagem preditiva, já coletamos e preparamos os dados, já analisamos as variáveis, treinamos, avaliamos e escolhemos os modelos e, agora, é a hora de gerar previsão. No entanto, devemos fornecer o cenário para as variáveis exógenas do modelo.

Resgatando o exemplo de previsão do IPCA, suponha que você esteja projetando esta variável com base em:

  • Expectativas de inflação
  • Índice de commodities
  • Taxa de câmbio
  • Inércia
  • Dummies e outros

Dessa forma, para cada uma das variáveis acima deve haver valores para o período em que se quer projetar o IPCA. Para as dummies e inércia, é fácil de gerar o cenário, mas para as demais devemos fazer algumas escolhas. Algumas das possibilidades são:

  • Último valor observado constante
  • Média ou mediana histórica
  • Média ou mediana sazonal
  • Evolução linear (ou outra função) do último valor observado até um valor “alvo”
  • Modelos preditivos individuais ou globais para as exógenas
  • Previsões externas
  • Variáveis de alta frequência como proxy

Perceba que são várias as possibilidades, sendo que esta lista não engloba todas, e o analista precisa tomar decisões. No exemplo do modelo de previsão do IPCA, desenvolvido na Análise Macro, priorizamos por usar abordagens simples e automatizáveis, envolvendo:

  • Previsões externas, quando disponíveis
  • Estatísticas históricas/sazonais

Este tipo de abordagem tem funcionando relativamente bem, apesar de sua simplicidade.

Aplicação no Python

Em termos práticos, usamos os dados do Relatório Focus para algumas das variáveis do modelo de previsão e para as demais calculamos alguma estatística histórica/sazonal, replicando para o período de previsão desejado.

Abaixo mostramos como fica a tabela de cenário para as expectativas de inflação:

expec_ipca_top5_curto_prazo
DataReferencia
2024-11-01 0.27
2024-12-01 0.35
2025-01-01 1.00
2025-02-01 0.91
2025-03-01 0.34
2025-04-01 0.47
2025-05-01 0.32
2025-06-01 0.31
2025-07-01 0.24
2025-08-01 0.18
2025-09-01 0.30
2025-10-01 0.41

Já para uma variável em que não há previsões externas facilmente disponíveis, procedimentos estatítiscos são aplicados. Abaixo o exemplo para o preço das commodities:

ic_br
data
2025-04-01 -0.004460
2025-08-01 0.007404
2024-12-01 0.005194
2025-02-01 -0.003234
2025-01-01 0.007846
2025-07-01 -0.004902
2025-06-01 -0.005451
2025-03-01 -0.000405
2025-05-01 0.006529
2024-11-01 0.005847
2025-10-01 0.007650
2025-09-01 0.017643

Seguindo este processo, ao final podemos produzir a previsão para a variável de interesse:

Conclusão

Gerar cenários para as variáveis exógenas é uma etapa crucial da modelagem preditiva, pois é o que define a trajetória projetada da variável de interesse. Diferentemente dos modelos univariados, aqui precisamos informar os valores futuros das variáveis independentes para prever a variável dependente. Há diversas formas de fazer isso e neste exercício mostramos algumas possibilidades aplicadas à previsão do IPCA usando Python.

Tenha acesso ao código e suporte desse e de mais 500 exercícios no Clube AM!

Quer o código desse e de mais de 500 exercícios de análise de dados com ideias validadas por nossos especialistas em problemas reais de análise de dados do seu dia a dia? Além de acesso a vídeos, materiais extras e todo o suporte necessário para você reproduzir esses exercícios? Então, conheça o Clube AM clicando aqui.

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Como sumarizar divulgações trimestrais de empresas usando IA no Python

Neste exercício, iremos utilizar a inteligência artificial no Python para analisar e sumarizar divulgações trimestrais de empresas. Focaremos no uso de ferramentas como Gemini e técnicas de processamento de linguagem natural para extrair informações de documentos PDF relacionados aos relatórios financeiros das empresas.

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.