Como gerar cenários para modelos de previsão no Python?

Gerar cenários para as variáveis exógenas é uma etapa crucial da modelagem preditiva, pois é o que define a trajetória projetada da variável de interesse. Diferentemente dos modelos univariados, aqui precisamos informar os valores futuros das variáveis independentes para prever a variável dependente. Há diversas formas de fazer isso e neste exercício mostramos algumas possibilidades aplicadas à previsão do IPCA usando Python.

Este post faz parte de uma sequência sobre modelagem preditiva de variáveis macroeconômicas usando IA e Python.

Cenarização de variáveis exógenas

Nesta etapa da modelagem preditiva, já coletamos e preparamos os dados, já analisamos as variáveis, treinamos, avaliamos e escolhemos os modelos e, agora, é a hora de gerar previsão. No entanto, devemos fornecer o cenário para as variáveis exógenas do modelo.

Resgatando o exemplo de previsão do IPCA, suponha que você esteja projetando esta variável com base em:

  • Expectativas de inflação
  • Índice de commodities
  • Taxa de câmbio
  • Inércia
  • Dummies e outros

Dessa forma, para cada uma das variáveis acima deve haver valores para o período em que se quer projetar o IPCA. Para as dummies e inércia, é fácil de gerar o cenário, mas para as demais devemos fazer algumas escolhas. Algumas das possibilidades são:

  • Último valor observado constante
  • Média ou mediana histórica
  • Média ou mediana sazonal
  • Evolução linear (ou outra função) do último valor observado até um valor “alvo”
  • Modelos preditivos individuais ou globais para as exógenas
  • Previsões externas
  • Variáveis de alta frequência como proxy

Perceba que são várias as possibilidades, sendo que esta lista não engloba todas, e o analista precisa tomar decisões. No exemplo do modelo de previsão do IPCA, desenvolvido na Análise Macro, priorizamos por usar abordagens simples e automatizáveis, envolvendo:

  • Previsões externas, quando disponíveis
  • Estatísticas históricas/sazonais

Este tipo de abordagem tem funcionando relativamente bem, apesar de sua simplicidade.

Aplicação no Python

Em termos práticos, usamos os dados do Relatório Focus para algumas das variáveis do modelo de previsão e para as demais calculamos alguma estatística histórica/sazonal, replicando para o período de previsão desejado.

Abaixo mostramos como fica a tabela de cenário para as expectativas de inflação:

expec_ipca_top5_curto_prazo
DataReferencia
2024-11-01 0.27
2024-12-01 0.35
2025-01-01 1.00
2025-02-01 0.91
2025-03-01 0.34
2025-04-01 0.47
2025-05-01 0.32
2025-06-01 0.31
2025-07-01 0.24
2025-08-01 0.18
2025-09-01 0.30
2025-10-01 0.41

Já para uma variável em que não há previsões externas facilmente disponíveis, procedimentos estatítiscos são aplicados. Abaixo o exemplo para o preço das commodities:

ic_br
data
2025-04-01 -0.004460
2025-08-01 0.007404
2024-12-01 0.005194
2025-02-01 -0.003234
2025-01-01 0.007846
2025-07-01 -0.004902
2025-06-01 -0.005451
2025-03-01 -0.000405
2025-05-01 0.006529
2024-11-01 0.005847
2025-10-01 0.007650
2025-09-01 0.017643

Seguindo este processo, ao final podemos produzir a previsão para a variável de interesse:

Conclusão

Gerar cenários para as variáveis exógenas é uma etapa crucial da modelagem preditiva, pois é o que define a trajetória projetada da variável de interesse. Diferentemente dos modelos univariados, aqui precisamos informar os valores futuros das variáveis independentes para prever a variável dependente. Há diversas formas de fazer isso e neste exercício mostramos algumas possibilidades aplicadas à previsão do IPCA usando Python.

Tenha acesso ao código e suporte desse e de mais 500 exercícios no Clube AM!

Quer o código desse e de mais de 500 exercícios de análise de dados com ideias validadas por nossos especialistas em problemas reais de análise de dados do seu dia a dia? Além de acesso a vídeos, materiais extras e todo o suporte necessário para você reproduzir esses exercícios? Então, conheça o Clube AM clicando aqui.

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Determinantes do Preço do Ouro: VAR + Linguagem R

Este artigo realiza uma análise econométrica para investigar os determinantes dinâmicos do preço do ouro. Utilizando um modelo Vetorial Autorregressivo (VAR) em R, examinamos o impacto de variáveis como o dólar (DXY), a curva de juros e a incerteza global. Os resultados mostram que um fortalecimento inesperado do dólar tem um efeito negativo e significativo no curto prazo sobre os retornos do ouro, embora a maior parte de sua variância seja explicada por fatores intrínsecos ao seu próprio mercado.

Existe correlação entre vagas de emprego e o S&P 500?

O que explica a divergência entre S&P 500 e vagas de emprego? Seria o impacto da IA ou a política monetária? Utilizando um análise dados e modelo VAR e testes de causalidade de Granger usando a linguagem de programação R, investigamos a relação e o motivo por trás da "boca de jacaré".

Como medir a comunicação do Banco Central?

Descubra como o índice ALT transforma a linguagem do Banco Central em dados analisáveis, permitindo investigar como o tom das atas do COPOM varia conforme o cenário macroeconômico e as decisões de política monetária.

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.