Como Prever Séries Econômicas no Python?

Introdução

Prever dinâmicas de séries temporais pode ser um desafio, especialmente quando se trata de variáveis macroeconômicas. Isso se deve ao fato de que as relações entre variáveis podem mudar ao longo do tempo, e eventos inesperados, como recessões ou crises financeiras, podem alterar as relações previamente observadas. No entanto, pesquisas demonstraram que métodos de aprendizado de máquina frequentemente superam os modelos econométricos tradicionais na previsão de indicadores como desemprego, inflação e nível de atividade econômica.
Neste estudo, desenvolvemos uma previsão para a variação do desemprego dos EUA em um horizonte de 1 ano, com base no trabalho de Buckmann, Joseph e Robertson (2021). A seguir, apresentamos uma descrição simplificada do método utilizado.
Para obter o código e o tutorial deste exercício faça parte do Clube AM e receba toda semana os códigos em R/Python, vídeos, tutoriais e suporte completo para dúvidas.

Metodologia da Previsão

Dados

Utilizou-se o banco de dados macroeconômicos FRED-MD, que abrange uma série de 127 indicadores econômicos dos EUA, com dados disponíveis desde 1959 até 2019 (ano da amostra utilizada, embora existam dados mais recentes disponíveis).

A seguir, apresentamos uma tabela com as variáveis utilizadas:

Variável Transformação Nome no banco de dados FRED-MD Código Fórmula
Desemprego Diferenças UNRATE 2 ∆xₜ
Título do tesouro de 3 meses Diferenças TB3MS 2 ∆xₜ
Inclinação da curva de juros Diferenças 2 ∆xₜ
Renda pessoal real Diferenças logarítmicas RPI 5 ∆log(xₜ)
Produção industrial Diferenças logarítmicas INDPRO 5 ∆log(xₜ)
Consumo Diferenças logarítmicas DPCERA3M086SBEA 5 ∆log(xₜ)
S&P 500 Diferenças logarítmicas S&P 500 5 ∆log(xₜ)
Empréstimos empresariais Diferenças logarítmicas de segunda ordem BUSLOANS 6 ∆²log(xₜ)
IPC Diferenças logarítmicas de segunda ordem CPIAUCSL 6 ∆²log(xₜ)
Preço do petróleo Diferenças logarítmicas de segunda ordem OILPRICEx 6 ∆²log(xₜ)
Dinheiro M2 Diferenças logarítmicas de segunda ordem M2SL 6 ∆²log(xₜ)

Cada variável no banco de dados FRED-MD possui um nome e um código específico que indica a transformação necessária para tornar a série estacionária. No exercício, extraímos as séries e aplicamos as transformações necessárias.

Um aspecto importante é a escolha da defasagem para cada método de transformação. É possível selecionar diferentes defasagens para cada variável. No nosso caso, utilizamos uma defasagem de 12 meses para o desemprego, pois queremos prever a mudança de um ano para o outro. Para as demais variáveis, optamos por uma defasagem de 3 meses.

Modelos Utilizados para a Previsão

Os seguintes modelos foram empregados para prever as mudanças no desemprego com um ano de antecedência:

  • Regressão Linear
  • Regressão Ridge
  • Regressão Lasso
  • Random Forest
  • Support Vector Regression

Se você tem interesse em aprender a criar previsões de séries econômicas eficientes com o Python, veja nossos cursos de Modelagem e Previsão com Python e Previsão Macroeconômica usando Python e IA.

Após transformar as variáveis (conforme detalhado na tabela) e remover os valores ausentes, a primeira observação no conjunto de treinamento é de fevereiro de 1962. Todos os modelos foram avaliados com base em 346 pontos de dados de previsões entre janeiro de 1990 e novembro de 2019, utilizando uma abordagem de validação cruzada com janela expansiva. Os modelos foram recalibrados a cada 12 meses, permitindo que cada modelo realizasse 12 previsões antes de ser atualizado.Abaixo, o código apresenta os procedimentos para coleta, tratamento, análise e previsão da variável dependente, finalizando com a avaliação da performance dos modelos por meio da métrica MSE.

Visualização de dados

Os gráficos abaixo foram construídos para avaliar a série econômica do desemprego do EUA. Em ordem, temos a série em nível, sem transformações, a decomposição da série, com o objetivo de analisar os componentes sazonais e de tendência. E por fim, os gráficos ACF e PACF da série em diferenças e duas diferenças sazonais.

A partir do entendimento das características da série é possível aperfeiçoar o modelo, adicionando features adicionais para melhorar o poder da previsão.

 

Resultados da Previsão

Abaixo, temos os resultados da previsão de 1 ano e valores observados da mudança em 1 ano do desemprego do EUA, isto é, realiza-se a previsão 1 ano a frente e compara-se com os valores efetivamente observamos. Para confirmar a qualidade dessas previsão realizamos o cálculo da métricas MSE (mean squared-error) da validação cruzada de cada modelo escolhido. Desta forma, podemos ter maiores garantias de qual o melhor modelo a ser escolhido. Na ocasião, temos que RandomForestRegressor foi o que possuiu o melhor desempenho.

Previsão de 1 ano e valores observados em 1 ano do desemprego EUA MSE da Validação Cruzada da Previsão 

Quer aprender mais?

Conheça nossa Formação do Zero à Análise de Dados Econômicos e Financeiros usando Python e Inteligência Artificial. Aprenda do ZERO a coletar, tratar, construir modelos e apresentar dados econômicos e financeiros com o uso de Python e IA.

Referências

Buckmann, M., Joseph, A. e Robertson, H. (2021). Opening the black box: Machine learning interpretability and inference tools with an application to economic forecasting. Data Science for Economics and Finance: Methodologies and Applications(pp. 43-63). Springer International Publishing.

fg-research. An overview of the FRED-MD database. Acesso em: https://fg-research.com/blog/general/posts/fred-md-overview.html#code

McCracken, M. W., & Ng, S. (2016). FRED-MD: A monthly database for macroeconomic research. Journal of Business & Economic Statistics, 34(4), 574-589. doi: 10.1080/07350015.2015.1086655.

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Previsão do Desemprego: Redes Neurais vs. Previsões do Focus

Não é de hoje que técnicas de machine learning vêm sendo usadas para explorar características não lineares de séries temporais (econômicas), especialmente para finalidade de previsão. Como exemplo, apresentamos uma abordagem híbrida do modelo NNAR e comparamos suas previsões com as de mercado, encontrando resultados em linha com a literatura recente.

Incorporando IA na previsão do PIB

O PIB é uma variável econômica complexa e de difícil previsão. Neste artigo, mostramos que unir métodos simples e métodos avançados pode aumentar significativamente a previsibilidade do crescimento da economia.

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.