Previsão do desemprego do EUA utilizando skforecast no Python

Neste exercício, exploramos como o framework da biblioteca `skforecast` do Python pode ser extremamente útil para a previsão de séries temporais econômicas, utilizando como exemplo as variações no desemprego dos EUA ao longo de um horizonte de 1 ano.

Neste exercício, exploramos como o framework da biblioteca skforecast do Python pode ser extremamente útil para a previsão de séries temporais econômicas, utilizando como exemplo as variações no desemprego dos EUA ao longo de um horizonte de 1 ano.

Introdução

Prever dinâmicas de séries temporais pode ser um desafio, especialmente quando se trata de variáveis macroeconômicas. Isso se deve ao fato de que as relações entre variáveis podem mudar ao longo do tempo, e eventos inesperados, como recessões ou crises financeiras, podem alterar as relações previamente observadas. No entanto, pesquisas demonstraram que métodos de aprendizado de máquina frequentemente superam os modelos econométricos tradicionais na previsão de indicadores como desemprego, inflação e nível de atividade econômica.

Neste estudo, desenvolvemos uma previsão para a variação do desemprego dos EUA em um horizonte de 1 ano, com base no trabalho de Buckmann, Joseph e Robertson (2021). A seguir, apresentamos uma descrição simplificada do método utilizado.

Metodologia

Dados

Utilizou-se o banco de dados macroeconômicos FRED-MD, que abrange uma série de 127 indicadores econômicos dos EUA, com dados disponíveis desde 1959 até 2019 (ano da amostra utilizada, embora existam dados mais recentes disponíveis).

A seguir, apresentamos uma tabela com as variáveis utilizadas:

Variável	Transformação	Nome no banco de dados FRED-MD	Código	Fórmula
Desemprego	Diferenças	UNRATE	2	∆xₜ
Título do tesouro de 3 meses	Diferenças	TB3MS	2	∆xₜ
Inclinação da curva de juros	Diferenças	–	2	∆xₜ
Renda pessoal real	Diferenças logarítmicas	RPI	5	∆log(xₜ)
Produção industrial	Diferenças logarítmicas	INDPRO	5	∆log(xₜ)
Consumo	Diferenças logarítmicas	DPCERA3M086SBEA	5	∆log(xₜ)
S&P 500	Diferenças logarítmicas	S&P 500	5	∆log(xₜ)
Empréstimos empresariais	Diferenças logarítmicas de segunda ordem	BUSLOANS	6	∆²log(xₜ)
IPC	Diferenças logarítmicas de segunda ordem	CPIAUCSL	6	∆²log(xₜ)
Preço do petróleo	Diferenças logarítmicas de segunda ordem	OILPRICEx	6	∆²log(xₜ)
Dinheiro M2	Diferenças logarítmicas de segunda ordem	M2SL	6	∆²log(xₜ)

Cada variável no banco de dados FRED-MD possui um nome e um código específico que indica a transformação necessária para tornar a série estacionária. No exercício, extraímos as séries e aplicamos as transformações necessárias.

Um aspecto importante é a escolha da defasagem para cada método de transformação. É possível selecionar diferentes defasagens para cada variável. No nosso caso, utilizamos uma defasagem de 12 meses para o desemprego, pois queremos prever a mudança de um ano para o outro. Para as demais variáveis, optamos por uma defasagem de 3 meses.

Modelos Utilizados

Os seguintes modelos foram empregados para prever as mudanças no desemprego com um ano de antecedência:

SARIMA
Regressão Linear
Regressão Ridge
Regressão Lasso
Random Forest
Support Vector Regression

Após transformar as variáveis (conforme detalhado na tabela) e remover os valores ausentes, a primeira observação no conjunto de treinamento é de fevereiro de 1962. Todos os modelos foram avaliados com base em 346 pontos de dados de previsões entre janeiro de 1990 e novembro de 2019, utilizando uma abordagem de validação cruzada com janela expansiva. Os modelos foram recalibrados a cada 12 meses, permitindo que cada modelo realizasse 12 previsões antes de ser atualizado.

Abaixo, o código apresenta os procedimentos para coleta, tratamento, análise e previsão da variável dependente, finalizando com a avaliação da performance dos modelos por meio da métrica MSE.

Visualização de dados

Resultados

Referências

Buckmann, M., Joseph, A. e Robertson, H. (2021). Opening the black box: Machine learning interpretability and inference tools with an application to economic forecasting. Data Science for Economics and Finance: Methodologies and Applications(pp. 43-63). Springer International Publishing.

fg-research. An overview of the FRED-MD database. Acesso em: https://fg-research.com/blog/general/posts/fred-md-overview.html#code

McCracken, M. W., & Ng, S. (2016). FRED-MD: A monthly database for macroeconomic research. Journal of Business & Economic Statistics, 34(4), 574-589. doi: 10.1080/07350015.2015.1086655.

Quer aprender mais?

Clique aqui para fazer seu cadastro no Boletim AM e baixar o código que produziu este exercício, além de receber novos exercícios com exemplos reais de análise de dados envolvendo as áreas de Data Science, Econometria, Machine Learning, Macroeconomia Aplicada, Finanças Quantitativas e Políticas Públicas diretamente em seu e-mail.

Previsão do desemprego do EUA utilizando skforecast no Python

Introdução

Metodologia

Dados

Modelos Utilizados

Visualização de dados

Resultados

Referências

Quer aprender mais?

Compartilhe esse artigo

Boletim AM

Encontre o seu conteúdo

Categorias

Artigos mais acessados

Agente de IA que coleta dados do BCB e do IBGE sozinho

Como construímos um agente de IA que lê as atas do Copom

Pipeline de relatório de IPCA com agentes no Claude Code

Skills no Claude Code: o que são, onde ficam e como acionar

Context Engineering: o que o modelo lê quando responde

MCP: como conectar o Claude ao mundo real