Previsão da Taxa de Desocupação Brasileira com Python

Previsão de séries econômicas com Python: um exemplo prático com VECM e desemprego

Existem inúmeras formas de prever uma série econômica. E isso pode deixar qualquer iniciante confuso. As perguntas aparecem logo de cara: quais variáveis usar? Qual o melhor modelo? Econométrico? Estatístico? Machine Learning? Como medir a acurácia das previsões?

Neste post, não vamos apresentar um tutorial completo. Para isso, temos nossos cursos de Modelagem e Previsão com Python e Previsão Macroeconômica usando Python e IA, onde cobrimos tudo em profundidade. Aqui, nosso objetivo é simples: mostrar como estruturar uma previsão econômica usando Python e um modelo econométrico, o VECM (Modelos de Correção de Erro Vetorial), aplicado à taxa de desemprego no Brasil.

Para obter o código e o tutorial deste exercício faça parte do Clube AM e receba toda semana os códigos em R/Python, vídeos, tutoriais e suporte completo para dúvidas.

Etapas da modelagem da Previsão

Começamos com uma escolha pré-definida de variáveis explicativas. Em seguida, fazemos a visualização dos dados, estimamos o modelo, avaliamos os resíduos (autocorrelação e normalidade) e validamos se a especificação está adequada. Depois, realizamos a previsão dentro da amostra e, por fim, a previsão fora da amostra.

Não temos aqui a intenção de comparar acurácia entre modelos. Nosso foco é mostrar que é possível criar um ambiente de previsão econométrica no Python de forma simples e eficaz.

Quais dados usamos para a previsão da taxa de desemprego?

Para esse exercício, usamos dados mensais de março de 2012 até janeiro de 2025, totalizando 155 observações. As variáveis são:

  • Taxa de desocupação (IBGE/Sidra);

  • Indicador Antecedente de Emprego (IAEmp), com ajuste sazonal (FGV);

  • Indicador de Incerteza da Economia Brasileira (IIE-Br) (FGV);

  • Índice de Atividade Econômica (IBC-Br) com ajuste sazonal (BCB);

  • Taxa de juros Selic acumulada no mês anualizada (BCB).

A coleta foi feita com bibliotecas específicas: sidrapy para a taxa de desocupação, python-bcb para os dados do Banco Central, e os dados da FGV foram baixados manualmente e importados via CSV no Python.

Abaixo a tabela com as primeiras observações dos dados capturados.

Visualizando as séries para previsão

Ao visualizar a taxa de desemprego, é clara a existência de tendência estrutural em alguns períodos, como alta pós-2015 e queda no pós-pandemia. Observa-se também sazonalidade recorrente, um padrão típico de séries mensais.

variável alvo da previsão: taxa de desocupação brasileira

As demais variáveis também apresentam comportamento interessante. Por exemplo, o IIE-Br, IAEmp e o IBC-Br acompanham os movimentos da taxa de desemprego durante crises. O primeiro e segundo reflete o humor empresarial e o segundo a atividade econômica geral. Já a taxa Selic atua como freio ou acelerador da economia, influenciando a geração de empregos. O IAEmp funciona como indicador antecedente, ajudando a prever os movimentos futuros do desemprego.

variáveis para a previsão da taxa de desocupação

Estimando o modelo VECM no Python

Antes de estimar um VECM é importante saber sobre algumas questões.

Todas as séries são integradas de ordem 1 (I(1)), ou seja, não estacionárias em nível, mas estacionárias em primeira diferença. Isso exige que verifiquemos a cointegração, já que as variáveis podem ter relação de longo prazo. A modelagem via VECM captura essas dinâmicas, sendo ideal para esse tipo de dado. Toda essa análise é verificado no código de criação do exercício.

Estimamos um modelo VECM com rank de cointegração 1 e 1 defasagem. Além disso, adicionamos dummies sazonais para capturar a sazonalidade da taxa de desemprego. O modelo é todo criado a partir dos módulos de séries temporais da biblioteca statsmodels .

Avaliamos os resíduos por meio de gráficos de autocorrelação e histogramas. O diagnóstico mostrou baixa autocorrelação e resíduos bem comportados, indicando boa especificação do modelo.

autocorrelação dos resíduos do modelo VECM

Histograma dos resíduos do modelo VECM

Previsão dentro da amostra

Realizamos a previsão para os últimos 12 meses da série. Isso permite comparar os valores previstos com os valores reais, avaliando a performance do modelo. Os intervalos de confiança ajudam a entender a incerteza das previsões.Previsão dentro da amostra da taxa de desocupação brasileira

Claro, o ideal seria comparar diferentes modelos e combinações de variáveis. Mas, para fins didáticos, essa estrutura já entrega muito. Quem quiser se aprofundar, pode conferir nossos cursos de previsão.

Previsão fora da amostra

Com o modelo validado, projetamos a série de desemprego para os 12 meses seguintes. O resultado aponta uma leve inflexão de curto prazo e possível queda futura. Como esperado, o intervalo de confiança se alarga com o horizonte de previsão, refletindo a incerteza.

Previsão fora da amostra da taxa de desocupação brasileira

Também prevemos o comportamento futuro das demais variáveis do sistema, o que ajuda a entender como cada componente afeta a taxa de desemprego ao longo do tempo.Previsão das séries econômicas no sistema VECM

Considerações Finais

Prever séries econômicas pode parecer complexo à primeira vista. Mas com o uso correto das bibliotecas do Python, um bom entendimento dos dados e um modelo adequado como o VECM, é possível montar um pipeline de previsão eficiente, interpretável e aplicável à realidade econômica.

Quer aprender mais?

Conheça nossa Formação do Zero à Análise de Dados Econômicos e Financeiros usando Python e Inteligência Artificial. Aprenda do ZERO a coletar, tratar, construir modelos e apresentar dados econômicos e financeiros com o uso de Python e IA.

Referências

SEABOLD, Skipper; PERKTOLD, Josef. Vector Autoregressions (VAR) and Vector Error Correction Models (VECM). Statsmodels, 2024. Disponível em: https://www.statsmodels.org/stable/vector_ar.html#vector-error-correction-models-vecm. Acesso em: 9 abr. 2025.

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Previsão do Desemprego: Redes Neurais vs. Previsões do Focus

Não é de hoje que técnicas de machine learning vêm sendo usadas para explorar características não lineares de séries temporais (econômicas), especialmente para finalidade de previsão. Como exemplo, apresentamos uma abordagem híbrida do modelo NNAR e comparamos suas previsões com as de mercado, encontrando resultados em linha com a literatura recente.

Incorporando IA na previsão do PIB

O PIB é uma variável econômica complexa e de difícil previsão. Neste artigo, mostramos que unir métodos simples e métodos avançados pode aumentar significativamente a previsibilidade do crescimento da economia.

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.