Investigando o problema de fim de amostra na estimativa do Hiato do Produto usando a linguagem R

Resumo

Este exercício examina o problema de fim de amostra, uma limitação comum em estimativas do hiato do produto baseadas em métodos univariados e bidirecionais. A análise é conduzida por meio de estimativas em quase tempo real, implementadas na linguagem de programação R.

Introdução

O termo “problema de fim de amostra” (ou “end-of-sample problem”, em inglês) deriva diretamente da sua natureza: ele ocorre nas extremidades (especialmente no final) de uma série temporal, onde a falta de dados futuros afeta a estimação da tendência e, consequentemente, do hiato do produto (diferença entre o PIB observado e o PIB potencial). O termo reflete o desafio de estimar componentes como a tendência ou o ciclo quando a amostra disponível é limitada, especialmente em métodos que dependem de informações de toda a série.

No contexto do hiato do produto, o problema ganha relevância devido a dois fatores principais:

  • Métodos bidirecionais, como o Filtro de Hodrick-Prescott (HP), utilizam dados passados e futuros para suavizar a tendência em cada ponto t. Próximo ao fim da amostra (ex.: último trimestre disponível), a falta de observações futuras distorce a tendência e o hiato estimados.
  • Aplicações em tempo real ou quase real: Nessas situações, as distorções podem resultar em revisões significativas do hiato à medida que novos dados surgem, criando desafios práticos para formuladores de políticas econômicas.

Diante disso, surgem duas abordagens possíveis: corrigir os métodos suscetíveis ao problema de fim de amostra ou buscar alternativas que o evitem. Uma solução potencial seria incorporar previsões do PIB (de agentes de mercado ou modelos proprietários) para estender a série além do último ponto disponível, aumentando a quantidade de dados futuros. Contudo, essa estratégia introduz incertezas, pois depende da acurácia dessas previsões. Se elas se revelarem imprecisas, as estimativas do hiato serão igualmente comprometidas. Essa abordagem, embora promissora, não será explorada neste exercício, sendo reservada para exercícios futuros.

O foco aqui é analisar o problema de fim de amostra em diferentes métodos de estimação do hiato. Para isso, comparamos estimativas baseadas na amostra completa — abrangendo todo o período disponível — com estimativas em quase tempo real (pseudo-real time). Estas últimas fixam o início da amostra no primeiro trimestre de 1996 e variam o ponto final, trimestre a trimestre, de 2014Q3 até 2024Q3. Por exemplo, o hiato em 2014Q3 é calculado usando apenas os dados do PIB até esse trimestre.

Métodos

Será utilizado quatro métodos de estimação do Hiato do Produto:

  • Tendência Quadrática
  • Tendência Não Paramétrica
  • Filtro Hodrick-Prescott (HP)
  • Filtro de Hamilton

Abaixo, seguem as metodologias:

1. Tendência Quadrática

Este método assume que o PIB potencial segue uma função quadrática no tempo, modelada por uma regressão polinomial de segundo grau. É simples e amplamente usado, mas pode ser inflexível para capturar mudanças estruturais ou não linearidades em séries econômicas.

    \[y_t = \beta_0 + \beta_1 t + \beta_2 t^2 + \epsilon_t\]

onde:
- y_t : PIB observado no tempo t,
- \beta_0, \beta_1, \beta_2 : coeficientes estimados por regressão de mínimos quadrados ordinários (OLS),
- \epsilon_t : hiato ou componente cíclico.

O hiato é dado por:

    \[\text{Hiato} = (y_t - (\beta_0 + \beta_1 t + \beta_2 t^2)) \times 100\]

(em percentual).

Sofre do problema de fim de amostra, pois os coeficientes são estimados com toda a série, e pontos finais podem distorcer a tendência devido a choques recentes ou falta de dados futuros.

Tendência Não Paramétrica (Smoothing por Regressão Localmente Ponderada)

Este método utiliza uma suavização não paramétrica por regressão localmente ponderada (como o LOESS, Local Regression). A tendência y_t^s é calculada como uma previsão ponderada usando um subconjunto de observações próximas a t, com pesos decrescentes baseados na distância temporal.

Para cada t, seleciona um subconjunto de índices

    \[t_- = \max(1, t - k)\]

até

    \[t_+ = \min(t + k, T)\]

onde

    \[k = [(T \times \text{bwidth}) - 0.5]\]

T é o tamanho da série, e \text{bwidth} = 0.4.

Os pesos w_j para cada observação j (de t_- a t_+ ) seguem uma função trícube:

    \[w_j = \left( 1 - \left( \frac{|t_j - t|}{\Delta} \right)^3 \right)^3, \quad \Delta = 1.0001 \times \max(t_+ - t, t - t_-)\]

onde t_j é o índice da observação j.

A tendência suavizada y_t^s é a previsão ponderada desse subconjunto. O ciclo é dado por:

    \[\text{Ciclo} = y_t - y_t^s.\]

O hiato é calculado como:

    \[\text{Hiato} = (y_t - y_t^s) \times 100\]

(em percentual).

Embora flexível, pode sofrer de problemas de fim de amostra se a janela de suavização for afetada pela falta de dados nas extremidades, embora menos intensamente que métodos paramétricos rígidos.

3. Filtro Hodrick-Prescott (HP)

Este é um método bidirecional amplamente utilizado para decompor séries temporais em tendência e ciclo, minimizando a soma dos quadrados dos desvios do PIB em relação à tendência, penalizando variações bruscas na tendência.

    \[\min_{\tau_t} \sum_{t=1}^T (y_t - \tau_t)^2 + \lambda \sum_{t=2}^{T-1} \left( (\tau_{t+1} - \tau_t) - (\tau_t - \tau_{t-1}) \right)^2\]

onde:
- y_t : PIB observado,
- \tau_t : tendência estimada,
- \lambda : parâmetro de suavidade (geralmente 1600 para dados trimestrais).

O primeiro termo minimiza o erro entre o PIB e a tendência, e o segundo penaliza mudanças abruptas na tendência.

O hiato é dado por:

    \[\text{Hiato} = (y_t - \tau_t) \times 100\]

Sofre do problema de fim de amostra, pois é bidirecional, dependendo de dados futuros para suavizar a tendência. Perto do fim da amostra, a ausência de dados futuros distorce as estimativas, levando a revisões significativas em tempo real.

4. Filtro de Hamilton

Proposto por James D. Hamilton como alternativa ao Filtro HP, este método é unidirecional e baseado em regressão linear, prevendo y_{t+h} com base em p valores passados de y_t. É projetado para evitar os problemas do HP, incluindo o de fim de amostra.

    \[y_{t+h} = \beta_0 + \beta_1 y_t + \beta_2 y_{t-1} + \cdots + \beta_p y_{t-p+1} + \epsilon_t\]

onde:

- h : horizonte de previsão (ex.: 8 trimestres para dados trimestrais),
- p : número de lags (ex.: 4 trimestres),
- \beta_0, \beta_1, ..., \beta_p : coeficientes estimados por OLS.

A tendência em t é \hat{y}_{t+h}, e o ciclo é:

    \[\epsilon_t = y_{t+h} - \hat{y}_{t+h}\]

O hiato é:

    \[\text{Hiato} = (y_t - \text{PIB potencial}) \times 100\]

onde o PIB potencial é derivado da tendência ajustada.

Diferente do Filtro HP e outras estimativas, o Filtro de Hamilton é unidirecional, usando apenas dados passados e presentes até t para estimar a tendência. Isso evita distorções nas extremidades, pois não depende de informações futuras. No entanto, há um atraso de h períodos para calcular o ciclo, pois requer y_{t+h} para o erro \epsilon_t. Em tempo real ou quase real, isso é uma limitação previsível, mas não uma distorção, tornando-o uma solução superior para evitar o problema de fim de amostra do HP.

Portanto, para a estimativa em quase tempo real, esperamos que o Filtro de Hamilton não tenha uma diferença considerável em relação a estimativa da amostra completa.

Estimativa

Utilizamos dados da série encadeada do índice de volume trimestral do PIB com ajuste sazonal, abrangendo o período de 1996Q1 até 2024Q3, obtidos no SIDRA/IBGE. O PIB é transformado em logaritmo para ser utilizado como entrada nos métodos de estimação. Após a aplicação dos métodos, a série tendencial é obtida revertendo a transformação logarítmica por meio da exponenciação, e o hiato do produto é calculado.

A análise é realizada em dois cenários: (i) estimando a tendência com a amostra completa e (ii) estimando em quase tempo real, onde os dados são considerados apenas até 2014Q3 inicialmente, e a cada nova observação disponível, o hiato é recalculado.

É importante destacar que o termo “quase tempo real” é utilizado porque os cálculos se baseiam na última vintage disponível dos dados do PIB. Caso a análise fosse feita com a vintage exata de cada momento histórico (ou seja, sem considerar as revisões subsequentes do IBGE), seria chamada de estimação em tempo real. Como o IBGE frequentemente revisa os valores do PIB, a série pode variar conforme o momento da coleta dos dados. Dessa forma, ao comparar estimativas baseadas em diferentes vintages, os valores do hiato podem diferir, justificando o uso do termo “quase tempo real”.

Os resultados estão apresentados na figura abaixo. Nota-se uma diferença considerável entre as estimativas de hiato, sendo a menor discrepância observada no Filtro de Hamilton, pois esse método foi projetado para minimizar o problema de fim de amostra.

Nota-se também a trajetória comum das séries ao fim da amostra, evidenciando que de fato existe o problema.

Apesar de utilizarmos apenas quatro medidas univariadas — três das quais, por construção, são suscetíveis ao problema de fim de amostra —, observa-se que essa limitação impacta significativamente a estimativa do hiato, especialmente em um contexto de estimação em tempo real. Isso ressalta a necessidade de ajustes ou da adoção de metodologias que mitiguem esse problema.

Referências

BANCO CENTRAL DO BRASIL. Relatório de Inflação, junho de 2024. Brasília: Banco Central do Brasil, 2024. Boxe “Medidas de hiato do produto no Brasil”, p. 10. Disponível em: https://www.bcb.gov.br/content/ri/relatorioinflacao/202406/ri202406b10p.pdf. Acesso em: 24 fev. 2025.

HAMILTON, J.D. Why you should never use the Hodrick-Prescott filter. Review of Economics and Statistics, v. 81, n. 1, p. 1-17, 1999.

HODRICK, R.J.; PRESCOTT, E.C. Postwar U.S. business cycles: An empirical investigation. Journal of Money, Credit, and Banking, v. 29, n. 1, p. 1-16, 1997.

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

DeepSeek: como usar a IA chinesa no Python

Na corrida da IA, novas ferramentas e modelos são lançados quase que diariamente. Neste artigo mostramos como a empresa chinesa DeepSeek tem competido neste mercado através do modelo R1 e damos um exemplo de utilização em Python.

Como incorporar mudanças climáticas na previsão da inflação?

Será que o El Niño impacta o preço do feijão com arroz no prato dos brasileiros? Para responder esta pergunta estimamos um modelo VAR(p) utilizando dados do Oceanic Niño Index (ONI), investigamos a decomposição histórica dos choques estruturais e incorporamos o indicador de impacto climático nas previsões da inflação.

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.