Restrição de previsões em intervalos no R

Como garantir que uma previsão pontual não ultrapasse um determinado limite? Por exemplo, se a variável de interesse para a previsão é "número de pessoas empregadas", sabemos que ou o valor da série é "zero pessoas empregadas" ou algum valor positivo. Pelo processo gerador dos dados, não faz sentido, neste caso, um modelo gerar previsões negativas. Sendo assim, neste artigo mostramos o caminho para estabelecer restrições em previsões pontuais e as ferramentas da linguagem R para tal.

É comum querer que as previsões sejam positivas ou exigir que elas estejam dentro de algum intervalo especificado, [a, b]. Ambas estas situações são relativamente fáceis de lidar usando transformações.

Restrição positiva

Para impor uma restrição de valores positivos, podemos simplesmente trabalhar na escala logarítmica. Se denotarmos as observações originais como y1, ..., yT e as observações transformadas como w1, ..., wT, então wt = log(yt).

Os logaritmos são úteis porque são interpretáveis: as alterações em um valor em log são alterações relativas (ou percentuais) na escala original. Portanto, se o log de base 10 for usado, um aumento de 1 na escala logarítmica corresponde a uma multiplicação de 10 na escala original. Se algum valor da série original for zero ou negativo, a transformação logarítmica não é possível.

Por exemplo, se a série de interesse para previsão é "número de pessoas empregadas", então a série pode assumir valores iguais a zero ou positivos. Nesse caso, tudo que você precisa fazer é:

  1. Transformar a série original yt para escala logarítmica: wt = log(yt + 1)
  2. Estimar o modelo para wt e gerar as previsões gt
  3. Transformar as previsões gde volta para a escala original: zt = exp(gt) - 1

A transformação log(yt + 1) é comumente usada para superar a limitação das transformações logarítmicas preservando a não negatividade, em dados que contêm zeros. Neste caso são duas transformações, log()+1.

Em um exemplo com dados reais, usando como variável de interesse a taxa de juros SELIC (% a.a., BCB), sobre a qual é razoável pensar que assuma valores positivos em tempos normais da economia brasileira, o resultado da previsão com e sem restrição positiva seria algo parecido com isso:

Neste exemplo fica claro a importância da utilização da restrição: quando a restrição não é imposta o modelo gera previsões negativas (considerando o intervalo de confiança) para a variável de interesse, o que pode ser errôneo a depender da variável.

O procedimento de colocar isso em prática é relativamente simples usando a linguagem R. Você pode, por exemplo, utilizar o pacote {fable} que lida automaticamente com transformações simples como essa do exemplo, além de permitir outros tipos de transformações customizadas.

Saiba mais

Para ter acesso aos códigos desse exercício, torne-se Membro do Clube AM.

Para se aprofundar no assunto confira os cursos aplicados de R e Python da Análise Macro:

 

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Como usar Modelos de Linguagem no R com o pacote {elmer}

Na análise de dados contemporânea, o uso de Modelos de Linguagem (LLMs) vem se consolidando como uma ferramenta poderosa para automatizar e aprimorar tarefas analíticas. Ao integrarmos LLMs a pacotes como o ellmer, podemos ampliar nossas capacidades de extração, interpretação e automação de dados no ambiente R. Neste post, exploramos o papel desses modelos e detalhamos como o ellmer opera dentro do universo da linguagem de programação R.

Introdução ao AutoGen: Agentes Inteligentes na Análise Financeira

O AutoGen é um framework da Microsoft que permite criar agentes de IA colaborativos. Na área financeira, pode automatizar a coleta de dados, cálculos de indicadores e geração de relatórios. Este artigo apresenta os conceitos básicos e um exemplo aplicado a ações de empresas.

Como usar LangGraph e LLMs para prever a inflação no Brasil

Este post apresenta um estudo de caso sobre como utilizar o LangGraph e modelos de linguagem para estruturar um sistema multiagente voltado à previsão do IPCA. O exercício cria um sistema que utiliza-se de personas analíticas que trabalham em paralelo, permitindo validar previsões, calcular métricas de erro e consolidar relatórios automatizados. A abordagem demonstra como fluxos multiagentes podem apoiar a análise econômica, oferecendo múltiplas perspectivas e maior consistência nos resultados.

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.