Restrição de previsões em intervalos no R

Como garantir que uma previsão pontual não ultrapasse um determinado limite? Por exemplo, se a variável de interesse para a previsão é "número de pessoas empregadas", sabemos que ou o valor da série é "zero pessoas empregadas" ou algum valor positivo. Pelo processo gerador dos dados, não faz sentido, neste caso, um modelo gerar previsões negativas. Sendo assim, neste artigo mostramos o caminho para estabelecer restrições em previsões pontuais e as ferramentas da linguagem R para tal.

É comum querer que as previsões sejam positivas ou exigir que elas estejam dentro de algum intervalo especificado, [a, b]. Ambas estas situações são relativamente fáceis de lidar usando transformações.

Restrição positiva

Para impor uma restrição de valores positivos, podemos simplesmente trabalhar na escala logarítmica. Se denotarmos as observações originais como y1, ..., yT e as observações transformadas como w1, ..., wT, então wt = log(yt).

Os logaritmos são úteis porque são interpretáveis: as alterações em um valor em log são alterações relativas (ou percentuais) na escala original. Portanto, se o log de base 10 for usado, um aumento de 1 na escala logarítmica corresponde a uma multiplicação de 10 na escala original. Se algum valor da série original for zero ou negativo, a transformação logarítmica não é possível.

Por exemplo, se a série de interesse para previsão é "número de pessoas empregadas", então a série pode assumir valores iguais a zero ou positivos. Nesse caso, tudo que você precisa fazer é:

  1. Transformar a série original yt para escala logarítmica: wt = log(yt + 1)
  2. Estimar o modelo para wt e gerar as previsões gt
  3. Transformar as previsões gde volta para a escala original: zt = exp(gt) - 1

A transformação log(yt + 1) é comumente usada para superar a limitação das transformações logarítmicas preservando a não negatividade, em dados que contêm zeros. Neste caso são duas transformações, log()+1.

Em um exemplo com dados reais, usando como variável de interesse a taxa de juros SELIC (% a.a., BCB), sobre a qual é razoável pensar que assuma valores positivos em tempos normais da economia brasileira, o resultado da previsão com e sem restrição positiva seria algo parecido com isso:

Neste exemplo fica claro a importância da utilização da restrição: quando a restrição não é imposta o modelo gera previsões negativas (considerando o intervalo de confiança) para a variável de interesse, o que pode ser errôneo a depender da variável.

O procedimento de colocar isso em prática é relativamente simples usando a linguagem R. Você pode, por exemplo, utilizar o pacote {fable} que lida automaticamente com transformações simples como essa do exemplo, além de permitir outros tipos de transformações customizadas.

Saiba mais

Para ter acesso aos códigos desse exercício, torne-se Membro do Clube AM.

Para se aprofundar no assunto confira os cursos aplicados de R e Python da Análise Macro:

 

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Resultado IPCA-15 - Novembro/2024

A Análise Macro apresenta os resultados do IPCA-15 de Novembro de 2024, com gráficos elaborados em Python para coleta, tratamento e visualização de dados. Todo o conteúdo, disponível exclusivamente no Clube AM, foi desenvolvido com base nos métodos ensinados nos cursos da Análise Macro, permitindo aos assinantes acesso aos códigos e replicação das análises.

Resultado PNADc Trimestral - 3° Trimestre/2024

A Análise Macro apresenta os resultados da PNADc Trimestral do 3º trimestre de 2024, com gráficos elaborados em Python para coleta, tratamento e visualização de dados. Todo o conteúdo, disponível exclusivamente no Clube AM, foi desenvolvido com base nos métodos ensinados nos cursos da Análise Macro, permitindo aos assinantes acesso aos códigos e replicação das análises.

Análise exploratória para modelagem preditiva no Python

Antes de desenvolver bons modelos preditivos é necessário organizar e conhecer muito bem os dados. Neste artigo, damos algumas dicas de recursos, como gráficos, análises e estatísticas, que podem ser usados para melhorar o entendimento sobre os dados usando Python.

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.