Tag

dados previdênciários Archives - Análise Macro

Um modelo SARIMA para os gastos previdenciários

By | Macroeconometria

A edição 51 do Clube do Código, titulada Tratando dados previdenciários com o R, que foi parcialmente publicada aqui no blog, ensina a coletar e tratar dados agregados de receita e despesa do INSS - é, a propósito, o tipo de coisa que fazemos em nosso Curso de Analise de Conjuntura usando o R. Lá também construímos um modelo univariado SARIMA de previsão para o gasto previdenciário, baseado na metodologia Box-Jenkins - saiba como construir modelos univariados em nosso Curso de Séries Temporais usando o R. O objetivo do exercício é ter uma ideia sobre a evolução do gasto previdenciário em 2019.

Como vimos no post sobre tratamento de dados previdenciários, os gastos do INSS apresentam uma tendência positiva de crescimento ao longo do tempo, além de uma sazonalidade bastante pronunciada. Certamente, por suposto, não é um processo estacionário - veja mais aqui. O tratamento inicial, de acordo com a metodologia Box-Jenkins, é tornar a série estacionária, modelando a mesma em seguida.

Na edição 51 do Clube do Código, por suposto, utilizamos a função auto.arima do pacote forecast de modo a gerar "o melhor modelo" univariado para o gasto previdenciário de acordo com critérios de informação. O resultado foi um modelo ARIMA(0,1,3)(0,1,1)[12]. O gráfico abaixo compara o ajuste desse modelo com a série original.

Com base nesse modelo, geramos uma previsão para 2019. O gráfico abaixo ilustra para três diferentes intervalos de confiança.

As previsões médias do modelo indicam que o gasto previdenciário será de R$ 625,2 bilhões em 2019, variando entre R$ 583,1 bilhões e R$ 667,4 bilhões, ao considerar um intervalo de 95% de confiança. Em termos comparativos, o PLDO 2019 estima o gasto do INSS em R$ 635,4 bilhões. Em outras palavras, pelo nosso modelo, o gasto deve aumentar algo como R$ 38,9 bilhões esse ano, em valores correntes, se comparado a 2018, seguindo a trajetória ascendente.

Para terminar, uma provocação. Dissemos acima que o gasto previdenciário não performa como um processo estacionário. O que isso significa? Significa dizer que o gasto segue, pelo contrário, um processo explosivo de crescimento. Isto é, a tendência é que ele cresça indefinidamente ao longo do tempo, caso nada seja feito - saiba mais em nosso Curso de Séries Temporais usando o R. Justamente por isso é importante que seja feita alguma reforma no sistema de previdência, caso contrário essa rubrica avançará sobre todos os outros gastos do governo ao longo do tempo.

O pdf completo estará disponível no Clube do Código na próxima semana!

_____________________________________

Conheça nossos Cursos Aplicados de R e aprenda a coletar, tratar, analisar e apresentar dados com o R!

Tratando dados previdenciários com o R

By | Comentário de Conjuntura

Um dos grandes problemas ao se debater sobre reforma da previdência é a dificuldade de encontrar e tratar os dados. De forma a dar uma contribuição ao debate, com efeito, resolvi nesse sábado de manhã nublado no Rio produzir um pdf para o Clube do Código sobre como tratar dados previdenciários do INSS. A ideia é coletar os dados agregados referentes à despesa e receita diretamente da Secretaria do Tesouro Nacional, deflacionar esses dados com o IPCA, retirar a sazonalidade, de modo a visualizar os dados mais "limpos" e, por fim, anualizar os mesmos, de modo a produzir o gráfico abaixo, que ilustra o déficit da previdência ao longo do tempo. É, a propósito, o tipo de coisa que fazemos em nosso Curso de Analise de Conjuntura usando o R.

O gráfico acima ilustra muito bem o comportamento da despesa e da receita previdenciária referente ao INSS ao longo do tempo. Como eu disse acima, porém, para chegar nele é preciso um bom trabalho de tratamento dos dados. Para começar, vamos baixar os dados referentes ao resultado primário do governo central, de onde podemos extrair os dados agregados do INSS. O código abaixo ilustra.


library(readxl)
url = 'https://bit.ly/2N9vtOh'
download.file(url, 'primario.xlsx', mode='wb')
data = read_excel('primario.xlsx', sheet='1.1', skip=4,
col_types = c('text', rep('numeric', 264)))
previdencia = t((data[c(14,36),-1]))

A matriz previdencia contém, então, os dados agregados de receita e despesa do INSS. Abaixo, para ilustrar para o leitor como a vida é dura, podemos ver como esses dados estão...

Muitos problemas, não é mesmo? Para começar, os dados estão em valores correntes ou nominais. Isso significa que não estamos considerando a inflação do período, de modo que não faz sentido comparar o dinheiro do ano x com o do ano y. Assim, precisamos deflacionar os mesmos. Para isso, porém, precisamos de um deflator. Vamos usar aqui o IPCA, que pode ser baixado do IBGE como no código abaixo.


library(sidrar)
### Importar IPCA 
ipca = get_sidra(api='/t/1737/n1/all/v/2266/p/all/d/v2266%2013')
ipca = ts(ipca$Valor, start=c(1979,12), freq=12)
ipca = window(ipca, start=c(1997,01), end=c(2018,12))
### Deflacionar Dados
nominal = ts(previdencia[,2:3], start=c(1997,01), freq=12)
real = ipca[length(ipca)]*(nominal/ipca)

Agora, temos uma matriz com os valores nominais e outra com os valores reais. O gráfico a seguir ilustra os valores reais.

Observe que em termos reais, a despesa continua acima da receita, mas repare que na ponta há uma queda em termos reais da receita (por quê?). Isso dito, observe que a visualização do gráfico ainda não é muito boa por conta da sazonalidade da série. Podemos fazer um ajuste sazonal nela, apenas como exercício, com o código abaixo.


### Pacote Seasonal
library(seasonal)
Sys.setenv(X13_PATH = "C:/Séries Temporais/R/Pacotes/seas/x13ashtml")
## Dessazonalizar Dados
receita = final(seas(real[,1]))
despesa = final(seas(real[,2]))
realsa = ts.intersect(receita,despesa)

A seguir, um gráfico para ilustrar os dados dessazonalizados...

Com os dados deflacionados e dessazonalizados, fica bem melhor a visualização, não é mesmo? Observe que uma coisa é bastante perceptível: as séries possuem uma tendência positiva ao longo do tempo. De fato, se você quiser criar uma taxa de crescimento, verá que elas crescem em média acima de 6% a.a., em termos reais!! Por fim, podemos gerar o primeiro gráfico desse post, de modo a suavizar ainda mais a nossa sérieanualizando os dados com o código a seguir.


### Acumular em 12 meses
real12 = real+lag(real,-1)+lag(real,-2)+lag(real,-3)+
lag(real,-4)+lag(real,-5)+lag(real,-6)+lag(real,-7)+
lag(real,-8)+lag(real,-9)+lag(real,-10)+lag(real,-11)

Observe que, primeiro, eu deflacionar os dados mensais e só depois acumulei eles em 12 meses. Com a matriz real12, por fim, podemos gerar aquele primeiro gráfico do post que ilustra perfeitamente a tendência de crescimento da despesa ao longo do tempo.

Com os dados tratados, podemos avançar para a próxima etapa da análise de dados que é construir um modelo para os gastos previdenciários. Isso fica para um próximo post! 🙂

O pdf completo estará disponível no Clube do Código na próxima semana!

_____________________________________

Conheça nossos Cursos Aplicados de R e aprenda a coletar, tratar, analisar e apresentar dados com o R!

Idade mínima para se aposentar vs. expectativa de vida

By | Comentário de Conjuntura

Com a volta da Reforma da Previdência ao centro das atenções, erros comuns também voltam a ser cometidos pelos críticos. Como o objetivo da Análise Macro é prover estudantes, professores e profissionais de mercado das mais diversas áreas com ferramental quantitativo para analisar dados, vamos dar aqui um exemplo envolvendo esse tema tão importante. Definido o conceito de idade mínima para se aposentar, muitos críticos têm citado o conceito de "expectativa de vida ao nascer" para dizer que as pessoas irão "morrer trabalhando". Será isso verdade? - aprenda a lidar com dados reais como esse em nossos Cursos Aplicados de R.

A expectativa de vida ao nascer no Brasil é de 76 anos. O número, entretanto, está contaminado, digamos assim, pela mortalidade infantil e pela violência (lembre-se que mais de 63 mil pessoas morrem no Brasil todo santo ano, uma das taxas mais altas do mundo!). Isso dito, é preciso "corrigir" a expectativa de vida, condicionando a mesma à idade do indivíduo. Esse último conceito dá uma ideia muito mais clara de sobrevida da pessoa que chega à tal idade mínima para se aposentar.

Com base nas tábuas de mortalidade do IBGE, homens que chegam aos 65 anos vivem até os 82 anos, em média. Já as mulheres que chegam aos 62 anos, vivem até os 84 anos, em média. O gráfico abaixo, construído com a ajuda do R, ilustra a expectativa de vida condicionada à idade.

O gráfico é muito claro em ilustrar que à medida que as pessoas envelhecem, sua expectativa de vida tende a aumentar. Um homem com 35 anos, por exemplo, tem uma expectativa de vida de 76 anos, apenas 4 anos a mais do que a expectativa de vida que ele tinha ao nascer. Já um homem com 60 anos, tem uma expectativa de vida de 80 anos, 18 anos a mais do que sua expectativa de vida ao nascer.

Para que o bom debate ocorra sobre um tema dos mais importantes para o nosso país, é imprescindível que as pessoas envolvidas nele saibam tratar corretamente os dados, não é mesmo? 😉

_______________________________________________________________

Conheça nossos Cursos Aplicados de R e aprenda a coletar, tratar, analisar e apresentar dados reais com o R!

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais
e conteúdos exclusivos sobre Análise de Dados!

Assinar Gratuitamente