Tag

desemprego Archives - Análise Macro

Coletando dados da Economia Internacional com o Python

By | Indicadores

Na análise de conjuntura econômica, o cenário econômico internacional representa um importante papel. O foco é acompanhar indicadores econômicos das principais economias internacionais, de forma a tirar conclusões sobre os seus efeitos no Brasil e na economia mundial. No post de hoje iremos mostrar como é possível coletar esses dados utilizando o Python.

O principal banco de dados que utilizado para importar os dados de indicadores macroeconômicos de diversos papel será através da OECD Stats, no qual configura como uma plataforma que disponibiliza dados dos países integrantes da Organização para a Cooperação e Desenvolvimento Econômico, bem como outro países que não são integrantes, entretanto desempenham um importante papel na economia mundial.

Existem diversos meios e diferentes formatos de exportar os dados. Aqui utilizaremos o formato Statistical Data and Metadata eXchange (SDMX), criado com o objetivo de facilitar o compartilhamento de dados e informações de organizações internacionais.

Dentro do database da OECD Statistics, selecionamos os indicadores através de temas e realizamos os devidos filtros das informações. Em seguida, copiamos o código de exportação do formato SDMX. Esse código é crucial para realizar a importação no Python. Para entender sobre esse processo veja a aula no Clube AM ou no nosso curso de Análise de Conjuntura usando o R.

Com o código em mãos, é possível utilizar a biblioteca pandasdmx, que auxilia no processo de retirada de dados de bancos de dados que utilizam o formato SDMX. Veja no código abaixo que nos conectamos com o servidor da OECD e utilizamos o método data para inserir as informações dos dados.

Por fim, obtemos os dados e realizamos os devidos tratamentos e limpeza para que possamos utilizá-los no Python. Realizamos esse procedimento para quatro indicadores: PIB, Taxa de Desemprego, Inflação e Taxa de Juros.

Produto Interno Bruto

Taxa de Desemprego

Inflação

Taxas de Juros

________________________________________

Quer saber mais?

Veja nossos cursos de Macroeconomia através da nossa trilha de Macroeconomia Aplicada.

Python: Visualizando dados com Matplotlib e Seaborn

By | Python

O Python é uma linguagem que tem a notoriedade de ser amplamente utilizada no mundo da análise de dados em geral. Esse ponto forte não se dá somente por sua força na realização de cálculos, de forma rápida e fácil, mas também pela possibilidade de criar gráficos úteis para a análise dos dados e na comunicação de resultados. No post de hoje, mostraremos duas bibliotecas importantes do Python para a criação de gráficos: Matplolib e Seaborn.

Primeiro carregamos as bibliotecas necessárias para que possamos trabalhar com os dados no Python.

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
# !pip install python-bcb
from bcb import sgs

Para os exemplos dos gráficos iremos importar os dados através do Sistema Gerenciador de Séries do Banco Central. Utilizaremos duas séries: a variação do IPCA mensal e o desemprego medido pela PNADC.

ipca = sgs.get({'IPCA' : 433}, start = "2010-01-01")
desemprego = sgs.get({'desemprego' : 24369})
data = desemprego.merge(ipca, on = 'Date', how = 'left')

Matplotlib

O Matplotlib é uma biblioteca do Python com a funcionalidade de criar gráficos 2D. Tem como ponto positivo a variedade de gráficos e formas de construção em conjuntos com diversas bibliotecas para análises de dados e entre outros formatos.

Matplotlib transformas os dados em figuras, cada uma contendo uma ou mais eixos, especificando os pontos gráficos em coordenadas x-y. Para cada tipo de gráfico existe um função específica, que a depender da forma em que os dados necessitam se dispor no gráfico, deve ser indicado pelos seus argumentos.

Vemos um exemplo com a série da variação mensal do IPCA. Como a data se insere dentro do índice do data frame, e existe uma única coluna contendo os dados, o plot do Matplotlib reconhece automaticamente como devem ser utilizados os eixos, sendo apenas necessário especificar os dados na função.

O resultado é um gráfico de série temporal em que o eixo x são as datas ordenadas e o eixo y corresponde aos valores do IPCA mensal. A cada mês demonstra a variação desses valores.


plt.plot(ipca)
plt.style.use('default')

Continuando com o mesmo data frame, vemos agora um gráfico de Histograma, que demonstra a frequência de valores da nossa série. Quanto mais frequentes determinado valores, maior será a barra denotada pelo eixo y.  Vemos que os valores entre 0,25% e 0,50% são os mais recorrentes para o IPCA mensal. Como queremos apenas um vetor de dados para criar este gráfico, acessamos a coluna IPCA para que seja possível utilizar o gráfico.
O Matplotlib também possibilita realizar mudanças estéticas e textuais nas figuras. Vamos realizar algumas mudanças:

plt.hist(x = ipca['IPCA'],
         color = "darkblue",
         bins = 20)
plt.title("valores de jan de 2010 a jan de 2022")
plt.suptitle("Histograma da variação mensal do IPCA")
plt.style.use('ggplot')

Podemos ver uma relação entre duas variáveis a partir de um gráfico de dispersão. Vemos qual a relação entre o desemprego e o IPCA.

plt.scatter(x = data['desemprego'], y = data['IPCA'])
plt.title("Relação Desemprego x IPCA")
plt.style.use('classic')

Seaborn

Outra biblioteca muito utilizada para a construção de gráficos com o Python é o Seaborn, que é baseado no Matplotlib e provê uma interface mais elaborada para construir gráficos com enfoque estatístico.
O Seaborn possui como propósito a simplicidade de construir um gráfico com enfoque para análise de dados, sem dar a preocupação ao usuário de ficar se preocupando com detalhes visuais.
Iremos repetir os gráficos construídos anteriormente, porém, com o Seaborn.
Assim como o Matplotlib, o Seaborn possui uma função para cada gráfico, a diferença está nos argumentos e os elementos padrões.
Vemos como podemos criar um gráfico de série temporal da variação mensal do IPCA.
sns.set_theme()
sns.lineplot(data = ipca)

Com o Seaborn, podemos ver a melhora gráfico e de elemento para o Histograma.

sns.displot(data = ipca, x = 'IPCA', kde = True)

E também a facilidade criar gráficos de correlação com retas de regressão.

sns.regplot(data = data, x = 'desemprego', y = 'IPCA')

Quer aprender mais sobre Python?

Confira nossos cursos de Estatística com Python e Python para Economistas. Nestes cursos elencamos os principais pontos para conhecer o mundo do Python e a aplicação de problemas reais.

Google Trends e previsão do desemprego no Brasil

By | Comentário de Conjuntura

A pandemia do coronavírus impôs diversos desafios para a humanidade, nos mais diferentes campos. Em termos de previsão de variáveis macroeconômicas, não é diferente. O ajuste dos modelos tem sido um desafio para economistas e analistas de mercado, que possuem a árdua e ingrata tarefa de antecipar eventos futuros. Pensando nisso, nesse Comentário de Conjuntura buscamos implementar um modelo de previsão para a taxa de desemprego medida pela PNAD Contínua que utiliza termos de busca do Google Trends.

A base de dados do Google Trends é hoje em dia bastante conhecida por especialistas que se dedicam à tarefa de forecasting, tendo um amplo conjunto de artigos e papers que fazem uso da mesma para esse fim. D´Amuri e Marcucci, 2017, por exemplo, fazem uso dessa base para construir um modelo de previsão para o desemprego nos Estados Unidos. Os resultados encontrados sugerem que essa base de dados é um bom preditor para a taxa de desemprego norte-americana.

Tendo o mesmo objetivo que os autores, nós revisamos um modelo de cointegração para o desemprego que inclui os termos de busca empregos seguro desemprego, que são ilustrados acima. A inclusão do termo seguro desemprego procura "tratar" o efeito pandemia, que causou um forte choque sobre a taxa de desemprego medida pela PNAD Contínua, como pode ser visto abaixo.

Além dos termos de busca do GT, também adicionamos mais algumas co-variáveis ao modelo, listadas a seguir.

O modelo é implementado, então, no R, com o auxílio da biblioteca vars e uso da metodologia de Johansen. A seguir, um gráfico que apresenta a previsão fora da amostra considerada.

Os códigos que implementam o exercício estão disponíveis para os membros do Clube AM.

 

Um modelo preditivo para o desemprego medido pela PNAD

By | Comentário de Conjuntura

Amanhã, o IBGE divulga a taxa de desemprego medida pela PNAD Contínua referente ao mês de abril. Sazonalmente, o desemprego aumenta entre janeiro e março e começa a se reduzir a partir de abril. É o que deve ocorrer nesse ano, visto o que tem acontecido com o nível de atividade. Nesse Comentário de Conjuntura, nós atualizamos nosso modelo VEC de previsão para a taxa de desemprego, que é ensinado no Curso de Previsão Macroeconométrica usando o R.

No nosso modelo, utilizamos as seguintes variáveis explicativas: pesquisas no google trends, o índice antecedente de emprego da FGV, o índice de incerteza econômica também da FGV, o IBC-Br e a taxa básica de juros. A seguir, um gráfico com todas elas, mais o desemprego medido pela PNAD Contínua.

Uma vez coletadas as séries, procedemos o teste de johansen para verificar a existência de vetor de cointegração entre elas. O teste revela a existência de 2 vetores, o que nos leva a construir o modelo VEC.

A amostra é ainda dividida em treino e teste de forma a avaliar a acurácia do modelo, de acordo com as medidas convenientes. O modelo erra mais do que o desejado na amostra de teste, composta pelo período da pandemia. Um problema que econometristas de todo o mundo vem enfrentando nos dias atuais.

Feito o treino/teste, passamos para a previsão para os próximos meses. A tabela abaixo resume.

Previsões para a Taxa de Desemprego
Lower Média Upper
Abr/21 14.2 14.4 14.6
Mai/21 13.8 14.1 14.4
Jun/21 13.4 13.8 14.3
Jul/21 13.1 13.8 14.4
Ago/21 12.8 13.6 14.5
Set/21 12.3 13.4 14.6

A previsão para abril fica entre 14,2% e 14,6% da PEA, centrado em 14,4%. A expectativa é, por suposto, que o desemprego passe a ceder nos meses que seguem. Espera-se que nos próximos seis meses, haja um recuo de 1 ponto percentual na taxa, o que em termos absolutos significa menos 1 milhão de pessoas desempregadas.


Se confirmado, seria a melhor notícia dos últimos tempos...

____________________

(*) Para quem quiser ter acesso a todos os códigos desse e de todos os exercícios que publicamos ao longo da semana, visite o Clube AM.

Análise do desemprego por tempo de procura de trabalho com o R

By | Mercado de Trabalho

Os dados da PNAD Contínua, no seu corte trimestral, trazem informações relevantes sobre o tempo de procura por emprego entre as pessoas que estão desempregadas. Essa informação é bastante importante para dar uma dimensão sobre o está o que os economistas chamam de desemprego de longo prazo. A tabela 1616 disponível no SIDRA/IBGE contém essas informações. Para acessá-la, podemos usar o pacote sidrar, como abaixo.


## Pacotes utilizados nesse comentário
library(tidyverse)
library(zoo)

table = get_sidra(api='/t/1616/n1/all/v/4092/p/all/c1965/all') %>%
mutate(date = as.yearqtr(`Trimestre (Código)`, format='%Y%q')) %>%
select(date, "Tempo de procura de trabalho", Valor) %>%
as_tibble()

Com os dados disponíveis, podemos construir o gráfico abaixo.

Os dados do IBGE, entretanto, só estão disponíveis até o primeiro trimestre de 2020.

Os membros do Clube AM, a propósito, têm acesso aos códigos completos dos nossos Comentários e Exercícios.

_______________________

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais
e conteúdos exclusivos sobre Análise de Dados!

Assinar Gratuitamente