Levando o PIB para o R com o pacote SidraR

[et_pb_section admin_label="section"][et_pb_row admin_label="row"][et_pb_column type="4_4"][et_pb_text admin_label="Texto" background_layout="light" text_orientation="justified" text_font="Verdana||||" text_font_size="19" use_border_color="off" border_color="#ffffff" border_style="solid"]

Recentemente, publiquei no Blog da Análise Macro um post que fazia referência ao pacote SidraR, que visa facilitar a vida de quem trabalha com os dados do SIDRA/IBGE. O pacote permite baixar dados do SIDRA diretamente para o R. Alguns alunos dos Cursos de R da Análise Macro e mesmo membros do nosso Clube do Código me enviaram dúvidas nas últimas semanas sobre como manipular os dados obtidos a partir do pacote. Isso porque, como mostra a figura abaixo, os dados obtidos não formam um data frame tradicional, com as colunas sendo variáveis e as linhas observações. Com efeito, é preciso fazer um tratamento dos dados obtidos. É o que fazemos na edição 38 do Clube do Código, uma vez que os dados do SIDRA/IBGE são bastante importantes para profissionais de diferentes áreas. Nesse post, mostramos alguns pontos do exercício.

Com o código abaixo, nós importamos os componentes do PIB pelo lado da oferta e pelo lado da demanda, para os índices encadeados e para os ajustados sazonalmente.


## Importação dos dados do PIB
tabela = get_sidra(api='/t/1620/n1/all/v/all/p/all/c11255/90687,90691,90696,90707,93404,93405,93406,93407,93408/d/v583%202')
tabela_sa = get_sidra(api='/t/1621/n1/all/v/all/p/all/c11255/90687,90691,90696,90707,93404,93405,93406,93407,93408/d/v584%202')

Uma vez importados, os dados se parecerão com a figura acima. O código abaixo, então, faz a extração de cada uma das variáveis contidas no data frame, com base na coluna Setores e subsetores (Código), utilizando para isso um loop com a função for. Para que isso seja possível, claro, precisamos definir um vetor contendo os códigos das séries, além de precisarmos criar uma matriz que irá armazenar os dados extraídos. Ademais, criamos um vetor para nomear as séries obtidas.


series = c(90687,90691,90696,90707,93404,93405,93406,93407,93408)
names = c('Agro', 'Ind', 'Serv', 'PIB',
 'Consumo', 'Governo', 'FBCF',
 'Exportação', 'Importação')
pib = matrix(NA, ncol=length(series), 
 nrow=nrow(tabela)/length(series))
for(i in 1:length(series)){
 pib[,i] = tabela$Valor[tabela$
 `Setores e subsetores (Código)`
 ==series[i]] 
 pib = ts(pib, start=c(1996,01), freq=4)
 colnames(pib) = names
}

Ao rodar o código acima, teremos os dados organizados conforme a figura abaixo. Isto é, teremos as colunas representando os componentes do PIB (e uma delas, o próprio PIB) e as linhas representando as observações trimestrais - lembrando que também transformamos os nossos dados em séries temporais. Dessa forma, poderemos trabalhar com os nossos dados da forma que já estamos acostumados.

Os dados dos componentes do PIB e do próprio PIB em nível não dizem muita coisa para nós. Assim, é preciso criar algumas métricas de crescimento, isto é, a que taxa as nossas séries estão crescendo ou decrescendo. É o que fazemos no restante do exercício do Clube de modo a obter gráficos como os da figura abaixo.

E então, gostou do exercício? Você pode aprender mais fazendo um dos nossos Cursos Aplicados de R e se associando ao Clube do Código.

[/et_pb_text][/et_pb_column][/et_pb_row][et_pb_row admin_label="row"][et_pb_column type="1_2"][et_pb_image admin_label="Imagem" src="https://analisemacro.com.br/wp-content/uploads/2017/12/modelos.png" show_in_lightbox="off" url="https://analisemacro.com.br/cursos-de-r/central-banking-training/modelos-do-banco-central/" url_new_window="off" use_overlay="off" animation="left" sticky="off" align="center" force_fullwidth="off" always_center_on_mobile="on" use_border_color="off" border_color="#ffffff" border_style="solid" /][/et_pb_column][et_pb_column type="1_2"][et_pb_image admin_label="Imagem" src="https://analisemacro.com.br/wp-content/uploads/2017/11/datascience.png" show_in_lightbox="off" url="https://analisemacro.com.br/cursos-de-r/" url_new_window="off" use_overlay="off" animation="left" sticky="off" align="center" force_fullwidth="off" always_center_on_mobile="on" use_border_color="off" border_color="#ffffff" border_style="solid" /][/et_pb_column][/et_pb_row][et_pb_row admin_label="row"][et_pb_column type="1_3"][et_pb_gallery admin_label="Galeria" gallery_ids="17132,17133,17134" fullwidth="on" show_title_and_caption="off" show_pagination="off" background_layout="light" auto="on" auto_speed="6000" hover_overlay_color="rgba(255,255,255,0.9)" caption_all_caps="off" use_border_color="off" border_color="#ffffff" border_style="solid" saved_tabs="all"] [/et_pb_gallery][et_pb_gallery admin_label="Galeria" gallery_ids="17136,17137,17138" fullwidth="on" show_title_and_caption="off" show_pagination="off" background_layout="light" auto="on" auto_speed="6000" hover_overlay_color="rgba(255,255,255,0.9)" caption_all_caps="off" use_border_color="off" border_color="#ffffff" border_style="solid" saved_tabs="all"] [/et_pb_gallery][/et_pb_column][et_pb_column type="2_3"][et_pb_team_member admin_label="Pessoa" saved_tabs="all" name="Vítor Wilher " position="Data Scientist" animation="left" background_layout="light" facebook_url="https://www.facebook.com/vitor.wilher.9" twitter_url="https://twitter.com/vitorwilherbr" linkedin_url="https://www.linkedin.com/in/v%C3%ADtor-wilher-78164024" use_border_color="off" border_color="#ffffff" border_style="solid"]

Vítor Wilher é Bacharel e Mestre em Economia, pela Universidade Federal Fluminense, tendo se especializado na construção de modelos macroeconométricos, política monetária e análise da conjuntura macroeconômica doméstica e internacional. Tem, ademais, especialização em Data Science pela Johns Hopkins University. Sua dissertação de mestrado foi na área de política monetária, titulada "Clareza da Comunicação do Banco Central e Expectativas de Inflação: evidências para o Brasil", defendida perante banca composta pelos professores Gustavo H. B. Franco (PUC-RJ), Gabriel Montes Caldas (UFF), Carlos Enrique Guanziroli (UFF) e Luciano Vereda Oliveira (UFF). Já trabalhou em grandes empresas, nas áreas de telecomunicações, energia elétrica, consultoria financeira e consultoria macroeconômica. É o criador da Análise Macro, startup especializada em treinamento e consultoria em linguagens de programação voltadas para data analysis, sócio da MacroLab Consultoria, empresa especializada em cenários e previsões e fundador do hoje extinto Grupo de Estudos sobre Conjuntura Econômica (GECE-UFF). É também Visiting Professor da Universidade Veiga de Almeida, onde dá aulas nos cursos de MBA da instituição, Conselheiro do Instituto Millenium e um dos grandes entusiastas do uso do no ensino. Leia os posts de Vítor Wilher aquiCaso queira, mande um e-mail para ele: vitorwilher@analisemacro.com.br

[/et_pb_team_member][/et_pb_column][/et_pb_row][/et_pb_section]

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Analisando o sentimento da política monetária com IA usando Python

Análise de sentimentos é uma técnica de Processamento de Linguagem Natural (PLN) que serve para revelar o sentimento contido em um texto. Neste exercício, aplicamos esta técnica para analisar as atas das reuniões do COPOM, revelando o que os diretores de política monetária discutem nas entrelinhas. Utilizando um modelo de Inteligência Artificial através do Python, produzimos ao final um índice de 0 a 100 para sintetizar a análise histórica.

Como a IA pode auxiliar na otimização de Portfólio de Investimentos?

A construção de portfólio ótimo refere-se ao processo de alocar eficientemente capital entre um conjunto predefinido de ativos ou títulos. O campo da construção de portfólio tem sido extensivamente estudado por acadêmicos e profissionais desde a década de 1950, quando Markowitz introduziu sua inovadora abordagem de média-variância para a construção de portfólio. Diante disso, podemos melhorar o processo de alocação de peso de um investimento em um portfólio através do Aprendizado não supervisionado com a aplicação do Hierarchical Risk Parity (HRP). Neste exercício, realizamos uma introdução ao método e mostramos os resultados de um exemplo criado através do Python.

Prevendo múltiplas séries usando IA no Python

Como podemos realizar previsões para várias séries temporais simultaneamente? Para abordar essa questão, empregamos a biblioteca MLForecastdo Python. Esta biblioteca disponibiliza uma variedade de modelos e funcionalidades para realizar previsões em séries temporais utilizando técnicas de aprendizado de máquina. Demonstramos sua aplicação ao prever as curvas de energia horária em quatro regiões distintas do Brasil.

Esse exercício é uma continuação do exercício “Usando IA para prever o consumo de energia no Brasil com Python”.

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.