Coletando dados da OCDE com o R

Como tenho dito há muito tempo nesse espaço, uma das grandes vantagens de se utilizar o R no dia a dia é poder centralizar o processo de análise de dados em um único ambiente. Desde a coleta até a comunicação dos resultados, via uma apresentação ou relatório. Para ilustrar, vou dar um exemplo real aqui. Recentemente, tive de produzir uma palestra sobre educação e uma das necessidades que tinha era comparar o gasto com educação básica e superior do Brasil com outros países. Para isso, recorri à base de dados da OCDE.

Sem o R, eu teria que acessar o site da OCDE, fazer uma pesquisa por lá até encontrar os dados que eu queria. Depois exportar para o Excel e por fim construir o gráfico que ilustraria minha apresentação no Power Point, por exemplo.

Tedioso, não é mesmo? Bom, com o R a coisa fica mais simples. Eu abri um .Rmd no RStudio e comecei a produzir a minha apresentação. No slide onde iria plotar o gráfico que eu queria, eu recorri ao pacote OECD, onde pude então coletar os dados que queria:


library(OECD)
df = get_dataset(dataset="EAG_FIN_RATIO_CATEGORY",
filter='AUS+AUT+BEL+CAN+CHL+CZE+DNK+EST+FIN+FRA+DEU+GRC+HUN+ISL+IRL+ISR+ITA+JPN+KOR+LVA+LTU+LUX+MEX+NLD+NZL+NOR+POL+PRT+SVK+SVN+ESP+SWE+CHE+TUR+GBR+USA+NMEC+ARG+BRA+COL+CRI+IND+IDN+RUS+ZAF.L1+L2T3+L5T8.FIN_PERSTUD.T.T.INST_T+INST_PUB+INST_PRIV',
start_time = '2015',
end_time = '2015')

O data frame df contém então os dados de gastos por aluno nos três níveis principais de ensino abrindo por instituições públicas, privadas e ambas. Assim, com um pouco de tratamento dos dados, cheguei ao gráfico abaixo.

Depois, foi só compilar o .Rmd e produzir a apresentação. Sem ter que abrir qualquer outro programa...

Todo esse processo, eu ensino no nosso novo Curso de Introdução ao R para Análise de Dados que abriu inscrições hoje, 06/05. O 1º lote está com 30% de desconto, mas deve acabar logo...

Interessados no código do gráfico, basta rolar a barra à direita e colocar o e-mail na nossa newsletter semanal. Toda segunda, envio o código de um dos posts mais comentados e curtidos da semana para a lista!

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Análise de impacto fiscal sobre o dolár com Python

Usamos uma cesta de 12 moedas para construir um cenário contrafactual da taxa de câmbio após o último anúncio de pacote fiscal, com base em modelagem Bayesiana. No período, o dolár depreciou quase 5% e passou os R$ 6,15, enquanto que na ausência da intervenção a moeda deveria estar cotada em R$ 5,78.

Resultado IBC-br - Outubro/2024

A Análise Macro apresenta os resultados da IBC-br de Outubro de 2024, com gráficos elaborados em Python para coleta, tratamento e visualização de dados. Todo o conteúdo, disponível exclusivamente no Clube AM, foi desenvolvido com base nos métodos ensinados nos cursos da Análise Macro, permitindo aos assinantes acesso aos códigos e replicação das análises.

Resultado PMC - Outubro/2024

A Análise Macro apresenta os resultados da PMC de Outubro de 2024, com gráficos elaborados em Python para coleta, tratamento e visualização de dados. Todo o conteúdo, disponível exclusivamente no Clube AM, foi desenvolvido com base nos métodos ensinados nos cursos da Análise Macro, permitindo aos assinantes acesso aos códigos e replicação das análises.

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.