Coletando dados da OCDE com o R

Como tenho dito há muito tempo nesse espaço, uma das grandes vantagens de se utilizar o R no dia a dia é poder centralizar o processo de análise de dados em um único ambiente. Desde a coleta até a comunicação dos resultados, via uma apresentação ou relatório. Para ilustrar, vou dar um exemplo real aqui. Recentemente, tive de produzir uma palestra sobre educação e uma das necessidades que tinha era comparar o gasto com educação básica e superior do Brasil com outros países. Para isso, recorri à base de dados da OCDE.

Sem o R, eu teria que acessar o site da OCDE, fazer uma pesquisa por lá até encontrar os dados que eu queria. Depois exportar para o Excel e por fim construir o gráfico que ilustraria minha apresentação no Power Point, por exemplo.

Tedioso, não é mesmo? Bom, com o R a coisa fica mais simples. Eu abri um .Rmd no RStudio e comecei a produzir a minha apresentação. No slide onde iria plotar o gráfico que eu queria, eu recorri ao pacote OECD, onde pude então coletar os dados que queria:


library(OECD)
df = get_dataset(dataset="EAG_FIN_RATIO_CATEGORY",
filter='AUS+AUT+BEL+CAN+CHL+CZE+DNK+EST+FIN+FRA+DEU+GRC+HUN+ISL+IRL+ISR+ITA+JPN+KOR+LVA+LTU+LUX+MEX+NLD+NZL+NOR+POL+PRT+SVK+SVN+ESP+SWE+CHE+TUR+GBR+USA+NMEC+ARG+BRA+COL+CRI+IND+IDN+RUS+ZAF.L1+L2T3+L5T8.FIN_PERSTUD.T.T.INST_T+INST_PUB+INST_PRIV',
start_time = '2015',
end_time = '2015')

O data frame df contém então os dados de gastos por aluno nos três níveis principais de ensino abrindo por instituições públicas, privadas e ambas. Assim, com um pouco de tratamento dos dados, cheguei ao gráfico abaixo.

Depois, foi só compilar o .Rmd e produzir a apresentação. Sem ter que abrir qualquer outro programa...

Todo esse processo, eu ensino no nosso novo Curso de Introdução ao R para Análise de Dados que abriu inscrições hoje, 06/05. O 1º lote está com 30% de desconto, mas deve acabar logo...

Interessados no código do gráfico, basta rolar a barra à direita e colocar o e-mail na nossa newsletter semanal. Toda segunda, envio o código de um dos posts mais comentados e curtidos da semana para a lista!

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Como tratar dados no Python? Parte 4: operações por grupos

Como mensalizar dados diários? Ou como filtrar os valores máximos para diversas categorias em uma tabela de dados usando Python? Estas perguntas são respondidas com os métodos de operações por grupos. Neste tutorial mostramos estes métodos disponíveis na biblioteca pandas, que tem como vantagem sua sintaxe simples e prática.

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.