Tag

customização de temas no ggplot2 Archives - Análise Macro

Coletando dados do Banco Mundial com o R

By | Hackeando o R

Ontem, divulguei o pacote OECD de modo que é possível coletar dados da OCDE diretamente para o RStudio. Hoje, a dica é o pacote WDI, que faz coleta de dados do Banco Mundial. Para ilustrar, pego os dados da taxa de poupança e taxa de juros para 2017.


library(WDI)

interest = WDI(country='all',
indicator = 'FR.INR.RINR',
start=2017, end=2017)

saving = WDI(country = 'all',
indicator = 'NY.GNS.ICTR.ZS',
start=2017, end=2017)

Uma vez coletado os dados e depois de algum tratamento, podemos gerar o gráfico abaixo...

Impressiona que em diversas comparações que tenho mostrado por aqui, o Brasil está sempre como um outlier, não é mesmo?

Quer saber mais sobre como usar o R para analisar dados? Conheça o nosso curso de Introdução ao R para Análise de Dados que abriu inscrições ontem, 06/05. O 1º lote está com 30% de desconto, mas deve acabar logo...

Interessados no código do gráfico, basta rolar a barra à direita e colocar o e-mail na nossa newsletter semanal. Toda segunda, envio o código de um dos posts mais comentados e curtidos da semana para a lista!

Coletando dados da OCDE com o R

By | Hackeando o R

Como tenho dito há muito tempo nesse espaço, uma das grandes vantagens de se utilizar o R no dia a dia é poder centralizar o processo de análise de dados em um único ambiente. Desde a coleta até a comunicação dos resultados, via uma apresentação ou relatório. Para ilustrar, vou dar um exemplo real aqui. Recentemente, tive de produzir uma palestra sobre educação e uma das necessidades que tinha era comparar o gasto com educação básica e superior do Brasil com outros países. Para isso, recorri à base de dados da OCDE.

Sem o R, eu teria que acessar o site da OCDE, fazer uma pesquisa por lá até encontrar os dados que eu queria. Depois exportar para o Excel e por fim construir o gráfico que ilustraria minha apresentação no Power Point, por exemplo.

Tedioso, não é mesmo? Bom, com o R a coisa fica mais simples. Eu abri um .Rmd no RStudio e comecei a produzir a minha apresentação. No slide onde iria plotar o gráfico que eu queria, eu recorri ao pacote OECD, onde pude então coletar os dados que queria:


library(OECD)
df = get_dataset(dataset="EAG_FIN_RATIO_CATEGORY",
filter='AUS+AUT+BEL+CAN+CHL+CZE+DNK+EST+FIN+FRA+DEU+GRC+HUN+ISL+IRL+ISR+ITA+JPN+KOR+LVA+LTU+LUX+MEX+NLD+NZL+NOR+POL+PRT+SVK+SVN+ESP+SWE+CHE+TUR+GBR+USA+NMEC+ARG+BRA+COL+CRI+IND+IDN+RUS+ZAF.L1+L2T3+L5T8.FIN_PERSTUD.T.T.INST_T+INST_PUB+INST_PRIV',
start_time = '2015',
end_time = '2015')

O data frame df contém então os dados de gastos por aluno nos três níveis principais de ensino abrindo por instituições públicas, privadas e ambas. Assim, com um pouco de tratamento dos dados, cheguei ao gráfico abaixo.

Depois, foi só compilar o .Rmd e produzir a apresentação. Sem ter que abrir qualquer outro programa...

Todo esse processo, eu ensino no nosso novo Curso de Introdução ao R para Análise de Dados que abriu inscrições hoje, 06/05. O 1º lote está com 30% de desconto, mas deve acabar logo...

Interessados no código do gráfico, basta rolar a barra à direita e colocar o e-mail na nossa newsletter semanal. Toda segunda, envio o código de um dos posts mais comentados e curtidos da semana para a lista!

Dados históricos de pib per capita com o pacote maddison

By | Hackeando o R

Em uma noite de insônia, navegando pelo meu feed no facebook, acabei vendo um post do professor Carlos Eduardo Gonçalves com um gráfico de renda per capita fazendo referência ao projeto Maddison; que tem o ousado objetivo de estimar essa variável para todos os países do mundo desde os anos mais remotos. Acabei fazendo o que todo R Lover faria: dei um google para ver se tinha um pacote para o projeto. E, claro, tinha...

Acabei, então, dando uma vasculhada no dataset e escrevi algumas linhas de código, após comer um sanduíche... 🙂


library(maddison)
library(ggplot2)
library(scales)
library(png)
library(grid)

script começa carregando - depois de ter instalado o mesmo, obviamente - o pacote maddison. Depois carreguei o pacote ggplot2 e alguns pacotes acessórios a ele, para produzir um gráfico mais bonitinho... Antes, claro, como o dataset é imenso - tem 45.318 observações para 9 variáveis - eu fiz um subset do que eu estava interessado para poder montar um gráfico...


df = subset(maddison, year>='1870-01-01' &
iso2c %in% c('BR', 'US', 'CL', 'JP', 'KR'))

Com o código acima, eu peguei os dados do pib per capita para Brasil, Estados Unidos, Chile, Japão e Coréia do Sul desde 1870, quando os primeiros dados para o Brasil estavam disponíveis. Com esses dados, construí o gráfico abaixo.

Algumas coisas me chamaram atenção nesse gráfico. Observe que tínhamos em 1870 a mesma renda per capita do Japão, que nos deixou para trás. Em 1980, tínhamos a mesma renda da Coreia do Sul, que também nos deixou para trás. Nesses 30 anos, diga-se, o Chile nos deu um banho de crescimento. E os EUA mantém uma linha praticamente linear de crescimento.

Fico pensando até quando o Brasil vai ficar para trás... Mas, isso já é um outro tema...

Caso queira receber o código do gráfico acima, rola a barrinha à direita e coloca seu e-mail na nossa newsletter! Na próxima segunda-feira, vou enviar algumas coisas bem legais para a lista!

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais
e conteúdos exclusivos sobre Análise de Dados!

Assinar Gratuitamente