A avaliação do governo foi para o R

Uma das grandes vantagens de usar R é poder facilitar sua vida no momento de coletar e tratar dados. Para ilustrar, vamos supor, por exemplo, que tenhamos um arquivo .csv com dados de aprovação/desaprovação do governo federal. Vamos importar essa planilha para o R e mostrar um grande problema que ela tem.

data <- read.table('governo.csv', sep=';', dec=',', header=T)

data$DATE <- as.Date(data$DATE, format="%d/%m/%Y")

data <- xts(data[,c(2:4)], order.by = data$DATE)

Se plotarmos as colunas 1 e 2 do objeto data, respectivamente, aprovação e desaprovação do governo federal, obteremos algo como abaixo.

grafico01

Repare que o gráfico tem um grande problema. Por algum motivo, nosso arquivo .csv tem valores nulos em algumas linhas. Provavelmente porque nessas datas, não houve pesquisa de opinião. Isso tornar o gráfico poluído, não é mesmo? Para resolver isso, basta que retiremos esses valores do nosso objeto data. Isso é feito com a linha de código abaixo.

data <- data[!data$APROVA==0,]

Uma vez feito isso, podemos, agora assim, fazer um gráfico mais bonitinho com o código abaixo.

p <- autoplot(data[,c(1,2)], facets = F)

p + scale_colour_hue("Legenda", 
 labels=c('Aprovação', 
 'Desaprovação')) +
 ggtitle('Aprovação vs. Desaprovação do Governo Federal (%)')

E o resultado abaixo...

grafico02

Bem melhor, não? 🙂 O arquivo .csv aqui e o script do R aqui.

________________________________________________________________

Gostou? Veja nosso Curso de Introdução ao R. Aprenda a coletar, tratar, analisar e apresentar dados de forma bem mais produtiva!

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Aplicando o Time Series Transformer para prever inflação (IPCA)

Neste exercício, exploramos a previsão de séries temporais utilizando o Temporal Fusion Transformer (TFT). O TFT é uma arquitetura de Deep Learning baseada em mecanismos de atenção, desenhada especificamente para lidar com múltiplas variáveis e horizontes de previsão longos, mantendo a interpretabilidade — uma característica frequentemente ausente em modelos de "caixa-preta".

Análise do Payroll norte-americano com Python

O Payroll norte-americano é o termômetro da economia global. No post de hoje, mostro como analisar esse indicador usando Python e as bibliotecas Pandas e Plotnine. Saia do básico e aprenda a visualizar a geração de empregos nos EUA de forma profissional.

O papel da credibilidade do Banco Central na desinflação da economia

O objetivo deste trabalho é mensurar a credibilidade da política monetária brasileira através de diferentes métricas e verificar empiricamente se uma maior credibilidade contribui para a redução da inflação. Realizamos a modelagem econométrica usando o pacote {systemfit} disponível na linguagem. Ao fim, criamos um relatório reprodutível com a combinação Quarto + R.

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.