A avaliação do governo foi para o R

Uma das grandes vantagens de usar R é poder facilitar sua vida no momento de coletar e tratar dados. Para ilustrar, vamos supor, por exemplo, que tenhamos um arquivo .csv com dados de aprovação/desaprovação do governo federal. Vamos importar essa planilha para o R e mostrar um grande problema que ela tem.

data <- read.table('governo.csv', sep=';', dec=',', header=T)

data$DATE <- as.Date(data$DATE, format="%d/%m/%Y")

data <- xts(data[,c(2:4)], order.by = data$DATE)

Se plotarmos as colunas 1 e 2 do objeto data, respectivamente, aprovação e desaprovação do governo federal, obteremos algo como abaixo.

grafico01

Repare que o gráfico tem um grande problema. Por algum motivo, nosso arquivo .csv tem valores nulos em algumas linhas. Provavelmente porque nessas datas, não houve pesquisa de opinião. Isso tornar o gráfico poluído, não é mesmo? Para resolver isso, basta que retiremos esses valores do nosso objeto data. Isso é feito com a linha de código abaixo.

data <- data[!data$APROVA==0,]

Uma vez feito isso, podemos, agora assim, fazer um gráfico mais bonitinho com o código abaixo.

p <- autoplot(data[,c(1,2)], facets = F)

p + scale_colour_hue("Legenda", 
 labels=c('Aprovação', 
 'Desaprovação')) +
 ggtitle('Aprovação vs. Desaprovação do Governo Federal (%)')

E o resultado abaixo...

grafico02

Bem melhor, não? 🙂 O arquivo .csv aqui e o script do R aqui.

________________________________________________________________

Gostou? Veja nosso Curso de Introdução ao R. Aprenda a coletar, tratar, analisar e apresentar dados de forma bem mais produtiva!

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Como tratar dados no Python? Parte 5: renomeando colunas

Como dar novos nomes significativos para as colunas em uma tabela de dados usando Python? Neste tutorial mostramos os métodos de renomeação de colunas disponíveis na biblioteca pandas, que tem como vantagem sua sintaxe simples e prática.

Como tratar dados no Python? Parte 4: operações por grupos

Como mensalizar dados diários? Ou como filtrar os valores máximos para diversas categorias em uma tabela de dados usando Python? Estas perguntas são respondidas com os métodos de operações por grupos. Neste tutorial mostramos estes métodos disponíveis na biblioteca pandas, que tem como vantagem sua sintaxe simples e prática.

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.