A avaliação do governo foi para o R

Uma das grandes vantagens de usar R é poder facilitar sua vida no momento de coletar e tratar dados. Para ilustrar, vamos supor, por exemplo, que tenhamos um arquivo .csv com dados de aprovação/desaprovação do governo federal. Vamos importar essa planilha para o R e mostrar um grande problema que ela tem.

data <- read.table('governo.csv', sep=';', dec=',', header=T)

data$DATE <- as.Date(data$DATE, format="%d/%m/%Y")

data <- xts(data[,c(2:4)], order.by = data$DATE)

Se plotarmos as colunas 1 e 2 do objeto data, respectivamente, aprovação e desaprovação do governo federal, obteremos algo como abaixo.

grafico01

Repare que o gráfico tem um grande problema. Por algum motivo, nosso arquivo .csv tem valores nulos em algumas linhas. Provavelmente porque nessas datas, não houve pesquisa de opinião. Isso tornar o gráfico poluído, não é mesmo? Para resolver isso, basta que retiremos esses valores do nosso objeto data. Isso é feito com a linha de código abaixo.

data <- data[!data$APROVA==0,]

Uma vez feito isso, podemos, agora assim, fazer um gráfico mais bonitinho com o código abaixo.

p <- autoplot(data[,c(1,2)], facets = F)

p + scale_colour_hue("Legenda", 
 labels=c('Aprovação', 
 'Desaprovação')) +
 ggtitle('Aprovação vs. Desaprovação do Governo Federal (%)')

E o resultado abaixo...

grafico02

Bem melhor, não? 🙂 O arquivo .csv aqui e o script do R aqui.

________________________________________________________________

Gostou? Veja nosso Curso de Introdução ao R. Aprenda a coletar, tratar, analisar e apresentar dados de forma bem mais produtiva!

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Análise do Censo Demográfico com o R

Como podemos analisar dados do Censo Demográfico para produzir pesquisas e implementar políticas públicas? Mostramos nesta postagem o resultado de uma breve análise dos dados preliminares do Censo Demográfico de 2022 usando o R.

Deploy de modelos com Python + Shinylive + GitHub gastando ZERO reais

Colocar modelos em produção pode ser um grande desafio. Lidar com custos monetários, infraestrutura operacional e complexidades de códigos e ferramentas pode acabar matando potenciais projetos. Uma solução que elimina todos estes obstáculos é a recém lançada Shinylive. Neste artigo mostramos um exemplo com um modelo de previsão para o preço do petróleo Brent.

Como automatizar tarefas repetitivas usando Python? Um exemplo para largar o Excel

Manter relatórios diários com dados e análises atualizados é um desafio, pois envolve várias etapas: coleta de dados, tratamento de informações, produção de análises e atualização de relatório. Para superar este desafio algumas ferramentas como Python + Quarto + GitHub podem ser usadas para automatizar tudo que for automatizável. Neste artigo mostramos um exemplo com dados do mercado financeiro.

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.