Hackeando o R: construindo gráficos com resultados estatísticos

Nesse post do Hackeando o R, iremos dar uma olhada em um pacote bem interessante que pode ajudar na criação de gráficos com propriedades estatísticas, de forma que a análise visual se torne mais simples e rápida.

O pacote {ggstatsplot} facilita não só a criação, bem como ajuda a sumarizar resultados estatísticos dentro dos próprios gráficos pro usuário.

Iremos utilizar como exemplo nesse post dados referentes aos retornos mensais de três ativos financeiros: PETR4, ITUB4 e ABEV3, além também dos retornos mensais do índice ibovespa. Caso tenha interesse em aprender a como obter esses dados, veja nosso post sobre.

Vamos utilizar os dados da Ibovespa para visualizar o histograma. Veja que o pacote insere uma expressão indicando a média dos retornos, em conjunto com uma linha tracejada. Também é retornado um linha com resultados sobre t-test, p-value, intervalo de confiança, tamanho de efeito, além do número de observações.

# Histograma
gghistostats(
  data = ibov_returns,
  x = `Ibovespa`,
  bindwidth = 1,
  normal.curve = TRUE,
  normal.curve.args = list(color = "red", size = 0.7)
)

Caso tenha um conjunto de dados com diversas variáveis, é possível gerar um gráficos com todas em conjunto.

# Histogramas agrupados

grouped_gghistostats(
  data = asset_returns_long,
  x = returns,
  grouping.var = assets,
  bindwidth = 1,
  normal.curve = TRUE,
  normal.curve.args = list(color = "red", size = 0.7),
  plotgrid.args = list(nrow = 2)
)

Além de um único histograma, é possível também gerar um gráfico de dispersão com uma reta de regressão, além do respectivo histograma de cada variável.

# Gráfico de dispersão com linha de regressão e Histograma

ggscatterstats(
  data = all_returns,
  x = `Ibovespa`,
  y = `ITUB4`
)

Também é possível criar uma matriz de correlação.

# Gráfico de correlação

ggcorrmat(
  data = all_returns,
  colors = c("#B2182B", "white", "#4D4D4D"),
  title = "",
  subtitle = ""
)

O pacote trabalha também com conjunto de dados de outras classes, não só numéricos, utilizando uma estatística apropriada para cada. Além de diversos outros gráficos.

________________________
(*) Para entender mais sobre análises estatísticas, confira nosso Curso de Estatística usando R e Python.

________________________

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Transfer Learning: mostrando porque o Python está na ponta do desenvolvimento

A aprendizagem por transferência (transfer learning) é o reuso de um modelo pré-treinado em um novo problema. Portanto, sua utilização torna-se um avanço enorme para a previsão de diferentes tipos de variáveis, principalmente para aquelas ordenadas no tempo. Mostramos nesta postagem o uso do Transfer Learning com o Python para o caso de Séries Temporais.

Criando Tabelas com o Python: mostrando o poder da linguagem sobre o Excel

Nos dias atuais, pessoas que trabalham com dados estão constantemente confrontados com um dilema: criar uma tabela não tão genial no Excel ou manter em um formato ainda pior, como um dataframe, mas mantendo a flexibilidade de obtenção dos dados. Podemos resolver esse grande problema, unindo a flexibilidade e beleza ao usar a biblioteca great_tables do Python.

Análise do Censo Demográfico com o R

Como podemos analisar dados do Censo Demográfico para produzir pesquisas e implementar políticas públicas? Mostramos nesta postagem o resultado de uma breve análise dos dados preliminares do Censo Demográfico de 2022 usando o R.

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.