Transformando preços em log-retornos mensais com o R tidyquant

No post anterior, eu mostrei como é possível coletar os preços de ações com o R através do pacote quantmod, utilizando a base de dados do Yahoo Finance. Essa representação dos dados, contudo, não é a mais conveniente para a gestão de portfólios, como veremos no nosso Novo Curso Mercado Financeiro e Gestão de Portfólios. Para fins de construção de portfólios, é conveniente usarmos os retornos ou log-retornos dos ativos. De fato, uma grande parte dos estudos financeiros envolve retorno, ao invés de preço, de ativos. Isto porque, retorno de ativos pode ser um completo sumário para oportunidades de investimento, bem como séries de retorno são mais fáceis de lidar do que séries de preço porque aquelas possuem propriedades estatísticas mais atrativas.

Há, entretanto, diversas definições de retorno de ativos. Tomando P_t como o preço de um ativo no tempo t, considerando que a princípio o ativo não paga dividendos, ao manter um ativo por um período de t-1 a t, isso resultaria em um retorno bruto simples de

(1)   \begin{align*} 1 + R_t = \frac{P_t}{P_{t-1}} \end{align*}

O retorno líquido ou simples então será de

(2)   \begin{align*} R_t = \frac{P_t}{P_{t-1}} - 1 = \frac{P_t - P_{t-1}}{P_{t-1}} \end{align*}

Já o logaritmo natural do retorno bruto simples de um ativo é chamado de retorno composto continuamente ou simplesmente log-retorno:

(3)   \begin{align*} r_t = \text{ln} (1+R_t) = \text{ln} \frac{P_t}{P_{t-1}} = p_t - p_{t-1} \end{align*}

onde p_t = ln (P_t).  A seguir, pegamos nossas ações coletadas no post anterior e calculamos os log-retornos mensais com o pacote tidyquant.


library(tidyverse)
library(tidyquant)
library(timetk)
library(scales)
library(quantmod)

prices = getSymbols(symbols, src='yahoo',
from='2019-01-01',
to='2020-04-20',
warning=FALSE) %>%
map(~Cl(get(.))) %>%
reduce(merge) %>%
`colnames<-` (symbols) %>%
tk_tbl(preserve_index = TRUE,
rename_index = 'date') %>%
drop_na()

returns = prices %>%
gather(asset, prices, -date) %>%
group_by(asset) %>%
tq_transmute(mutate_fun = periodReturn,
period='monthly',
type='log') %>%
spread(asset, monthly.returns) %>%
select(date, symbols)

A seguir, construímos um gráfico desses retornos.


ggplot(returns, aes(x=date))+
geom_line(aes(y=PETR4.SA, colour='PETR4'))+
geom_line(aes(y=ABEV3.SA, colour='ABEV3'))+
geom_line(aes(y=MGLU3.SA, colour='MGLU3'))+
geom_line(aes(y=VVAR3.SA, colour='VVAR3'))+
scale_colour_manual('',
values=c('PETR4'='blue',
'ABEV3'='red',
'MGLU3'='orange',
'VVAR3'='green'))+
scale_x_date(breaks = date_breaks("1 month"),
labels = date_format("%b/%Y"))+
theme(axis.text.x=element_text(angle=45, hjust=1),
legend.position = 'bottom',
plot.title = element_text(size=10, face='bold'))+
labs(x='', y='',
title='Log-Retornos mensais de ações brasileiras selecionadas',
caption='Fonte: analisemacro.com.br com dados do Yahoo Finance')

Observa-se uma queda forte no mês de março por conta da pandemia do coronavírus, como era esperado.

(*) Isso e muito mais você irá aprender no nosso Novo Curso Mercado Financeiro e Gestão de Portfólios.


Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Coletando e integrando dados do BCB, IBGE e IPEA de forma automatizada

Quem trabalha com modelagem e previsão macroeconômica sabe o quanto é demorado reunir dados de diferentes fontes — Banco Central, IBGE, IPEA, FRED, IFI... Cada um com sua API, formato, frequência e estrutura. Esse gargalo de coleta e padronização consome tempo que poderia estar sendo usado na análise, nos modelos ou na comunicação dos resultados.

Foi exatamente por isso que criamos uma rotina de coleta automatizada, que busca, trata e organiza séries temporais econômicas diretamente das APIs oficiais, pronta para ser integrada a pipelines de previsão, dashboards ou agentes de IA econometristas.

Criando operações SQL com IA Generativa no R com querychat

No universo da análise de dados, a velocidade para obter respostas é um diferencial competitivo. Frequentemente, uma simples pergunta de negócio — “Qual foi nosso produto mais vendido no último trimestre na região Nordeste?” — inicia um processo que envolve abrir o RStudio, escrever código dplyr ou SQL, executar e, finalmente, obter a resposta. E se pudéssemos simplesmente perguntar isso aos nossos dados em português, diretamente no nosso dashboard Shiny?

Dashboard Financeiro com IA e Shiny Python: Análise de Dados Abertos da CVM

Este artigo apresenta um tutorial completo sobre como construir uma ferramenta de análise financeira de ponta. Utilizando Shiny for Python, demonstramos a automação da coleta de dados das Demonstrações Financeiras Padronizadas (DFP) da CVM e o tratamento dessas informações com Pandas. O ponto alto do projeto é a integração da IA Generativa do Google Gemini, que atua como um assistente de análise, interpretando os dados filtrados pelo usuário e fornecendo insights contábeis e financeiros em tempo real. O resultado é um dashboard dinâmico que democratiza a análise de dados complexos e acelera a tomada de decisão.

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.