Analisando a Volatilidade de Longo Prazo do Ibovespa usando Python

Uma importante medida em finanças é o risco associado a um ativo e a volatilidade de ativos é talvez a medida de risco mais utilizada. Há, entretanto, diversas medidas de volatilidade.

Como a média móvel ponderada exponencialmente (EWMA), a heteroscedasticidade condicional autorregressiva (ARCH) e a heteroscedasticidade condicional autorregressiva generalizada (GARCH). A característica marcante dos modelos é que eles reconhecem que as volatilidades e correlações não são constantes. Durante alguns períodos, uma determinada volatilidade ou correlação pode ser relativamente baixa, enquanto durante outros pode ser relativamente alta. Os modelos tentam acompanhar as variações da volatilidade ou da correlação com o tempo.

Análise da Volatilidade do Índice Bovespa

Com base no modelo GARCH(1,1), iremos realizar a modelagem da variância condicional dos log retornos diários do Ibovespa, abrangendo o período de janeiro de 2018 até dezembro de 2023. O objetivo principal é compreender a implementação desse modelo utilizando a linguagem de programação Python, além de conduzir uma análise do mercado acionário brasileiro ao longo do período amostral.Ao concluirmos este exercício, teremos a capacidade de obter uma medida representativa da variância de longo prazo da série temporal. Essa medida poderá ser comparada com a variância histórica, permitindo-nos inferir se a volatilidade presente está atualmente inferior ou superior àquela projetada para o futuro. Essa análise contribuirá para uma melhor compreensão da dinâmica da volatilidade no mercado acionário brasileiro.

Para obter o código deste exercício faça parte do Clube AM e receba toda semana os códigos em R/Python, vídeos, tutoriais e suporte completo para dúvidas.

Construção do modelo

Construir um modelo de volatilidade para uma série de retorno de ativo consiste em quatro etapas:

  • Especificar uma equação da média testando para dependência serial nos dados e, se necessário, construir um modelo econométrico para a série de retorno de modo a remover qualquer dependência linear;
  • Utilizar os resíduos da equação da média para testar efeitos ARCH;
  • Especificar um modelo de volatilidade se o efeito ARCH foi estatisticamente significativo e performar uma estimativa conjunta da equação da média e da volatilidade;
  • Checar o modelo estimado com cuidado e refinar, caso necessário.

Modelo GARCH

O Modelo GARCH foi proposto por Bollerslev (1986), como uma versão melhorada do modelo ARCH produzido por Engle (1982). Definimos

    \[a_t = \sqrt{\sigma^2_t} e_t\]

onde e_t é uma variável aleatória IID.

Podemos utilizar a distribuição Normal, t-Student, t-student assimétrica, etc.

\sigma_t^2 é o processo da variância e possui componente autoregressiva e
dependência de a^2_t.

    \[\sigma_t^2 = \omega + \sum_{i=1}^p \alpha_i a^2_{t-i} + \sum_{i=1}^q \beta_i \sigma^2_{t-i}\]

Aqui, \omega representa \gamma V_l, onde \gamma é o peso alocado a taxa de variância de longo prazo V_l, \alpha é o peso alocado a a^2_{t-1} e \beta é peso alocado a \sigma^2_{t-i}

Depois que \omega, \alpha e \beta foram estimados, podemos calcular \gamma como 1 - \alpha - \beta. A variância de longo prazo VL pode então ser calculada como \omega/\gamma. Para um processo GARCH(1,1) estável, precisamos que \alpha + \beta < 1. Caso contrário, o peso aplicado à variância de longo prazo é negativo.

Abaixo, estimamos o GARCH(1,1) para a série de log retornos diários do Ibovespa, tomando como equação da média um AR(1), e uma distribuição t de student assimétrica.

Código
AR - GARCH Model Results
Dep. Variable: Adj Close R-squared: 0.000
Mean Model: AR Adj. R-squared: 0.000
Vol Model: GARCH Log-Likelihood: -2530.89
Distribution: Standardized Skew Student's t AIC: 5073.78
Method: Maximum Likelihood BIC: 5105.60
No. Observations: 1485
Date: Mon, Jan 08 2024 Df Residuals: 1484
Time: 16:38:23 Df Model: 1
Mean Model
coef std err t P>|t| 95.0% Conf. Int.
Const 0.0656 3.212e-02 2.043 4.110e-02 [2.653e-03, 0.129]
Volatility Model
coef std err t P>|t| 95.0% Conf. Int.
omega 0.0842 2.773e-02 3.038 2.379e-03 [2.990e-02, 0.139]
alpha[1] 0.0767 1.728e-02 4.436 9.171e-06 [4.279e-02, 0.111]
beta[1] 0.8788 2.603e-02 33.757 8.371e-250 [ 0.828, 0.930]
Distribution
coef std err t P>|t| 95.0% Conf. Int.
eta 10.9362 2.815 3.885 1.022e-04 [ 5.419, 16.453]
lambda -0.1196 4.054e-02 -2.951 3.172e-03 [ -0.199,-4.016e-02]

Verificamos que ao longo do período da amostra o ponto de "salto" da volatilidade ocorre em 2020, início do período da pandemia de covid. Pequenos "saltos" são verificados em parcelas de períodos diferentes, ocasionados por diversos eventos e turbulências no mercado acionário. Em relação ao último períodos da amostra, referente ao ano de 2023, verifica-se uma queda no valor da volatilidade.

Volatilidade de Longo Prazo

A variância incondicional representa a estimativa da variância que a série temporal de retornos eventualmente convergirá, assumindo que a série é infinitamente longa e que as condições de mercado permanecem constantes no longo prazo. É dada por:

    \[\mathrm{Var}\,r_t = \frac{\omega}{1 - \alpha_1 - \beta_1}\]

Podemos comparar a variância incondicional estimada em janelas móveis com a variância amostral também em janelas móveis. Assim, podemos ter os seguintes critérios de análise:

  • Se a Volatilidade Amostral é Maior que a Volatilidade Incondicional:
    • Isso pode indicar que, no curto prazo, a série de retornos está experimentando picos de volatilidade acima do nível que se esperaria no longo prazo de acordo com o modelo GARCH. Pode sugerir períodos de maior instabilidade ou eventos anômalos na série temporal.
  • Se a Volatilidade Amostral é Menor que a Volatilidade Incondicional:
    • Isso pode sugerir que, no curto prazo, a série de retornos está experimentando uma volatilidade abaixo da média esperada no longo prazo pelo modelo GARCH. Pode indicar um período de estabilidade relativa ou menor variação nos retornos.

Referências

T. Bollerslev, “Generalized Autoregressive Conditional Heteroscedasticity”, Journal of Econometrics, 31 (1986): 307–27.

R. Engle “Autoregressive Conditional Heteroscedasticity with Estimates of the Variance of UK Inflation”, Econometrica, 50 (1982): 987–1008.

Quer aprender mais?

Clique aqui para fazer seu cadastro no Boletim AM e baixar o código que produziu este exercício, além de receber novos exercícios com exemplos reais de análise de dados envolvendo as áreas de Data Science, Econometria, Machine Learning, Macroeconomia Aplicada, Finanças Quantitativas e Políticas Públicas diretamente em seu e-mail.

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Coletando dados regionais do CAGED no Python

Os dados regionais do CAGED permitem analisar o mercado de trabalho de forma detalhada, em termos de setores, educação, rendimento e características pessoais dos trabalhadores brasileiros. Neste exercício mostramos como acessar estas informações online via Python.

Coletando dados de Setores Censitários do Censo 2022 no Python

Dados sobre a demografia e o território são primordiais para definir e implementar políticas públicas, áreas de atuação comercial e/ou estratégias de marketing. Sendo assim, saber usar os dados do Censo 2022 pode trazer vantagens competitivas. Neste exercício mostramos como obter os dados da Malha de Setores Censitários no formato vetorial (GeoJson) usando o Python.

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.