Como a IA pode auxiliar na otimização de Portfólio de Investimentos?

A construção de portfólio ótimo refere-se ao processo de alocar eficientemente capital entre um conjunto predefinido de ativos ou títulos. O campo da construção de portfólio tem sido extensivamente estudado por acadêmicos e profissionais desde a década de 1950, quando Markowitz introduziu sua inovadora abordagem de média-variância para a construção de portfólio. Diante disso, podemos melhorar o processo de alocação de peso de um investimento em um portfólio através do Aprendizado não supervisionado com a aplicação do Hierarchical Risk Parity (HRP). Neste exercício, realizamos uma introdução ao método e mostramos os resultados de um exemplo criado através do Python.

Para obter o código e o tutorial deste exercício faça parte do Clube AM e receba toda semana os códigos em R/Python, vídeos, tutoriais e suporte completo para dúvidas.

Alunos inscritos no curso de Mercado Financeiro e Gestão de Portfólio com o Python têm a oportunidade de adquirir conhecimento em todas as etapas a seguir, além de obter uma compreensão teórica abrangente das principais ferramentas utilizadas no Mercado Financeiro.

Introdução

Mais de sessenta anos depois, o trabalho de Markowitz ainda é a base da moderna teoria de portfólio. Apesar de a teoria moderna de portfólio ainda girar em torno da abordagem de média-variância de Markowitz, ela continua sujeita a extensa pesquisa. Isso se deve ao fato de que, embora o portfólio de média-variância de Markowitz seja ótimo na teoria, ele pode ser um tanto falho e pouco confiável na prática. Essas falhas resultam de dois problemas fundamentais com a abordagem de média-variância de Markowitz:

  1. Exige a estimativa de retornos esperados.
  2. Exige a estimativa e, mais importante, a inversão de uma matriz de covariância positiva definida.

O primeiro problema deu origem a um aumento no uso de estratégias de otimização baseadas em risco, como risk budgeting e risk parity. Estudos demonstraram que a estimativa de retornos esperados tem um impacto maior na instabilidade do portfólio do que a estimativa da matriz de covariância.

Apesar de as estratégias de alocação baseadas em risco não dependerem da estimativa de retornos esperados, elas ainda requerem a inversão de uma matriz de covariância potencialmente mal condicionada. Geralmente, a matriz de covariância é mal condicionada quando os ativos são altamente correlacionados, implicando um alto número de condição. A inversão de uma matriz mal condicionada muitas vezes resulta na amplificação de erros inerentes à estimativa e, em última análise, resulta em um portfólio numericamente instável, conhecido como a “Markowitz Curse”.

Devido à falta de confiabilidade e ao desempenho insatisfatório tanto do portfólio de média-variância de Markowitz quanto de outras estratégias de otimização baseadas em risco, muitas pesquisas têm se concentrado em estratégias para melhorar a robustez e reduzir a instabilidade numérica da matriz de covariância.

Em 2016, Lopéz de Prado introduziu uma nova estratégia de alocação de ativos na tentativa de contornar as falhas inerentes das estratégias tradicionais de otimização. A abordagem Hierarchical Risk Parity (HRP) apresentada combina a hierarquização de ativos com uma estratégia heurística de alocação baseada em risco, com o objetivo de tornar a alocação mais ótima. Em resumo, a abordagem opera em três etapas:

  1. Os ativos são agrupados com base em correlações entre pares para formar uma árvore.
  2. Os ativos são rearranjados de acordo com a estrutura da árvore para formar uma matriz de covariância quase diagonal.
  3. As alocações são divididas entre subconjuntos de ativos usando alocação inversa de variância.

Na prática, o HRP não requer a previsão de retornos nem a inversão da matriz de covariância. Como resultado, a abordagem visa não apenas lidar com a instabilidade do portfólio construído, mas também melhorar o desempenho e reduzir a concentração.

Clustering

A análise de agrupamento, ou clustering, é uma técnica de aprendizado não supervisionado na qual um algoritmo organiza dados não rotulados em grupos ou clusters com base em características semelhantes. O objetivo é descobrir padrões naturais nos dados, agrupando instâncias que compartilham características comuns. Diferentemente do aprendizado supervisionado, onde o algoritmo é treinado com dados rotulados para realizar tarefas específicas, o aprendizado não supervisionado não depende de rótulos prévios e busca encontrar estruturas subjacentes nos dados de forma independente.

Mais especificamente, o agrupamento é o processo de agrupar uma coleção de objetos em clusters com base em um conjunto selecionado de características associadas a esses objetos. O agrupamento pode ser usado para diferentes propósitos, mas o objetivo geral é dividir objetos em clusters de tal maneira que objetos semelhantes sejam colocados no mesmo cluster, enquanto objetos dissimilares são colocados em clusters diferentes. O grau de semelhança entre dois objetos é determinado em relação às características dos objetos e a uma definição formal de semelhança ou dissimilaridade. A dissimilaridade entre dois objetos muitas vezes é medida de distância, como a distância euclidiana ao quadrado entre os vetores de características dos dois objetos. O quanto uma medida de distância é apropriada depende em grande parte dos dados e do objetivo. Por exemplo, pode fazer menos sentido usar a distância euclidiana ao quadrado como medida de dissimilaridade para características não quantitativas.

Além disso, o agrupamento pode ser dividido em duas classes principais - agrupamento particional e agrupamento hierárquico. O agrupamento particional cria uma partição de nível único dos objetos, e os métodos mais comuns são k-means e k-medoids. O agrupamento hierárquico, por outro lado, cria uma hierarquia de múltiplas partições binárias. Como o agrupamento hierárquico é um dos principais elementos desta tese, a próxima seção é dedicada a uma descrição mais elaborada do tópico.

Hierarchical Clustering

O Hierarchical Clustering classifica dados em clusters binários aninhados, resultando em uma estrutura hierárquica ou árvore. Uma vantagem do Hierarchical Clustering é sua consideração pelas estruturas hierárquicas claras que podem existir em sistemas complexos, como os mercados financeiros, influenciando fortemente a dinâmica desses sistemas. O clustering hierárquico oferece uma descrição quantitativa dessas hierarquias, contribuindo para uma modelagem mais adequada de um sistema.

No entanto, o Hierarchical Clustering requer que os objetos a serem classificados tenham medidas numéricas em um conjunto de características. Cada objeto tem seu próprio vetor de características, que conjuntamente constituem a matriz de características, onde cada linha corresponde a um objeto e cada coluna corresponde a uma característica. A análise é subsequentemente realizada nas linhas desta matriz. As características são usadas para calcular as distâncias entre os objetos, que servem como base para o agrupamento - objetos com características semelhantes são agrupados, e objetos com características diferentes são colocados em clusters diferentes.

No contexto da construção de portfólio, a matriz de correlação pode servir como base para a análise, onde cada ativo representa um objeto e as características podem ser definidas como uma função das correlações par a par entre os ativos. Além disso, o clustering hierárquico pode ser descrito em termos de dois passos principais: (1) estruturar os dados para representar a distância entre os objetos e (2) realizar o agrupamento e introduzir a hierarquia. O primeiro passo envolve a escolha de uma medida de distância adequada e a avaliação dos dados com base nessa medida, geralmente envolvendo o cálculo das distâncias entre os vetores de características. O segundo passo consiste em formar os clusters com base nas distâncias determinadas no primeiro passo e em algum critério de ligação, que define a distância entre os clusters.

Por fim, vale mencionar que existem dois tipos principais de clustering hierárquico - aglomerativo e divisivo. O clustering aglomerativo é comumente descrito como uma abordagem ascendente, enquanto o clustering divisivo é uma abordagem descendente. Em cada iteração, dois clusters são combinados, reduzindo o número de clusters em um a cada iteração até restar apenas um cluster. Na última iteração, a raiz da árvore é formada. A decisão de quais clusters combinar em cada iteração é determinada pelas distâncias entre os clusters presentes nessa iteração, geralmente combinando os dois clusters com a menor distância entre eles. No entanto, diferentes critérios de ligação definem as distâncias entre os clusters de maneiras diversas, resultando em árvores muito diferentes.

Construção de Portfólio com Hierarchical Clustering

A construção de portfólio utilizando o algoritmo de Hierarchical Clustering envolve um processo intricado dividido em três etapas fundamentais, cada uma desempenhando um papel crucial na otimização do portfólio:

1. Hierarchical Clustering

O primeiro passo envolve a aplicação do Hierarchical Clustering, uma técnica que agrupa ativos financeiros com base em padrões identificados nos dados históricos. Este algoritmo forma clusters que encapsulam ativos com características semelhantes, promovendo a criação de grupos que compartilham uma afinidade específica. A visualização desse agrupamento é frequentemente facilitada através de um dendrograma, uma representação gráfica que ilustra as relações hierárquicas entre os clusters.

Este estágio é crucial para a identificação de conjuntos de ativos que exibem comportamentos similares ao longo do tempo, permitindo a construção de um portfólio mais diversificado e equilibrado. Usualmente, existem 4 algortimos que podem ser aplicados, cada um com sua função (não iremos entrar em detalhes)

  • (Default) Single linkage
  • Complete linkage
  • Average linkage
  • Ward’s linkage

O dendograma de exemplo abaixo pode ajudar a entender o processo de agrupamento.

2. Quasi-Diagonalization

A etapa subsequente, conhecida como Quasi-Diagonalization, incide sobre a reorganização da matriz de covariância dos ativos. Nesse processo, as linhas e colunas da matriz são rearranjadas de modo a reunir ativos com características semelhantes, enquanto aqueles com comportamentos distintos são separados. Esta reorganização efetua uma espécie de “diagonalização aproximada”, favorecendo uma representação visual que evidencia a proximidade entre ativos similares. Uma representação gráfica, como um diagrama, pode oferecer uma visão clara dessa reorganização.

3. Recursive Bisection

A terceira etapa, conhecida como Recursive Bisection, atribui pesos ao portfólio de forma ascendente e recursiva, desdobrando os clusters hierárquicos formados anteriormente. Cada cluster é subdividido em sub-clusters, começando com um cluster maior e descendendo na árvore hierárquica. Esse processo faz uso da matriz quasi-diagonalizada, partindo do pressuposto de que, para uma matriz diagonal, a alocação de inverso-variância é a alocação mais otimizada.

Essa abordagem progressiva permite uma alocação eficiente de pesos no portfólio, adaptando-se dinamicamente às mudanças nas características e comportamentos dos ativos ao longo do tempo. No entanto, é essencial ressaltar que, como em qualquer estratégia de construção de portfólio, a interpretação cuidadosa dos resultados e a compreensão das nuances do mercado são cruciais para o sucesso dessa abordagem.

Exemplo no Python

Para construir o HRP no Python, podemos ter como auxilio a biblioteca riskfolio, que permite utilizar diversos algoritmos de otimização de portfólio. Usamos dados dos seguintes tickers: 'AAPL', "AMZN", 'ITSA4.SA', 'BBDC4.SA' no período de 2018 até o fim de 2022.

 

O primeiro passo é o de calcular o retorno (diário) dos ativos, como abaixo:

Código
AAPL AMZN ITSA4.SA BBDC4.SA
Date
2018-01-03 -0.0174% 1.2775% 0.4598% 1.1786%
2018-01-04 0.4645% 0.4476% 1.6407% 1.8818%
2018-01-05 1.1386% 1.6163% 0.5665% 0.1759%
2018-01-08 -0.3714% 1.4425% -0.0282% -0.0878%
2018-01-09 -0.0115% 0.4676% -0.9296% -1.5817%

 

Em seguida, construímos o Dendograma, de forma a verificar o agrupamento. Veja que empresas brasileiras e norte-americanas são separadas.

Estimando o HRP Portfolio

Facilmente obtemos os pesos ótimos criados pelo algortimo. Perceba que não há concentração em um único ativo, bem como as empresas norte-americanas possuem um peso maior.

Código
AAPL AMZN ITSA4.SA BBDC4.SA
weights 27.4505% 24.0130% 19.7672% 28.7693%

A composição pode ser facilmente visualizada.

Por fim, é possível obter a contribuição ao risco de cada ativo do portfólio ótimo, obtendo o gráfico abaixo:

Quer aprender mais?

Clique aqui para fazer seu cadastro no Boletim AM e baixar o código que produziu este exercício, além de receber novos exercícios com exemplos reais de análise de dados envolvendo as áreas de Data Science, Econometria, Machine Learning, Macroeconomia Aplicada, Finanças Quantitativas e Políticas Públicas diretamente em seu e-mail.

Referências

Pál, László (2022). Asset Allocation Strategies Using Covariance Matrix Estimators. Acta Universitatis Sapientiae Economics and Business

Nanakorn, N., & Palmgren, E. (2021). Hierarchical Clustering in Risk-Based Portfolio Construction (Dissertation). Retrieved from https://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-304668

M. Lopéz de Prado. Building diversified portfolios that outperform out of sample. The Journal of Portfolio Management, 42(4):56–69, 2016.

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Onde encontrar dados e ferramentas para text mining?

A aplicação das técnicas de mineração de texto pode trazer análises quantitativas informativas sobre a emoção, tom, categoria e outros padrões de interesse em documentos textuais. O primeiro passo é identificar, coletar e preparar estes dados brutos. Neste artigo, apresentamos bases de dados públicas de Economia e Finanças que podem ser exploradas, assim como ferramentas de programação úteis.

O que é mineração de textos e sua relação com IA?

Com uma matéria prima em comum, a mineração de textos e a inteligência artificial generativa usam grandes volumes de dados não estruturados para fins distintos e com aplicações em Economia, Finanças, Marketing e outras áreas. Mas quando devemos usar uma técnica e não a outra? O que é possível fazer e o que é mineração de textos? Neste artigo introduzimos estes tópicos e fornecemos alguns exemplos de aplicações.

Avaliando a evolução do Funcionalismo Público nos Estados Brasileiros usando Controle Sintético no R

O objetivo deste exercício é introduzir o uso do método de Controle Sintético na linguagem de programação R, aplicando-o a um exemplo prático relevante para a análise de políticas públicas. Vamos focar na utilização dessa técnica para avaliar o impacto do Regime de Recuperação Fiscal (RRF) sobre o número de vínculos do poder executivo nos estados brasileiros, com ênfase no caso do Rio de Janeiro.

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.