Lendo as cartas dos gestores com IA usando Python

O que os gestores de fundos de investimentos pensam sobre os mercados e sobre a economia? Todo mês, dezenas de gestores publicam suas cartas relatando sua visão, desempenho e outras informações relevantes para os cotistas. No entanto, ler estes relatórios pode facilmente tomar 1 dia inteiro ou mais de trabalho. Para economizar este tempo, podemos utilizar inteligência artificial e sumarizar os principais tópicos do documento em poucos segundos!

Neste artigo mostramos como usar um modelo LLM para ler e sumarizar as “Cartas do Gestor”, publicadas em fundos de investimento no Brasil. Em menos de 60 linhas de código, criamos uma aplicação completa em Python que pega um arquivo PDF da carta do gestor, processa os dados e usa inteligência artificial para sumarizar os pontos chave do texto.

Aprenda a coletar, processar e analisar dados na formação de Do Zero à Análise de Dados com Python.

Passo 01: bibliotecas de Python necessárias

Para criar o app, utilizaremos as seguintes bibliotecas no Python:

  • shiny para desenvolver o app/dashboard.
  • langchain para processar os dados e o prompt de LLM.
  • langchain_community para ler o PDF.
  • langchain_openai para usar a API do ChatGPT (OpenAI).
  • os para gerenciar chave de token da API da OpenAI.
  • pypdf para trabalhar com PDFs.

Certifique-se de ter todas as bibliotecas instaladas.

Para obter o código e o tutorial deste exercício faça parte do Clube AM e receba toda semana os códigos em R/Python, vídeos, tutoriais e suporte completo para dúvidas.

Passo 02: chave de autenticação da API da OpenAI

Para utilizar o modelo de inteligência artificial ChatGPT, é necessário obter uma chave de token na plataforma OpenAI (veja mais informações aqui).

Com a chave de token em mãos, defina uma variável de ambiente com nome OPENAI_API_KEY para armazenar a chave.

Atenção: a utilização da API da OpenAI não é gratuita. Verifique o site da empresa para mais informações.

Passo 03: interface visual do app/dashboard

Para simplificar o exemplo, vamos criar o app com um visual simples, contendo apenas:

  • Título do app
  • Descrição breve sobre a funcionalidade
  • Campo de texto para inserir o link do PDF
  • Painel para exibir o sumário do PDF gerado pela inteligência artificial

Tudo isso pode ser feito em cerca de 12 linhas de código utilizando a biblioteca Shiny.

Passo 04: conversão de PDF para texto

Para que a carta do gestor possa ser lida pela inteligência artificial, precisamos converter o conteúdo do arquivo PDF para o formato de texto. Fazemos isso da seguinte forma:

  • Definimos o componente Servidor do Shiny para implementar a lógica de funcionamento do app.
  • Definimos uma função reativa para ler o arquivo PDF informado pelo usuário através do link e converter para o formato de texto.

Passo 05: engenharia de prompt e modelo de inteligência artificial

Ainda no componente Servidor, iniciado no passo anterior, definimos qual será a instrução enviada para a inteligência artificial e qual modelo cumprirá esta tarefa. Estes procedimentos são realizados da seguinte forma:

  • Utilizamos o prompt a seguir para instruir o modelo de inteligência artificial a sumarizar o texto fornecendo uma breve descrição sobre o mesmo.
    Escreva um sumário do texto a seguir delimitado com 3 crases. Retorne sua resposta em 3 ou 5 marcadores com uma breve descrição dos pontos chave do texto.
    ```{TEXTO}```
    SUMÁRIO:
  • Definimos o gpt-3.5-turbo, da OpenAI, como modelo de inteligência artificial a ser utilizado.
  • Utilizamos o langchain para processar automaticamente o prompt e o texto, além de fazer a comunicação com a API da OpenAI para retornar a resposta do modelo.

Passo 06: execução e teste do app

Para rodar o app/dashboard localmente e testar o funcionamento com diferentes cartas do gestor, utilizamos o Shiny. A biblioteca se encarrega de unir as definições da interface e da lógica de servidor para gerar a dashboard que pode ser visualizada pelo navegador, conforme abaixo:

Conclusão

Neste artigo mostramos como usar um modelo LLM para ler e sumarizar as “Cartas do Gestor”, publicadas em fundos de investimento no Brasil. Em menos de 60 linhas de código, criamos uma aplicação completa em Python que pega um arquivo PDF da carta do gestor, processa os dados e usa inteligência artificial para sumarizar os pontos chave do texto.

Quer aprender mais?

Clique aqui para fazer seu cadastro no Boletim AM e baixar o código que produziu este exercício, além de receber novos exercícios com exemplos reais de análise de dados envolvendo as áreas de Data Science, Econometria, Machine Learning, Macroeconomia Aplicada, Finanças Quantitativas e Políticas Públicas diretamente em seu e-mail.

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Criando operações SQL com IA Generativa no R com querychat

No universo da análise de dados, a velocidade para obter respostas é um diferencial competitivo. Frequentemente, uma simples pergunta de negócio — “Qual foi nosso produto mais vendido no último trimestre na região Nordeste?” — inicia um processo que envolve abrir o RStudio, escrever código dplyr ou SQL, executar e, finalmente, obter a resposta. E se pudéssemos simplesmente perguntar isso aos nossos dados em português, diretamente no nosso dashboard Shiny?

Dashboard Financeiro com IA e Shiny Python: Análise de Dados Abertos da CVM

Este artigo apresenta um tutorial completo sobre como construir uma ferramenta de análise financeira de ponta. Utilizando Shiny for Python, demonstramos a automação da coleta de dados das Demonstrações Financeiras Padronizadas (DFP) da CVM e o tratamento dessas informações com Pandas. O ponto alto do projeto é a integração da IA Generativa do Google Gemini, que atua como um assistente de análise, interpretando os dados filtrados pelo usuário e fornecendo insights contábeis e financeiros em tempo real. O resultado é um dashboard dinâmico que democratiza a análise de dados complexos e acelera a tomada de decisão.

Econometria, ML ou IA para previsão da PMS?

Prever a Pesquisa Mensal de Serviços (PMS/IBGE) é um desafio por natureza: trata-se de uma série mensal, sujeita a volatilidade e choques que vão de fatores sazonais a mudanças estruturais no setor. Para enfrentar esse problema, realizamos um exercício de comparação entre três abordagens de modelagem: econometria tradicional (ARIMA), machine learning (XGBoost) e inteligência artificial (TimeGPT).

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.