Unir Análise de Dados e Inteligência Artificial (IA) para gerar relatórios automatizados poderia parecer apenas um sonho há pouco tempo atrás. Contudo, graças aos Modelos de Linguagem Grande (LLM, no inglês), hoje é possível criar relatórios completos apenas fornecendo algumas instruções e os dados a serem analisados.
Uma das vantagens de utilizar IA para analisar dados de maneira automatizada é a velocidade com que se chega em resultados palpáveis. Enquanto que um ser humano poderia levar horas até entender uma tabela de dados nova e construir uma análise, um modelo de IA pode aplicar todo o processo de análise de dados em questão de segundos de maneira customizável e reprodutível.
Aprenda a coletar, processar e analisar dados na formação de Do Zero à Análise de Dados com Python.
No entanto, para analisar dados utilizando IA é necessário um bom conhecimento de engenharia de prompt. Afinal, ainda precisamos dizer para o modelo de IA o que ele deve fazer (e esperar alguns segundos para ele entregar o resultado). Uma outra desvantagem é a limitação do tipo de resposta que estes modelos retornam dada uma instrução. Até o momento, não há modelos de IA que entreguem um arquivo PDF com, por exemplo, um relatório de análise de dados pronto.
Uma solução interessante para gerar relatórios automatizados de análise de dados utilizando IA é o uso de três ferramentas que integrem a IA, o código de análise de dados e um editor de texto para gerar o relatório. Felizmente essas ferramentas existem!
A ferramenta Quarto é um editor de texto que serve para criar relatórios, possibilitando escrever textos, executar códigos de Python e muito mais. O Google Gemini é um modelo de IA que entende e processa instruções textuais, retornando também respostas textuais. Sendo assim, podemos utilizar o Gemini através do Python para que o mesmo analise os dados de uma tabela. Esse código de Python pode ser armazenado e executado dentro de um arquivo do Quarto, que gera um relatório ao ser renderizado. Incrível, não? Vamos ver como isso funciona passo a passo.
Para obter o código e o tutorial deste exercício faça parte do Clube AM e receba toda semana os códigos em R/Python, vídeos, tutoriais e suporte completo para dúvidas.
Passo 01: arquivo de relatório no formato Quarto
Para gerar um relatório automatizado de análise de dados com ferramenta Quarto, é necessário criar um arquivo exemplo.qmd
e definir nas primeiras linhas as principais informações, como:
- Título
- Autor
- Data
- Língua
- Formato de saída
- Outras opções
---
title: "Relatório de Inflação"
author: "Inteligência Artificial"
date: today
lang: pt
format:
html:
embed-resources: true
execute:
echo: false
---
Passo 02: bibliotecas de Python
Para começar a estruturar o relatório e conseguir utilizar o modelo de IA para analisar dados, precisaremos das seguintes bibliotecas de Python:
- pandas para armazenar e tratar dados tabulares.
- google-generativeai para analisar dados com o modelo de IA do Google (Gemini).
- IPython para formatar as respostas textuais do modelo de IA no relatório.
exemplo.qmd
.Passo 03: dados de exemplo
Para exemplificar um relatório de análise de dados reais, utilizaremos o tema inflação no Brasil. Coletamos a tratamos os principais indicadores desse tema, com dados provenientes de fontes como IBGE e BCB. A tabela abaixo exibe uma parte da tabela que será analisada pelo modelo de IA:
data | IPCA (%, Variação acumulada em 12 meses) | IPCA (%, Variação mensal) | Meta de inflação (%, anual) | |
---|---|---|---|---|
237 | 2023-10-01 | 4.82 | 0.24 | 3.25 |
238 | 2023-11-01 | 4.68 | 0.28 | 3.25 |
239 | 2023-12-01 | 4.62 | 0.56 | 3.25 |
240 | 2024-01-01 | 4.51 | 0.42 | 3.00 |
241 | 2024-02-01 | 4.50 | 0.83 | 3.00 |
Certifique-se de inserir outro bloco de código Python no arquivo Quarto e importar a tabela de dados.
Passo 04: modelo de inteligência artificial (IA)
Para utilizar o modelo de inteligência artificial Gemini, é necessário obter uma chave de token na plataforma Google AI Studio (veja mais informações aqui).
Com a chave de token em mãos, defina em um novo bloco de código Python o modelo a ser utilizado, suas configurações e informe a chave para a autenticação funcionar.
Passo 05: layout do relatório
Agora definimos o aspecto visual do relatório, ou seja, como será a organização do conteúdo (textos, tabelas, gráficos, etc.). Aqui simplificamos e criamos apenas uma seção no relatório intitulado “Principais destaques” para colocar na sequência um texto de análise de dados e um gráfico, gerados por IA.
## Principais destaques
Passo 06: sumário de análise de dados por IA
A primeira automatização de análise de dados utilizando IA que colocamos no relatório é um sumário sobre os dados de inflação. Para tal, filtramos os dados que queremos que o modelo analise e damos uma instrução “para elaborar uma breve análise de conjuntura sobre a inflação”, pedindo para que a resposta seja retornada no formato de bullet points em markdown para ficar bem formatado no relatório.
Passo 07: visualização de dados por IA
Por fim, vamos pedir para o modelo de IA gerar um código de visualização de dados para observar a evolução temporal da inflação no Brasil. Pegamos o código Python gerado pelo modelo e executamos ele no próprio relatório para gerar um gráfico abaixo da análise textual acima.
Relatório final
Como resultado destes procedimentos, temos o relatório abaixo de análise de inflação no Brasil gerado pelo modelo de inteligência artificial Google Gemini, em conjunto com as ferramentas Quarto + Python.
Conclusão
Imagine que você tenha uma tabela e precise gerar uma análise de dados rápida para entregar um relatório. Você poderia tentar parar tudo que está fazendo ou até mesmo fazer horas extras, mas dificilmente você entregaria o relatório mais rapidamente do que um modelo de Inteligência Artificial (IA). Neste artigo mostramos um exemplo de relatório gerado por IA para análise de inflação no Brasil, usando as ferramentas Quarto + Python para integrar a IA.
Quer aprender mais?
Clique aqui para fazer seu cadastro no Boletim AM e baixar o código que produziu este exercício, além de receber novos exercícios com exemplos reais de análise de dados envolvendo as áreas de Data Science, Econometria, Machine Learning, Macroeconomia Aplicada, Finanças Quantitativas e Políticas Públicas diretamente em seu e-mail.