Unir Análise de Dados e Inteligência Artificial (IA) para gerar relatórios automatizados poderia parecer apenas um sonho há pouco tempo atrás. Contudo, graças aos Modelos de Linguagem Grande (LLM, no inglês), hoje é possível criar relatórios completos apenas fornecendo algumas instruções e os dados a serem analisados.
No entanto, para analisar dados utilizando IA é necessário um bom conhecimento de engenharia de prompt. Afinal, ainda precisamos dizer para o modelo de IA o que ele deve fazer (e esperar alguns segundos para ele entregar o resultado). Uma outra desvantagem é a limitação do tipo de resposta que estes modelos retornam dada uma instrução. Até o momento, não há modelos de IA que entreguem um arquivo PDF com, por exemplo, um relatório de análise de dados pronto.
Uma solução interessante para gerar relatórios automatizados de análise de dados utilizando IA é o uso de três ferramentas que integrem a IA, o código de análise de dados e um editor de texto para gerar o relatório. Felizmente essas ferramentas existem!
A ferramenta Quarto é um editor de texto que serve para criar relatórios, possibilitando escrever textos, executar códigos de Python e muito mais. O Google Gemini é um modelo de IA que entende e processa instruções textuais, retornando também respostas textuais. Sendo assim, podemos utilizar o Gemini através do Python para que o mesmo analise os dados de uma tabela. Esse código de Python pode ser armazenado e executado dentro de um arquivo do Quarto, que gera um relatório ao ser renderizado. Incrível, não? Vamos ver como isso funciona passo a passo.
Para obter o código e o tutorial deste exercício faça parte do Clube AM e receba toda semana os códigos em R/Python, vídeos, tutoriais e suporte completo para dúvidas.
Passo 01: arquivo de relatório no formato Quarto
Para gerar um relatório automatizado de análise de dados com ferramenta Quarto, é necessário criar um arquivo exemplo.qmd
e definir nas primeiras linhas as principais informações, como:
- Título
- Autor
- Data
- Língua
- Formato de saída
- Outras opções
Passo 02: bibliotecas de Python
Para começar a estruturar o relatório e conseguir utilizar o modelo de IA para analisar dados, precisaremos das seguintes bibliotecas de Python:
- pandas para armazenar e tratar dados tabulares.
- google-generativeai para analisar dados com o modelo de IA do Google (Gemini).
- IPython para formatar as respostas textuais do modelo de IA no relatório.
exemplo.qmd
.Passo 03: dados de exemplo
Para exemplificar um relatório de análise de dados reais, utilizaremos o tema a atividade econômica no Brasil (IBC-br, PMS, PMC e PIM-PF). Coletamos a tratamos os principais indicadores desse tema, com dados provenientes de fontes como IBGE e BCB.
Passo 04: modelo de inteligência artificial (IA)
Para utilizar o modelo de inteligência artificial Gemini, é necessário obter uma chave de token na plataforma Google AI Studio (veja mais informações aqui).
Com a chave de token em mãos, defina em um novo bloco de código Python o modelo a ser utilizado, suas configurações e informe a chave para a autenticação funcionar.
Passo 05: análise de dados com IA
Usando Python, geramos tabelas e gráficos para os indicadores. Com base nos resultados, pedimos para a IA, através de uma engenharia de Prompt, criar as análises de cada figura, permitindo que possamos construir uma análise de dados automatizada.
Relatório
Abaixo, temos o resultado da análise dos dados criado pela IA. O processo é automático: cria-se a coleta, tratamento e tabela/gráficos usando Python, e através da IA, gera-se a análise dos dados. Aqui, fazemos o uso de indicadores como IBC-br, PMS, PMC e PIM-PF para a atividade econômica no Brasil.
Tabela IBC-Br
IBC-Br - Novembro 2024 | |||
---|---|---|---|
Var. % M/M | Var. % M/M do ano anterior | Var. % acumulada em 12 meses | |
Outubro 2024 | 0,09% | 7,23% | 3,45% |
Novembro 2024 | 0,10% | 4,11% | 3,58% |
Fonte: BCB
Elaboração: Luiz Henrique Barbosa F. | analisemacro.com.br |
O Índice de Atividade Econômica do Banco Central (IBC-Br) para novembro de 2024 mostra um cenário de desaceleração do crescimento econômico brasileiro. Embora tenha havido uma leve alta de 0,10% em relação a outubro, a variação acumulada em 12 meses permanece modesta, em 3,58%. A queda significativa na variação em relação ao mesmo período do ano anterior, de 7,23% em outubro para 4,11% em novembro, reforça a tendência de arrefecimento da atividade.
- Crescimento marginal: A variação mensal de 0,10% em novembro indica um crescimento muito baixo da atividade econômica, sugerindo uma possível estagnação.
- Desaceleração confirmada: A queda expressiva na variação anual, de 7,23% para 4,11%, confirma a tendência de desaceleração observada nos meses anteriores.
- Baixo dinamismo: A variação acumulada em 12 meses de 3,58% demonstra que a economia brasileira ainda apresenta um baixo dinamismo.
- Perspectivas moderadas: Os dados do IBC-Br sugerem que a atividade econômica brasileira deve continuar crescendo em ritmo moderado nos próximos meses, demandando atenção das autoridades econômicas.
Variação Acumulada em 12 meses
Nos últimos dois anos, o IBC-Br demonstra uma recuperação após uma forte queda. A partir de dezembro de 2022, observa-se uma trajetória ascendente, com o índice saindo de valores negativos e atingindo patamares positivos. Apesar da recuperação, o crescimento demonstra volatilidade, com períodos de aceleração e desaceleração.
- Recuperação pós-queda: O gráfico mostra uma clara recuperação da atividade econômica após uma queda acentuada, provavelmente relacionada aos impactos da pandemia.
- Volatilidade no crescimento: A trajetória de recuperação não é linear, apresentando períodos de crescimento mais forte e outros de desaceleração.
- Níveis ainda moderados: Apesar da recuperação, os níveis do IBC-Br nos últimos dois anos ainda se encontram em patamares moderados, sugerindo que a economia ainda não retornou ao seu potencial pleno.
- Tendência de crescimento: Apesar da volatilidade, a tendência geral nos últimos dois anos é de crescimento da atividade econômica, embora em ritmo moderado.
Número-índice + Pesquisas (base 100 = jan 2019)
A atividade econômica por setor nos últimos dois anos, a partir de outubro de 2022, mostra uma recuperação consistente após o impacto da pandemia, com todos os setores (IBC-Br, PIM, PMC e PMS) apresentando crescimento em relação à base de janeiro de 2019. O crescimento, no entanto, não é uniforme entre os setores, com o setor de serviços (PMS) demonstrando maior dinamismo.
- Recuperação generalizada: Todos os setores da economia demonstram recuperação nos últimos dois anos, superando os níveis pré-pandemia.
- Serviços liderando o crescimento: O setor de serviços (PMS) apresenta o crescimento mais expressivo entre os setores analisados, indicando uma forte demanda por serviços no período.
- Indústria com crescimento moderado: A indústria (PIM) apresenta um crescimento mais moderado em comparação com os serviços, sugerindo desafios para o setor.
- Comércio com desempenho intermediário: O comércio (PMC) apresenta um desempenho intermediário entre a indústria e os serviços, refletindo a dinâmica do consumo das famílias e do setor produtivo.
Considerações Finais
Considerações Finais sobre a Atividade Econômica no Brasil
Nos últimos dois anos, a economia brasileira percorreu uma trajetória de recuperação após a forte retração causada pela pandemia. Observamos um crescimento consistente em diversos setores, com destaque para o setor de serviços, que liderou a recuperação. No entanto, esse crescimento não foi uniforme, com a indústria apresentando um ritmo mais moderado e o comércio um desempenho intermediário. A volatilidade também marcou esse período, com momentos de aceleração e desaceleração da atividade econômica, como demonstrado pelo gráfico do IBC-Br.
Atualmente, a economia brasileira encontra-se em um momento de desaceleração, como indicado pelos dados mais recentes do IBC-Br. A variação mensal e a variação em relação ao ano anterior sugerem um arrefecimento da atividade econômica. Fatores conjunturais, como a inflação persistente e as incertezas no cenário internacional, contribuem para esse cenário.
Para o próximo ano, as perspectivas para a economia brasileira são moderadas, com projeções de crescimento em ritmo lento. Diversos fatores podem influenciar o desempenho econômico, como o cenário político interno, as políticas monetária e fiscal adotadas pelo governo, e a evolução da economia global. Um cenário otimista dependeria de um controle da inflação, da manutenção da confiança dos investidores e de um ambiente externo favorável. Por outro lado, um cenário pessimista poderia ser desencadeado por uma piora do cenário internacional, por instabilidades políticas internas ou por dificuldades na implementação de reformas estruturais. A continuidade da recuperação, ainda que em ritmo moderado, dependerá da capacidade do país em enfrentar esses desafios e promover um ambiente favorável ao crescimento sustentável.
Tenha acesso ao código e suporte desse e de mais 500 exercícios no Clube AM!
Quer o código desse e de mais de 500 exercícios de análise de dados com ideias validadas por nossos especialistas em problemas reais de análise de dados do seu dia a dia? Além de acesso a vídeos, materiais extras e todo o suporte necessário para você reproduzir esses exercícios? Então, fale com a gente no Whatsapp e veja como fazer parte do Clube AM, clicando aqui.