Como usar o Sabiá-3, um modelo de IA em português?

Captar nuances de linguagem, características culturais e diferenças de dialetos pode ser difícil para modelos de IA generativa treinados com a maior parte dos textos em inglês. A depender do tipo de tarefa que o usuário solicite, estas particularidades podem impossibilitar uma solução adequada por parte da IA generativa.

Neste exercício mostramos como utilizar um LLM brasileiro, o Sabiá-3, desenvolvido pela empresa Maritaca AI. De acordo com a empresa, o modelo possui um custo-benefício melhor do que outras opções famosas, como GPT-4o. Isso significa que o custo de inferência é menor ou equivalente para um mesmo nível acurácia do modelo.

A seguir mostramos como usar o Sabiá-3 pela linguagem de programação Python.

Passo 01: criar conta na Maritaca e obter chave de API

Para usar a IA brasileira fornecida pela Maritaca via Python, é necessário ter uma conta cadastrada e gerar um chave de API. Para fazer isso, siga os procedimentos abaixo:

Acessar o link https://plataforma.maritaca.ai/
Clicar em “Entrar”
Digitar informações de login e/ou se cadastrar
Clicar em “Chaves de API” no menu esquerdo
Clicar em “Criar Nova Chave”
Clicar em “Criar”
Clicar em “Copiar” e armazenar em local protegido/seguro (importante: essa é uma informação sensível)

Passo 02: cadastrar forma de pagamento para uso da API

Atualmente, a Maritaca oferece modelos pagos de IA, mas disponibiliza gratuitamente créditos de utilização para testar os modelos via Python. Para obter os créditos, no entanto, é necessário cadastrar um cartão de crédito. Para fazer isso, siga os procedimentos abaixo:

Ainda em https://plataforma.maritaca.ai/, clicar em “Recarga”
Em “Cartões Cadastrados”, clicar em “Gerenciar”
Clicar no botão de adicionar
Digitar informações do seu cartão de crédito e clicar em “Save card”

Passo 03: enviar prompt via API usando Python

Por fim, podemos escrever um código simples de Python para se conectar à API da Maritaca para uso do modelo de IA generativa Sabiá-3. Para fazer isso, siga os procedimentos abaixo:

Acessar o Google Colab pelo link https://colab.new/
Clicar em Secrets na lateral esquerda do Colab
Clicar no botão “Add new secret”
Clicar no botão de habilitar embaixo de “Notebook access”
Digitar “MARITALK_API_KEY” no campo “Name”
Digitar a chave de API obtida acima no campo “Value”
Instalar a biblioteca maritalk via comando pip install maritalk

Importar as bibliotecas via comando

import maritalk
from google.colab import userdata

Definir o modelo e se autenticar via comando

model = maritalk.MariTalk(key = userdata.get("MARITALK_API_KEY"), model = "sabia-3")

Enviar prompt e obter resposta via comando

response = model.generate("Explique o que é altinha em um parágrafo.")
print(response["answer"])

A resposta obtida do modelo Sabiá-3 neste exemplo foi:

“A altinha é uma prática esportiva e recreativa que envolve manter uma bola de futebol no ar utilizando diversas partes do corpo, especialmente os pés, pernas, coxas, peito, cabeça e ombros, sem deixá-la cair. É uma atividade que exige habilidade, coordenação motora e resistência, muitas vezes realizada em grupo, onde os participantes passam a bola uns para os outros sem deixar a bola tocar o solo. Popular no Brasil e em outras partes do mundo, a altinha é uma expressão cultural que mistura esporte, arte e diversão, sendo também uma forma eficaz de treinamento para jogadores de futebol, pois melhora o controle de bola e a agilidade.”

Já a resposta obtida do modelo GPT-4o, da OpenAI, foi:

“Altinha é um jogo desportivo e recreativo originário do Brasil, popular especialmente nas praias. Trata-se de uma variação do futebol de areia, onde o objetivo principal é manter a bola no ar sem deixá-la tocar o chão, usando qualquer parte do corpo, exceto as mãos. Os jogadores formam um círculo ou uma linha e trocam passes curtos e rápidos, valorizando a habilidade e o controle de bola. A atmosfera competitiva, porém descontraída, atrai praticantes de todas as idades e promove tanto a prática de atividade física quanto a socialização em ambientes ao ar livre.”

Conclusão

Modelos de IA costumam ser treinados majoritariamente em inglês, mas para algumas tarefas os modelos em português podem ser mais adequados. Neste exercício mostramos como utilizar um LLM brasileiro, o Sabiá-3, que apresenta um custo-benefício melhor do que outras opções famosas.

Compartilhe esse artigo

Comente o que achou desse artigo

Boletim AM

Encontre o seu conteúdo

Categorias

Artigos mais acessados

Criando operações SQL com IA Generativa no R com querychat

Dashboard Financeiro com IA e Shiny Python: Análise de Dados Abertos da CVM

Econometria, ML ou IA para previsão da PMS?

Econometria, ML ou IA para previsão da PMC?

Como criar um Assistente de IA com ShinyChat R

Como criar um Assistente de IA com ShinyChat Python

Outros artigos relacionados

Criando operações SQL com IA Generativa no R com querychat

No universo da análise de dados, a velocidade para obter respostas é um diferencial competitivo. Frequentemente, uma simples pergunta de negócio — “Qual foi nosso produto mais vendido no último trimestre na região Nordeste?” — inicia um processo que envolve abrir o RStudio, escrever código dplyr ou SQL, executar e, finalmente, obter a resposta. E se pudéssemos simplesmente perguntar isso aos nossos dados em português, diretamente no nosso dashboard Shiny?

Dashboard Financeiro com IA e Shiny Python: Análise de Dados Abertos da CVM

Este artigo apresenta um tutorial completo sobre como construir uma ferramenta de análise financeira de ponta. Utilizando Shiny for Python, demonstramos a automação da coleta de dados das Demonstrações Financeiras Padronizadas (DFP) da CVM e o tratamento dessas informações com Pandas. O ponto alto do projeto é a integração da IA Generativa do Google Gemini, que atua como um assistente de análise, interpretando os dados filtrados pelo usuário e fornecendo insights contábeis e financeiros em tempo real. O resultado é um dashboard dinâmico que democratiza a análise de dados complexos e acelera a tomada de decisão.

Econometria, ML ou IA para previsão da PMS?

Prever a Pesquisa Mensal de Serviços (PMS/IBGE) é um desafio por natureza: trata-se de uma série mensal, sujeita a volatilidade e choques que vão de fatores sazonais a mudanças estruturais no setor. Para enfrentar esse problema, realizamos um exercício de comparação entre três abordagens de modelagem: econometria tradicional (ARIMA), machine learning (XGBoost) e inteligência artificial (TimeGPT).

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!