O que é um agente?
Para explicar o que é um agente vamos utilizar uma analogia.
Visão geral
Imagine que você está em casa e grita da sala: “Alexa, faz um café pra mim!”
Mas, em vez de uma assistente virtual comum, você tem uma empregada doméstica superinteligente, tipo a (agente) Dona Cida, que entende tudo o que você fala, pensa bem antes de agir, e sabe se virar com qualquer coisa que tiver na cozinha.
- Entendimento da linguagem natural:
A agente Dona Cida entende exatamente o que você quis dizer com “fazer um café”. Ela sabe que você quer café fresco, que está com preguiça de levantar, e que provavelmente espera o café do jeitinho que você gosta — forte, sem açúcar. - Raciocínio e planejamento:
Ela começa a pensar:- Será que ainda tem pó de café?
- O bule tá limpo?
- O filtro é de papel ou permanente?
- Dá tempo de passar o café e ainda levar pra ele quentinho?
A Dona Cida monta um plano rapidinho, resolve qualquer problema (inclusive se não tiver filtro, ela dá um jeito com pano de prato limpo!), e decide a melhor forma de fazer e entregar o café.
- Ação e interação com o ambiente:
Ela vai até a cozinha, verifica os ingredientes, desvia do cachorro, passa o café, coloca numa caneca do Flamengo que ela sabe que você gosta, e leva até você na sala.
Nessa analogia, a Dona Cida é o agente de IA. A casa é o ambiente. Seu pedido é o comando em linguagem natural, e tudo que ela faz — pensar, planejar e agir — representa exatamente o que um agente de IA faz para alcançar um objetivo.
Em suma, um AI agent é um sistema de IA capaz de raciocinar, planejar e interagir com o seu ambiente.
Definição formal
Agora que você tem a visão geral sobre agentes, vamos fazer uma definição mais formal:
Um Agente é um sistema que utiliza um modelo de IA para interagir com seu ambiente com o objetivo de alcançar uma meta definida pelo usuário. Ele combina raciocínio, planejamento e execução de ações (frequentemente por meio de ferramentas externas) para realizar tarefas.
Pense no Agente como tendo duas partes principais:
- O Cérebro (Modelo de IA): É aqui que todo o raciocínio acontece. O modelo de IA é responsável pelo raciocínio e pelo planejamento. Ele decide quais Ações tomar com base na situação.
- O Corpo (Capacidades e Ferramentas): Essa parte representa tudo o que o Agente é capaz de fazer.
O escopo das ações possíveis depende do que o agente tem à sua disposição. Por exemplo, como os humanos não têm asas, eles não podem realizar a Ação “voar”, mas podem executar Ações como “andar”, “correr”, “pular”, “agarrar” e assim por diante.
Quando usar agentes?
Agentes são úteis quando você precisa que um modelo LLM (Large Language Model) — Modelo de Linguagem de Grande Escala — determine o fluxo de trabalho de um aplicativo. Mas muitas vezes eles são um exagero. A pergunta fundamental é: eu realmente preciso de flexibilidade no fluxo de trabalho para resolver eficientemente a tarefa em questão? Se o fluxo de trabalho predefinido falha com frequência, isso significa que você precisa de mais flexibilidade.
Vamos a um exemplo: digamos que você esteja criando um aplicativo que lida com solicitações de clientes em um site de viagens para surfistas. Você pode saber com antecedência que as solicitações se encaixarão em um de dois grupos (com base na escolha do usuário), e terá um fluxo de trabalho predefinido para cada um desses dois casos:
- Quer informações sobre as viagens? ⇒ dê acesso a uma barra de busca na sua base de conhecimento.
- Quer falar com o time de vendas? ⇒ permita que ele preencha um formulário de contato.
Se esse fluxo de trabalho determinístico cobre todas as consultas, então simplesmente codifique tudo! Isso fornecerá um sistema 100% confiável, sem risco de erro causado por LLMs imprevisíveis interferindo no seu fluxo de trabalho. Pela simplicidade e robustez, é recomendável sempre evitar comportamentos agênticos quando possível.
Mas e se o fluxo de trabalho não puder ser determinado com tanta antecedência?
Por exemplo, um usuário pode perguntar:
“Posso chegar na segunda-feira, mas esqueci meu passaporte, então posso me atrasar até quarta. Dá pra me levar com meu equipamento para surfar na terça de manhã, com um seguro contra cancelamento?”
Essa pergunta depende de muitos fatores, e provavelmente nenhum dos critérios predefinidos será suficiente para atendê-la. Se o fluxo de trabalho predefinido falha com frequência, isso significa que você precisa de mais flexibilidade. É aí que uma configuração com agentes ajuda.
No exemplo acima, você poderia criar um agente de múltiplas etapas com acesso a uma API de clima para previsões meteorológicas, API do Google Maps para calcular distâncias de viagem, painel de disponibilidade dos funcionários e um sistema RAG (recuperação aumentada por geração) sobre sua base de conhecimento.
Até recentemente, programas de computador eram restritos a fluxos de trabalho predefinidos, tentando lidar com a complexidade através de uma pilha de comandos if/else. Eles se concentravam em tarefas extremamente específicas, como “calcular a soma desses números” ou “encontrar o caminho mais curto nesse grafo”. Mas, na verdade, a maioria das tarefas da vida real, como o exemplo da viagem acima, não se encaixa em fluxos de trabalho predefinidos. Sistemas agênticos abrem para os programas um vasto mundo de tarefas do mundo real!
Tipos de agentes
Os AI agents podem ser categorizados de acordo com a sua capacidade de interagir com o ambiente, chamada de “agência”:
Agência | Descrição | Tipo | Padrão de exemplo |
---|---|---|---|
☆☆☆ | A saída do agente não impacta o fluxo do programa | Simple processor | process_llm_output(llm_response) |
★☆☆ | A saída do agente determina um fluxo de controle básico | Router | if llm_decision(): path_a() else: path_b() |
★★☆ | A saída do agente determina qual função será executada | Tool caller | run_function(llm_chosen_tool, llm_chosen_args) |
★★★ | A saída do agente controla iteração e continuação do programa | Multi-step Agent | while llm_should_continue(): execute_next_step() |
★★★ | Um fluxo de trabalho agente pode iniciar outro fluxo agente | Multi-Agent | if llm_trigger(): execute_agent() |
Modelos de IA em agentes
O modelo de IA mais comum utilizado em Agentes é o LLM que recebe texto como entrada e também gera texto como saída.
Alguns exemplos bem conhecidos são o GPT-4 da OpenAI, o LLaMA da Meta, o Gemini do Google, entre outros. Esses modelos foram treinados com uma enorme quantidade de textos e conseguem generalizar muito bem. Vamos aprender mais sobre os LLMs adiante.
Como funciona um agente?
LLMs são modelos incríveis, mas sua capacidade se resume a gerar texto. No entanto, se você pedir para um aplicativo de chat conhecido, como o Gemini ou o ChatGPT, gerar uma imagem, eles conseguem!
Como isso é possível?
A resposta é que os desenvolvedores do Gemini, ChatGPT e aplicativos semelhantes implementaram funcionalidades adicionais (chamadas de Tools) que o LLM pode usar para realizar ações, como criar imagens.
Vamos aprender mais sobre essas ferramentas adiante.
Tarefas de um agente
Um AI Agent pode executar qualquer tarefa para a qual implementamos Ferramentas (Tools) que permitam a realização de Ações (Actions).
Por exemplo, se eu criar um Agente para atuar como meu assistente pessoal (como a Alexa) no meu computador, e pedir: “envie um e-mail para meu gerente pedindo para adiar a reunião de hoje”, posso fornecer um código que envia e-mails. Essa será uma nova Tool que o Agente poderá usar sempre que precisar enviar um e-mail. Podemos escrever isso em Python:
def send_message_to(recipient, message):
"""Useful to send an e-mail message to a recipient"""
...
O LLM, como veremos, irá gerar o código para executar a ferramenta quando necessário, cumprindo assim a tarefa desejada:
send_message_to("Manager", "Can we postpone today's meeting?")
O design das Tools é muito importante e tem grande impacto na qualidade do Agente. Algumas tarefas exigem Tools bem específicas, enquanto outras podem ser resolvidas com ferramentas genéricas, como uma “busca na web”.
Permitir que um agente interaja com seu ambiente é o que viabiliza aplicações reais — tanto para empresas quanto para indivíduos.
Exemplo 1: Assistentes Virtuais Pessoais
Assistentes virtuais como Siri, Alexa ou Google Assistente funcionam como agentes ao interagirem em nome dos usuários dentro de seus ambientes digitais.
Eles recebem perguntas dos usuários, analisam o contexto, recuperam informações de bancos de dados e fornecem respostas ou iniciam ações (como definir lembretes, enviar mensagens ou controlar dispositivos inteligentes).
Exemplo 2: Chatbots de Atendimento ao Cliente
Muitas empresas utilizam chatbots como agentes que interagem com clientes em linguagem natural.
Esses agentes podem responder perguntas, guiar usuários por etapas de solução de problemas, abrir chamados em sistemas internos ou até concluir transações.
Seus objetivos predefinidos incluem melhorar a satisfação do usuário, reduzir o tempo de espera e aumentar as taxas de conversão em vendas. Ao interagir diretamente com os clientes, aprender com os diálogos e adaptar suas respostas ao longo do tempo, eles demonstram os princípios centrais de um agente em ação.
Exemplo 3: Personagem Não Jogável (NPC) com IA em jogos
Agentes de IA impulsionados por LLMs podem tornar NPCs (personagens não jogáveis) mais dinâmicos e imprevisíveis.
Em vez de seguirem comportamentos rígidos e pré-definidos, eles podem responder de forma contextual, se adaptar às interações do jogador e gerar diálogos mais complexos. Essa flexibilidade cria personagens mais realistas e envolventes, que evoluem conforme as ações do jogador.
Conclusão
Para resumir, um AI Agent é um sistema que utiliza um Modelo de IA (geralmente um LLM) como seu núcleo de raciocínio, para:
- Entender a linguagem natural: Interpretar e responder a instruções humanas de forma significativa.
- Raciocinar e planejar: Analisar informações, tomar decisões e elaborar estratégias para resolver problemas.
- Interagir com seu ambiente: Obter informações, realizar ações e observar os resultados dessas ações.
Quer aprender mais?
Conheça nossa Formação do Zero à Análise de Dados Econômicos e Financeiros usando Python e Inteligência Artificial. Aprenda do ZERO a coletar, tratar, construir modelos e apresentar dados econômicos e financeiros com o uso de Python e IA.
Referências
Hugging Face, Agents Course, (2025), GitHub repository