Tipos de Modelos

Modelos são simplificações ou interpretações da realidade, expressas em fórmulas matemáticas. A montagem de um modelo é útil para estudar determinado fenômeno complexo, seja qual for a área de estudo. No post de hoje, iremos descrever os tipos de modelos e os seus usos e propósitos em Data Science.

A taxonomia apresentada para os tipos de modelo a seguir visam informar como a categoria do modelo é utilizada e os diversos aspectos de com o modelo pode ser criado ou avaliado. A seguir, apresentamos três tipos de categorias.

Modelo descritivo

O propósito de um modelo descritivo é descrever ou ilustrar as características de um conjunto de dados. O foco principal dessa análise é enxergar padrões, tendências ou qualquer qualidade e atributo de uma variável.

Exemplo

Como exemplo, podemos averiguar o gráfico a seguir. Ele representa uma série temporal, no qual as observações são o preços diários de fechamento de uma ação. É possível construir um modelo descritivo para estimar a tendência da série ao longo do tempo. Na linha azul, é construído uma regressão local do tipo LOESS, que é basicamente uma regressão móvel suavizada e flexível. Através do gráfico é possível perceber a tendência não linear, significando que há uma relação não linear entre o preço da ação e o tempo.

<br />

Modelos inferenciais

O objetivo dos modelos inferenciais é produzir uma decisão de uma questão de pesquisa ou explorar uma hipótese especifica, similar ao que é alcançado por testes estatísticos. Um modelo inferencial inicia com um ideia predefinida sobre uma população e produz uma conclusão estatística tal como um intervalo de estimação ou a rejeição de uma hipótese.

Modelagem inferencial produz resultados probabilísticos tal como p-valor, intervalos de confiança, ou probabilidade posterior. Geralmente, é necessário suposições probabilísticas sobre os dados (tal como a normalidade), portanto, a qualidade destes modelos dependem fortemente do quão alinhado as suposição estão dos dados.

Exemplo

Por exemplo, através do dataset house, que contém dados sobre as características e preços de casas a vendas na cidade de Windsor, é possível construir um modelo inferencial que buscaria saber, através da amostra, a pergunta: casas com ar condicionado possuem maiores preços de venda em comparação aquelas que não possuem?

Com isso, é definido a hipótese nula (H0) e a hipótese alternativa (H1). Em seguida, através de uma análise do conjunto de dados, poderíamos supor que os dados são normalmente distribuídos e aplicar o teste t para responder a pergunta acima. Com o resultado do teste, obtém-se o p-valor verificando se de fato há uma diferença no preço de venda de casas que possuem ar condicionado ou não.

<br />

O exemplo acima é trabalhado no post O que é Inferência Estatística?, onde também é introduzido o conceito de inferência.

Modelos preditivos

Modelos podem ser construídos com o objetivo de produzir a previsão mais exata possível para novos dados. Em modelos preditivos, o principal objetivo é que os valores previstos tenham maiores possibilidades de serem próximos o suficiente do valor verdadeiro dos novos dados.

Um exemplo óbvio é o que economistas geralmente fazem: previsões sobre o PIB, inflação, desemprego e outras variáveis. Se um economista realiza uma previsão acima do valores reais, então houve um otimismo, e se a informação projetada é utilizada por vários agentes, possivelmente esses agentes erraram em suas decisões. O contrário, uma previsão abaixo dos valores reais, também causa desconforto.

Para esse tipo de modelo, o problema não é a preocupação com um tipo de pergunta ou a resposta dela, tal como o propósito dos modelos inferenciais, e sim o valor exato de quanto será o PIB no próximo trimestre. Portanto, não se está diretamente preocupado com o que afeta o PIB e quais variáveis se relacionam, e sim com o seu valor futuro (o mais exato possível).

Existem inúmeros modelos e métodos para construir um modelo preditivos, e a parte mais importante desses modelos é como ele é desenvolvido.

Um modelo mecanicista é construído partindo do principio de suposições construídas anterior a exploração de dados. Essas suposições são construídas a partir do conhecimento teórico e na construção de uma equação matemática do modelo, antes mesmo de realizar uma análise dos dados, ou mesmo obtê-los. Uma vez especificado modelo, os dados são utilizado para estimar os parâmetro desconhecidos para que as previsões possam ser feitas. Esse tipo de modelo preditivo possui certas similaridades com um modelo inferencial, entretanto, é possível tomar conhecimento dos dados previstos com facilidade, ocasionando um ciclo de feedback dos resultados. Outro ponto positivo é que os resultados desse tipo de modelo preditivo são bastante simples de avaliar.

Outro tipo de modelo é conhecido como modelos empíricos, que são criado com suposições mais vagas. Esse modelos são muito utilizado na categoria de machine learning. Esse modelo é definido apenas pela estrutura da previsão, sem qualquer suposição teórica ou probabilística. A avaliação desse modelo é feita apenas com base na acurácia do dados. Se a estrutura desse modelo escolhido for o ideal para o conjunto de dados, então a previsão estarão próximas do valores reais.

Exemplo

Através de um modelo preditivo, é possível construir a previsão mensal da Produção Industrial (PIM-PF/IBGE). Abaixo, na imagem, está o dashboard do modelo preditivo do indicador construído pela Análise Macro e ensinado aos alunos do curso Modelos Preditivos (de Machine Learning) aplicados à Macroeconomia.

Conexões entre os tipos de modelos

Veja que abordamos as três categorias de modelos, entretanto, não especificamos quais as equações devem utilizadas em cada tipo. Na realidade, é possível que uma equação pode ser implemente em qualquer um dos três tipos. Por exemplo, um modelo de regressão pode ser utilizado no modelo descritivo, inferencial e preditivo.

Entretanto, é possível que outros modelos possam não ser mutuamente utilizado em diferentes tipos. É comum que modelos da categoria de previsão sejam difíceis de se utilizar na área de inferência devido a sua forma de descrever os dados. Apesar disto, ainda sim os resultados de um modelo preditivo podem ser úteis para obter informações sobre os modelos descritivos e inferenciais.

Com isso, concluímos que o conhecimento de modelagem deve abranger essas três categoriais. Aqui na Análise Macro, ensinamos nossos alunos todo o processo através das nossas trilhas de

Econometria e Machine Learning e Macroeconomia Aplicada.

____________

Referência

Silge, J., Kuhn, M. Tidy Modeling with R, O'Reilly Media, 2022.

Compartilhe esse artigo

Comente o que achou desse artigo

Boletim AM

Encontre o seu conteúdo

Categorias

Artigos mais acessados

O que é e como funcionam Sistemas Multi-Agentes

O que é um Vector Database e como criar um com LangChain

Automatizando a Construção de Códigos em Python com LangGraph

Análise de Dados com REPL Tool e LLM usando LangGraph

Frameworks para criar AI Agents

Construindo RAG para Análise do COPOM com SmolAgents

Outros artigos relacionados

O que é e como funcionam Sistemas Multi-Agentes

Sistemas multi-agentes (MAS) representam uma nova forma de estruturar aplicações de inteligência artificial, especialmente úteis para lidar com problemas complexos e distribuídos. Em vez de depender de um único agente generalista, esses sistemas são compostos por múltiplos agentes especializados que colaboram, competem ou se coordenam para executar tarefas específicas. Neste post, explicamos o que são os MAS, seus principais componentes (como LLMs, ferramentas e processos) e as arquiteturas mais comuns.

O que é um Vector Database e como criar um com LangChain

Nesta postagem, mostramos como construir um pipeline simples de RAG (Retrieval-Augmented Generation) usando o LangChain, o modelo Gemini 2.0 Flash e o Vector Database Chroma. Utilizamos como exemplo o Relatório de Inflação de junho de 2025 do Banco Central do Brasil. O fluxo envolve o download e leitura do PDF, divisão do texto com RecursiveCharacterTextSplitter, geração de embeddings com Gemini, armazenamento vetorial com Chroma e busca semântica para responder perguntas com base no conteúdo do relatório. É uma aplicação prática e didática para economistas que desejam integrar IA ao seu fluxo de análise.

Automatizando a Construção de Códigos em Python com LangGraph

Neste post, mostramos como construir um agente de código em Python utilizando LangGraph, LangChain e Gemini. A proposta é construir um protótipo para automatizar o ciclo completo de geração, execução e correção de código com o uso de LLMs, organizando o processo em um grafo de estados.

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!