Tipos de Modelos

Modelos são simplificações ou interpretações da realidade, expressas em fórmulas matemáticas. A montagem de um modelo é útil para estudar determinado fenômeno complexo, seja qual for a área de estudo. No post de hoje, iremos descrever os tipos de modelos e os seus usos e propósitos em Data Science.

A taxonomia apresentada para os tipos de modelo a seguir visam informar como a categoria do modelo é utilizada e os diversos aspectos de com o modelo pode ser criado ou avaliado. A seguir, apresentamos três tipos de categorias.

Modelo descritivo

O propósito de um modelo descritivo é descrever ou ilustrar as características de um conjunto de dados. O foco principal dessa análise é enxergar padrões, tendências ou qualquer qualidade e atributo de uma variável.

Exemplo

Como exemplo, podemos averiguar o gráfico a seguir. Ele representa uma série temporal, no qual as observações são o preços diários de fechamento de uma ação. É possível construir um modelo descritivo para estimar a tendência da série ao longo do tempo. Na linha azul, é construído uma regressão local do tipo LOESS, que é basicamente uma regressão móvel suavizada e flexível. Através do gráfico é possível perceber a tendência não linear, significando que há uma relação não linear entre o preço da ação e o tempo.

Modelos inferenciais

O objetivo dos modelos inferenciais é produzir uma decisão de uma questão de pesquisa ou explorar uma hipótese especifica, similar ao que é alcançado por testes estatísticos.  Um modelo inferencial inicia com um ideia predefinida sobre uma população e produz uma conclusão estatística tal como um intervalo de estimação ou a rejeição de uma hipótese.

Modelagem inferencial produz resultados probabilísticos tal como p-valor, intervalos de confiança, ou probabilidade posterior. Geralmente, é necessário suposições probabilísticas sobre os dados (tal como a normalidade), portanto, a qualidade destes modelos dependem fortemente do quão alinhado as suposição estão dos dados.

Exemplo

Por exemplo, através do dataset house, que contém dados sobre as características e preços de casas a vendas na cidade de Windsor, é possível construir um modelo inferencial que buscaria saber, através da amostra, a pergunta: casas com ar condicionado possuem maiores preços de venda em comparação aquelas que não possuem?

Com isso, é definido a hipótese nula (H0) e a hipótese alternativa (H1). Em seguida, através de uma análise do conjunto de dados, poderíamos supor que os dados são normalmente distribuídos e aplicar o teste t para responder a pergunta acima. Com o resultado do teste, obtém-se o p-valor verificando se de fato há uma diferença no preço de venda de casas que possuem ar condicionado ou não.

O exemplo acima é trabalhado no post O que é Inferência Estatística?, onde também é introduzido o conceito de inferência.

Modelos preditivos

Modelos podem ser construídos com o objetivo de produzir a previsão mais exata possível para novos dados. Em modelos preditivos, o principal objetivo é que os valores previstos tenham maiores possibilidades de serem próximos o suficiente do valor verdadeiro dos novos dados.

Um exemplo óbvio é o que economistas geralmente fazem: previsões sobre o PIB, inflação, desemprego e outras variáveis. Se um economista realiza uma previsão acima do valores reais, então houve um otimismo, e se a informação projetada é utilizada por vários agentes, possivelmente esses agentes erraram em suas decisões. O contrário, uma previsão abaixo dos valores reais, também causa desconforto.

Para esse tipo de modelo, o problema não é a preocupação com um tipo de pergunta ou a resposta dela, tal como o propósito dos modelos inferenciais, e sim o valor exato de quanto será o PIB no próximo trimestre. Portanto, não se está diretamente preocupado com o que afeta o PIB e quais variáveis se relacionam, e sim com o seu valor futuro (o mais exato possível).

Existem inúmeros modelos e métodos para construir um modelo preditivos, e a parte mais importante desses modelos é como ele é desenvolvido.

Um modelo mecanicista é construído partindo do principio de suposições construídas anterior a exploração de dados. Essas suposições são construídas a partir do conhecimento teórico e na construção de uma equação matemática do modelo, antes mesmo de realizar uma análise dos dados, ou mesmo obtê-los.  Uma vez especificado modelo, os dados são utilizado para estimar os parâmetro desconhecidos para que as previsões possam ser feitas. Esse tipo de modelo preditivo possui certas similaridades com um modelo inferencial, entretanto, é possível tomar conhecimento dos dados previstos com facilidade, ocasionando um ciclo de feedback dos resultados. Outro ponto positivo é que os resultados desse tipo de modelo preditivo são bastante simples de avaliar.

Outro tipo de modelo é conhecido como modelos empíricos, que são criado com suposições mais vagas. Esse modelos são muito utilizado na categoria de machine learning. Esse modelo é definido apenas pela estrutura da previsão, sem qualquer suposição teórica ou probabilística. A avaliação desse modelo é feita apenas com base na acurácia do dados. Se a estrutura desse modelo escolhido for o ideal para o conjunto de dados, então a previsão estarão próximas do valores reais.

Exemplo

Através de um modelo preditivo, é possível construir a previsão mensal da Produção Industrial (PIM-PF/IBGE). Abaixo, na imagem, está o dashboard do modelo preditivo do indicador construído pela Análise Macro e ensinado aos alunos do curso Modelos Preditivos (de Machine Learning) aplicados à Macroeconomia.

Conexões entre os tipos de modelos

Veja que abordamos as três categorias de modelos, entretanto, não especificamos quais as equações devem utilizadas em cada tipo. Na realidade, é possível que uma equação pode ser implemente em qualquer um dos três tipos. Por exemplo, um modelo de regressão pode ser utilizado no modelo descritivo, inferencial e preditivo.

Entretanto, é possível que outros modelos possam não ser mutuamente utilizado em diferentes tipos. É comum que modelos da categoria de previsão sejam difíceis de se utilizar na área de inferência devido a sua forma de descrever os dados. Apesar disto, ainda sim os resultados de um modelo preditivo podem ser úteis para obter informações sobre os modelos descritivos e inferenciais.

Com isso, concluímos que o conhecimento de modelagem deve abranger essas três categoriais. Aqui na Análise Macro, ensinamos nossos alunos todo o processo através das nossas trilhas de

Econometria e Machine Learning e Macroeconomia Aplicada.

____________

Referência

Silge, J., Kuhn, M. Tidy Modeling with R, O'Reilly Media, 2022.

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Sumarizando divulgações trimestrais de empresas usando IA no Python

Neste exercício, iremos utilizar a inteligência artificial no Python para analisar e sumarizar divulgações trimestrais de empresas. Focaremos no uso de ferramentas como Gemini e técnicas de processamento de linguagem natural para extrair informações de documentos PDF relacionados aos relatórios financeiros das empresas.

Prevendo efeitos de mudanças de preços em produtos usando TimeGPT

O exercício explora como prever os efeitos de mudanças nos preços de produtos utilizando o TimeGPT, uma ferramenta de previsão de séries temporais no Python. Usando elasticidade-preço, é possível medir a resposta da demanda a variações de preço. O exemplo prático utiliza dados de vendas de abacates nos EUA.

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.