Em ciência de dados, a interpretação de resultados é fundamental para alcançar os objetivos da modelagem preditiva. Mas como analisar os modelos? Olhar as métricas de erros é suficiente? O melhor modelo é o que tem a maior acurácia? É necessário escolher um modelo? Neste artigo discutimos sobre estas e outras considerações no processo de tomada de decisão de modelos preditivos.
Neste artigo exploramos as técnicas de Bootstrapping, Bagging, Boosting e Random Forests com o objetivo de aumentar o desempenho em modelos preditivos. Percorremos o modo de funcionamento de cada técnica e sua aplicação usando linguagem de programação com dados econômicos do Brasil.
Mineração de textos é uma técnica interessante para obtenção de insights quantitativos através de dados textuais. Com a finalidade de demonstrar seu uso, neste artigo faremos uma breve e introdutória análise das atas do Comitê de Política Monetária – COPOM usando mineração de textos com o auxílio do pacote tidytext na linguagem R.
Como saber se o desempenho de um modelo preditivo se generaliza para dados desconhecidos? Dividir a tabela de dados em duas amostras, treinar o modelo e calcular o erro é um processo comum e bastante simples, mas pouco informativo. As técnicas de validação cruzada podem ajudar neste aspecto e neste artigo mostramos como funcionam e como implementar usando linguagem de programação.
Existem tantas siglas para métricas de desempenho de modelos preditivos que é fácil se perder na sopa de letrinhas. Neste artigo, fornecemos uma visão geral das principais métricas para avaliar e comparar modelos de regressão e classificação, usando exemplos com dados em Python.