Como Gerar Sumários de Estatísticas Descritivas?
Neste artigo navegamos pelas definições, fórmulas, cálculos e computação das estatísticas descritivas de dados do tipo série temporal e/ou corte transversal. Mostramos na prática, em R e Python, como gerar um sumário para reportar e analisar os dados rapidamente.
O Alicerce da Ciência de Dados: entendendo o Processo Gerador dos Dados
No impulso de assumir uma distribuição normal para qualquer variável que aparecer em sua frente, o cientista de dados comete o erro de desconhecer os dados sendo trabalhados e, consequentemente, realiza inferências e previsões pouco acuradas. Infelizmente, isso é um problema comum com o boom da ciência de dados nos anos recentes, mas neste artigo vamos tentar trazer um pouco de luz sobre o assunto.
Variáveis Quantitativas e Qualitativas: o que são e como analisar?
O que é uma variável quantitativa? E uma variável qualitativa? Quais são os exemplos dessas variáveis? E quais ferramentas de análise exploratória de dados podem ser usadas para cada caso? Neste artigo mostramos as diferenças entre os principais tipos de variáveis usadas em ciência de dados e vemos exemplos práticos com dados públicos.
Dados: como são disponibilizados e como são coletados
Neste post, veremos quais são os principais formatos nos quais os dados costumam ser disponibilizados e aprenderemos, através de exemplos práticos, sobre as ferramentas de ciência de dados para coletar essas informações, sejam de fontes nacionais ou internacionais, seja usando o R ou o Python.
Análise de Dados na Prática com um Case real
Neste artigo, percorremos o ciclo de análise de dados de ponta a ponta, visando resolver um problema de assimetria de informação no mercado de combustíveis. Mostramos uma visão geral sobre o processo de análise de dados no dia a dia de trabalho, dando ênfase na linha de raciocínio por trás de cada etapa e ressaltando ferramentas e alternativas que podem ser utilizadas.