valores extremos

No contexto de ciência de dados, é comum ter que lidar com problemas nos dados de um modelo preditivo, tais como valores extremos (outliers) ou valores ausentes (missing data). Em muitos casos, é preciso aplicar pré-processamentos para validar e utilizar um modelo, ao mesmo tempo que é necessário evitar o vazamento de dados (data leakage). Abordamos estes desafios neste artigo mostrando exemplos com dados reais em aplicações nas linguagens de programação R e Python.
Se não fosse o gráfico de dispersão, a famosa curva de Phillips jamais teria sido descoberta pelos economistas. Essa é uma afirmação forte, mas retrata o poder que a visualização de dados desempenhou nos anos 50 no avanço da pesquisa econômica. Apesar de ser simples, o gráfico de dispersão é útil para entender os dados e suas relações. Neste artigo mostramos as principais aplicações e exemplos práticos feitos em R e Python.

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.