Tag

estatística Archives - Análise Macro

Estatística vs Analytics vs Data Science

By | Hackeando o R

Algo que sempre gera dúvidas para aqueles que estão entrando na área de dados refere-se as áreas de atuação, bem como a relação entre cada uma. Obviamente, Estatística não é o mesmo que Data Analytics, bem como também são diferentes de Data Science. Apesar disto, estão totalmente interligadas. No post de hoje, explicamos brevemente as diferenças das três áreas e aplicamos exemplos de demonstração de suas finalidade.

Para esclarecer toda a confusão que é gerada sobre as áreas, definimos brevemente da seguinte forma:

  • Estatística é uma área que está mais preocupada com os métodos de coleta, analise e apresentação dos dados. O objetivo é buscar o relacionamentos de variáveis, descrever suas características e ser cuidadosa na área de inferência e criação de hipóteses.
  • Data Analytics é uma área que não está preocupada com os métodos de avaliação das variáveis (sendo menos rigorosos que a estatística), e sim está mais preocupado com os resultados que se encontram com os objetivos do negócios. Deste modo, por mais que certas características são significativas em um estudo estatísticos, para o DA, isto pode ser inútil caso não agregue valor para o negócio.
  • Data Science está também interligado com a estatística, porém é focada em resultados, isto é, o Cientista de Dados está preocupado com os objetivos do negócio em mente, de forma a criar produtos sofisticados, com algoritmos que predizem variáveis dentro de um sistema que gera essas previsões instantaneamente. A sua utilização é muito interligada com o uso de Machine Learning.

É possível baixar os dados através do seguinte link.

Vamos investigar a relação entre duas variáveis do dataset: mpg e origin. O quanto a origem do carro pode estar relacionada a variação de mpg? E se confirmada essa relação, além de origin, quais variáveis podemos adicionar para criar um modelo de previsão?

Primeiro, analisamos a distribuição de mpg por origem do carro por meio de um histograma. Observamos que o  número de carros construídos no EUA são maiores em relação a Asia e Europa. Além disso, vemos onde os dados estão centralizado, bem como as assimetrias que se formam.

Com um boxplot, podemos entender melhor os percentis dos valores de mpg por origem. Vemos que Asia possui uma mediana de mpg maior que Europa e EUA.

Com os insights retirado dos gráficos, podemos descobrir se a variável origin exerce uma influência na variável dependente.

Obviamente, a análise estatística é mais robusta e preciosista, com a formulação de um objetivo de estudo e criação de testes de hipóteses. Aqui, fizemos um simples passeio sobre o conteúdo que a área trata.

A partir daqui, iremos estar concentrados em prever o mpg do carro utilizando a regressão linear. A questão, é que o nosso objetivo aqui não será buscar de fato buscar relacionamentos estatísticos, e sim entregar uma previsão de mpg dos carros (e aqui apenas lidaremos com o workflow do {tidymodels}, e não trataremos de toda a infraestrutura criada por um time de Data Science). O objetivo de ensino aqui será somente diferenciar os objetivos de uma área para a outra.

Com as considerações feitas, podemos prosseguir com o nosso modelo. Além de origin, vamos adicionar outra variável, que será weight.

Podemos ver a relação através de um gráfico de dispersão.

Ao especificar e rodar o modelo, construímos as previsões com a fução predict() e comparamos os resultados com os dados de teste.

Quer saber mais?

Veja nossos cursos de R e Python aplicados para a Análise de Dados e Economia

_____________________________________________

Turmas de Inverno: último dias de inscrições!

By | Cursos da Análise Macro

As inscrições para as Turmas de Inverno dos nossos Cursos Aplicados de R terminam hoje, 14/06, às 23h59. Há vagas para 15 Cursos Livres e 3 Formações. As turmas de Inverno terão início no dia 15/06 e contarão com o nosso Curso de Introdução ao R para Análise de Dados, de modo que não é necessário nenhum conhecimento prévio na linguagem. Para todos os detalhes sobre as Turmas de Inverno, continue lendo esse informativo...

Nós abrimos vagas para quatro áreas dos nossos Cursos Livres: Data Science, Macroeconomia Aplicada, Econometria e Finanças. Haverá vagas para 15 Cursos, a saber:

Cursos de Data Science

Macroeconomia Aplicada

Cursos de Econometria

Cursos de Micro Aplicada

Cursos de Finanças

Além disso, também abrimos as inscrições para as nossas Formações:

Plano Disponível

Para essa Turma, estamos ofertando um plano único que envolve como bônus para qualquer curso acima o nosso Curso de R para Análise de Dados, Certificado, acesso por 12 meses às aulas gravadadas e plataforma tira-dúvidas exclusiva.

Investimento

Os preços dos Cursos variam de acordo com a complexidade do conteúdo. Os alunos poderão financiar a aquisição dos Cursos em até 10x sem juros no cartão de crédito.

Especialmente para essa edição dos nossos Cursos, nós ofereceremos 30% de desconto para quem adquirir todos os cursos de uma das nossas trilhas. Para garantir o desconto, vá direto ao link abaixo:

Qualquer dúvida adicional, por favor, mande e-mail para comercial@analisemacro.com.br.

______________

Turmas de Inverno: últimos dias de inscrições!

By | Cursos da Análise Macro

As inscrições para as Turmas de Inverno dos nossos Cursos Aplicados de R estão chegando ao fim. Há vagas para 15 Cursos Livres e 3 Formações. As turmas de Inverno terão início no dia 15/06 e contarão com o nosso Curso de Introdução ao R para Análise de Dados, de modo que não é necessário nenhum conhecimento prévio na linguagem. Para todos os detalhes sobre as Turmas de Inverno, continue lendo esse informativo...

Nós abrimos vagas para quatro áreas dos nossos Cursos Livres: Data Science, Macroeconomia Aplicada, Econometria e Finanças. Haverá vagas para 15 Cursos, a saber:

Cursos de Data Science

Macroeconomia Aplicada

Cursos de Econometria

Cursos de Micro Aplicada

Cursos de Finanças

Além disso, também abrimos as inscrições para as nossas Formações:

Plano Disponível

Para essa Turma, estamos ofertando um plano único que envolve como bônus para qualquer curso acima o nosso Curso de R para Análise de Dados, Certificado, acesso por 12 meses às aulas gravadadas e plataforma tira-dúvidas exclusiva.

Investimento

Os preços dos Cursos variam de acordo com a complexidade do conteúdo. Os alunos poderão financiar a aquisição dos Cursos em até 10x sem juros no cartão de crédito.

Especialmente para essa edição dos nossos Cursos, nós ofereceremos 30% de desconto para quem adquirir todos os cursos de uma das nossas trilhas. Para garantir o desconto, vá direto ao link abaixo:

Qualquer dúvida adicional, por favor, mande e-mail para comercial@analisemacro.com.br.

______________

Análise estatística do IPCA-15 com o R

By | Inflação

O IPCA-15 é o primo do IPCA, o Índice de Preços ao Consumidor Amplo, principal índice de preços do país, que serve de referência para o regime de metas para inflação conduzido pelo Banco Central. A diferença entre um e outro se dá apenas pelo período de coleta, o IPCA-15 abrange o período de 16 do mês anterior até 15 do mês de referência, e pela abrangência geográfica. O acompanhamento do índice serve, por suposto, como boa prévia para verificar a inflação medida pelo IPCA.

Os dados do IPCA-15 podem ser facilmente baixados diretamente do site do SIDRA/IBGE, conforme o código a seguir.


library(tidyverse)
library(scales)
library(ggrepel)
library(png)
library(grid)
library(sidrar)
library(forecast)
library(tstools)

ipca15 = get_sidra(api='/t/3065/n1/all/v/355/p/all/d/v355%202') %>%
mutate(date = parse_date(`Mês (Código)`, format='%Y%m')) %>%
select(date, Valor) %>%
as_tibble()

Uma vez que os dados tenham sido baixados, é possível construir um gráfico como o abaixo, que ilustra a inflação acumulada em 12 meses medida pelo IPCA-15, bem como ilustra os limites da meta de inflação instituídos pelo Conselho Monetário Nacional (CMN). Os códigos dessa parte do exercício estão disponíveis para os membros do Clube AM.

Esse tipo de gráfico é interessante porque com ele é imediato verificar se a inflação medida pelo índice está dentro dos limites de tolerância estabelecidos pelo CMN. Como se vê, a inflação na ponta - janeiro de 2021 - encontra-se acima da meta de inflação, que para esse ano é de 3,75%.

Assim como o seu primo, o IPCA-15 também apresenta uma sazonalidade bastante aparente ao longo do ano, como pode ser visto abaixo.

Uma outra informação interessante sobre o índice reside na sua distribuição. Observe o boxplot abaixo.

A mediana do índice, para uma amostra que começa em janeiro de 200, está em 0,42%, enquanto a sua média está em 0,45%. O 1º quartil termina em 0,23% e o 3º quartil termina em 0,64%, o que dá um IQR de 0,41 pontos percentuais. Dado esse comportamento da média e da mediana, temos um histograma como o abaixo.

Dado o que foi dito anteriormente, temos uma assimetria à direita nos dados do IPCA-15. Essa análise exploratória dos dados do índice, diga-se, é de suma importância para construirmos um modelo adequado de previsão para o mesmo. É o que faremos em exercícios futuros dentro do Clube AM.

_________________

Cursos de Econometria: inscrições abertas!

By | Cursos da Análise Macro

As inscrições para os Cursos de Econometria da Análise Macro estão abertas! O 1º lote com 30% de desconto fica disponível por 24h, somente hoje, 28/07. A partir de amanhã, 29/07, serão aceitas inscrições com o preço cheio. A novidade dessa edição especial dos Cursos é o novo Curso de Análise de Séries Temporais. Com o programa totalmente reformulado, o Curso visa dar uma introdução aplicada à econometria de séries temporais. Abaixo, todos os Cursos disponíveis na trilha de econometria:

Além disso, também abrimos as inscrições para a nossa Formação:

Plano Único

Será ofertado um Plano Único com acesso ao conteúdo dos Cursos por 12 meses, suporte customizado do professor e acesso ao Clube do Código também por 12 meses. Nosso objetivo com isso é dar um treinamento totalmente customizado para os alunos inscritos.

Investimento

Os preços dos Cursos variam de acordo com a complexidade do conteúdo. Os alunos poderão financiar a aquisição dos Cursos em até 10x sem juros no cartão de crédito.

Qualquer dúvida adicional, por favor, mande e-mail para comercial@analisemacro.com.br.

______________

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais
e conteúdos exclusivos sobre Análise de Dados!

Assinar Gratuitamente