Data Science para Economistas

Preparamos uma sequência de módulos super aplicados para quem quer utilizar as técnicas de data science na produção de trabalhos empíricos em economia. A nossa Formação em Data Science para Economistas vai desde a instalação de programas e pacotes até a construção de relatórios e apresentações em RMarkdown. Sem sair do RStudio, você irá aprender a coletar, tratar, analisar e apresentar seus dados.

Data Science para quem quer produzir trabalhos empíricos em economia

Ao longo dos últimos anos, houve uma consolidação e sistematização de técnicas voltadas para lidar com grandes bases de dados. A intersecção entre poder computacional, métodos estatísticos e disponibilidade de dados produziu uma nova e excitante área de estudos: a área de data science.

De forma inédita no Brasil, a Análise Macro ofecere ao mercado o que há de mais avançado na área de data science para a aplicação em estudos empíricos em economia. Você vai aprender a utilizar o R, uma das linguagens mais adotadas por cientistas de dados, para coletar, tratar, analisar e apresentar dados.

A nossa nova Formação é voltada para estudantes dos anos finais da graduação em economia, candidatos ao mestrado e doutorado em economia, professores de universidades que queiram aprender as principais técnicas de data science e, especialmente, para profissionais de mercado envolvidos diariamente com a análise de grandes bases de dados.

Como eu farei a Formação?

A Turma de Inverno está com inscrições abertas com vagas limitadas de modo a dar suporte total aos alunos inscritos.

Uma vez inscrito na turma, o aluno percorrerá sete módulos descritos a seguir que unem tudo o que ele precisa para produzir trabalhos empíricos no R. Também terá acesso às mentorias exclusivas de orientação do professor ao longo dos módulos. Por fim, todos os alunos da Formação também terão acesso vitalício aos mais de 70 exercícios de análise de dados disponíveis no Clube do Código, bem como aos novos exercícios que são disponibilizados quinzenalmente.

Inscrições e Conversa inicial

As inscrições estão abertas e ficam disponíveis até se esgotarem as vagas. Uma vez inscrito, o aluno terá uma primeira conversa on-line com o professor, para que o mesmo entenda o perfil do aluno e as necessidades específicas a serem supridas com a Formação. Essa conversa ocorrerá entre 13 de maio e 01 de junho.

Formação Data Science para Economistas começará oficialmente no dia 02/06/2020. O aluno poderá concluir os módulos e as mentorias de acordo com o seu ritmo, tendo o prazo máximo para isso de 18 meses.

Módulo 1 Introdução ao tidyverse

A Formação começa com uma introdução ao que há de mais avançado na linguagem para lidar com análise de dados: a família de pacotes tidyverse. Abaixo, as aulas que você terá nesse módulo:

  • Apresentação do R e do RStudio
  • Introdução ao mundo tidyverse: R packages for Data Science
  • Importação de Dados: os pacotes readr e readxl
  • Importação de Dados com os pacotes BETSSidraRecoseries e rbcb
  • Laboratório: importação de dados reais para o R

O material desse módulo já está disponível na plataforma.

Módulo 2 Tratamento de Dados

O segundo módulo da Formação dá ênfase ao tratamento de dados com os pacotes da família tidyverse. Nesse módulo, você terá as seguintes aulas:

  • O pacote tibble
  • O pacote tidyr
  • O pacote dplyr
  • O pacote lubridate
  • Laboratório: tratamento de dados reais

O material desse módulo já está disponível na plataforma.

Módulo 3 Programando no R

O terceiro módulo da Formação cobre alguns aspectos gerais que estão em todas as etapas de análise de dados: a programação. Nesse módulo, você terá as seguintes aulas:

  • Estruturas de dados
  • Funções
  • Criando loops
  • Melhorando o seu código com pipes
  • Laboratório: criando funções no R

O material desse módulo já está disponível na plataforma.

Módulo 4 Análise Exploratória de Dados

O quarto módulo da Formação irá lhe colocar com a mão na massa, de modo que você possa extrair relações da sua base de dados. Nesse módulo, você terá as seguintes aulas:

  • O pacote ggplot2
  • Gráficos de Linha
  • Gráficos de Linha com pontos
  • Gráficos de Correlação
  • Gráficos de Correlação com círculos
  • Gráficos com pontos nomeados
  • Gráficos de Barras
  • Gráficos de Barra Empilhados
  • Correlogramas
  • Gráficos de Densidade
  • Gráficos de Área Empilhado
  • Gráficos com áreas sombreadas
  • Gráficos Múltiplos
  • Boxplots
  • Histogramas
  • Laboratório: análise exploratória de churn

O material desse módulo já está disponível na plataforma. 

Módulo 5 Modelagem

O quinto módulo é o coração da nossa Formação. Uma vez que você tenha coletado, tratado e explorado o seu conjunto de dados, você está pronto para construir modelos relacionando as suas variáveis, de modo a confirmar a sua hipótese de trabalho. Nesse módulo, você terá as seguintes aulas:

  • Introdução à Modelagem
  • Introdução à Econometria e Estruturas de Dados
  • Regressão Linear Simples
  • Regressão Linear Múltipla
  • Regressão Linear para Séries Temporais
  • Regressão Linear para Dados em Painel
  • Sistemas de Equações
  • Testes e Diagnósticos
  • Variáveis Instrumentais
  • Regressão Resistente
  • Regressão Quantílica
  • Modelos Lineares Generalizados
  • Regressões Logit e Probit
  • Modelos de Regressão para dados de contagem
  • Variáveis Dependentes Censuradas
  • Um modelo de resposta binária semiparamétrico
  • Modelos de resposta multinomial
  • Modelos de Resposta Ordenada
  • Modelos de Regressão com descontinuidade (RDD)
  • Microdados brasileiros
  • Modelos Lineares Univariados aplicados a séries temporais (ARIMA/SARIMA)
  • Modelos Multivariados (VAR/VEC)
  • Volatilidade de Ativos e Modelos de Volatilidade
  • Modelo de efeitos fixos
  • Modelo de efeitos aleatórios
  • Laboratório: produzir um modelo explicativo

O material desse módulo já está disponível na plataforma.

Módulo 6 Machine Learning

O sexto módulo da Formação abordará algoritmos de machine learning, a saber:

  • Introdução à Machine Learning
  • Classificação usando algoritmos k-NN
  • Classificação usando Naive Bayes
  • Classificação com Árvores de Decisão
  • Previsão numérica usando métodos de regressão
  • Redes Neurais
  • Support Vector Machine (SVM)
  • Regras de Associação
  • Clustering
  • Métodos de Reamostragem
  • Seleção e regularização linear de modelos
  • Bagging, random forest e boosting
  • Avaliando o desempenho do modelo
  • Melhorando o desempenho do modelo

O material desse módulo estará disponível na plataforma a partir do dia 02/06.

Módulo 7 Apresentação

O último módulo da nossa Formação irá lhe ensinar a apresentar os resultados encontrados por meio do RMarkdown. Nesse módulo, você terá as seguintes aulas:

  • Construindo seu primeiro documento RMarkdown
  • Integrando código e texto
  • Gráficos
  • Figuras
  • Criando um relatório completo em RMarkdown
  • Criando uma apresentação completa em RMarkdown

O material desse módulo já está disponível na plataforma.

Sobre o professor

Vítor Wilher

Mestre em Economia | Cientista de Dados

Vítor Wilher é Bacharel e Mestre em Economia, pela Universidade Federal Fluminense, especialista em Data Science pela Johns Hopkins University e um dos professores pioneiros na oferta de Cursos de R no Brasil. Sua dissertação de mestrado foi na área de política monetária, titulada "Clareza da Comunicação do Banco Central e Expectativas de Inflação: evidências para o Brasil", defendida perante banca composta pelos professores Gustavo H. B. Franco (PUC-RJ), Gabriel Montes Caldas (UFF), Carlos Enrique Guanziroli (UFF) e Luciano Vereda Oliveira (UFF). Já trabalhou em grandes empresas, nas áreas de telecomunicações, energia elétrica, consultoria financeira e consultoria macroeconômica. Atualmente, é Sócio-fundador da Análise Macro e Palestrante. Caso queira, mande um e-mail para ele: vitorwilher@analisemacro.com.br. O portfólio e currículo completo do professor podem ser vistos aqui.

Mentorias Exclusivas

Além dos seis módulos acima especificados, os alunos da Formação terão acesso à seis mentorias exclusivas do professor Vítor Wilher, um dos pioneiros no ensino de R no país. Com grande experiência na orientação de alunos para a produção de trabalhos empíricos, Wilher mostrará o passo a passo de como lidar com as mais diversas e complexas bases de dados. Nessas mentorias, os alunos poderão tirar dúvidas sobre a hipótese de trabalho, problemas específicos da sua base de dados, onde encontrar dados, qual seria o melhor modelo, testes específicos, como apresentar os dados, dentre diversas outras questões.

Acesso ao Clube do Código

Ao adquirir a Formação Data Science para Economistas, o aluno tem acesso vitálicio ao Clube do Código, o espaço de compartilhamento de códigos da Análise Macro. Lá você tem acesso exclusivo a todos os códigos dos nossos exercícios já feitos de análise de dados, bem como aos novos exercícios do Clube. Uma ferramenta sem igual no mercado para você praticar o que aprendeu ao longo da Formação!

Emitimos Certificado de 360 horas para uso no seu trabalho ou universidade

Os alunos inscritos na Formação terão acesso a certificado de 360 horas. Para isso, deverão entregar os seis laboratórios desenvolvidos ao longo dos módulos ou desenvolver um trabalho de maior fôlego ao final da Formação, que será avaliado nas mentorias exclusivas com o professor.