Como criar um Portfólio em Ciência de Dados?

Um portfólio em Ciência de Dados é o lugar onde qualquer pessoa que tenha interesse na área possa colocar os seus projetos, de forma a mostrá-los para diversas pessoas, principalmente empregadores. Mas, como é possível criar um? Iniciaremos, a partir do post hoje, e seguiremos nas próximas três quartas-feiras, uma série de postagens com o intuito de ensinar a como criar um portfólio do zero, mostrando ferramentas que irão auxiliar a colocar diversos projetos criados por meio do R e do Python em uma página Web.

A série de post que iremos criar ao longo das semanas envolvem os conceitos e as ferramentas utilizadas para construir o portfólio. Obviamente, elas não são ferramentas únicas, existem diversos meios de criar um portfólio, entretanto, a escolha das utilizadas aqui possuem o intuito de ensinar o básico para aqueles que desejam colocar com facilidade projetos em páginas Web de forma automatizada.

Seguiremos a seguinte ordem de aprendizado:

  1. Aprenderemos hoje os conceitos básicos do que é necessário ter em um portfólio e os conceitos iniciais do melhor repositório Web para mantê-lo: Github
  2. No próximo post, aprenderemos como construir um Blog/arquivo utilizando uma ferramenta que pode ser utilizada tanto com R, quanto com Python, conhecido como Quarto.
  3. Agora que temos o nosso conteúdo, devemos mantê-lo em uma pagina Web, aqui onde aprenderemos sobre o Github Pages.
  4. Por fim, necessitamos manter tudo automatizado, afinal, é possível que tenhamos dados coletados de tempos em tempos. Iremos utilizar o Github Actions.

Todos esses passos são ensinados com vídeos comentados para assinantes do Clube AM, o repositório especial da Análise Macro, onde postamos exercícios e códigos.

O que é um portfólio?

Portfólio é um conjunto de projetos, estes construídos com a finalidade de resolver problemas através de linguagens de programação como o R e o Python. Mas por que é tão importante um portfólio? Ele praticamente resume suas experiencias, habilidades e obviamente, ajudam pessoas a solucionarem problemas.

Para aqueles que desejam entrar na área de dados e chamar a atenção de recrutadores ou aqueles que desejam apenas demonstrar os resultados de seus projetos, o mais recomendo é construir um portfolio que seja mantido de forma online, seja através de um Website, Blog ou repositório, e que possuem capacidade de manter códigos, apresentações e até mesmo dashboards.

Antes de tentar criar qualquer Website ou Blog, devemos aprender a como utilizar um repositório, afinal, é a partir dele que podemos manter salvo os códigos/arquivos tanto dos projetos, quanto da própria página. Mas de onde podemos utilizar um repositório? Através do Github!

Github

O Github é uma plataforma online de hospedagem de código e arquivos com controle de versão utilizando o Git e e que permite que os usuários, em conjunto, possam construir códigos de qualquer local do mundo.

Um controle de versão ou versionamento de código é uma forma de gerenciar diferentes versões de um código. É uma ótima forma de administrar um projeto não somente individualmente, mas também com outros usuários.

Usualmente utiliza-se o Git, um sistema de controle de versões que possui comandos próprios para o controle de versões.

Algumas das possibilidades de uso do Github temos:

  • Repositório de arquivos e códigos com controle de versões
  • Possibilidade trabalhar na construção ou mudança de um código em conjunto com um time em tempo real e de qualquer local.
  • Automatização da execução do código por meio do Github Actions.
  • Criação de sites por meio do Github Pages.

Por isso, se torna o local ideal para apresentar os resultados e controlar as mudanças das nossas análises/projetos.

Mas como podemos utilizar o Github? Em primeiro lugar, o site disponibiliza muitos recursos gratuitamente, portanto, podemos criar uma conta livremente.

Uma vez que o usuário tenha criado uma conta é interessante construir um perfil que elenque os seus interesses de trabalhos e projetos; a área em que atua; uma ótima foto de perfil. Pense: o Github será a sua rede social para os códigos e projetos, portanto, é legal manter um perfil atualizado e com diversas informações.

Uma vez que tenhamos construído um perfil no Github, devemos utiliza-lo para manter os nossos códigos e como podemos fazer isso?

Devemos criar um repositório!

Um repositório é o local onde iremos manter o nosso código e arquivos, portanto, deve ter um nome único, afinal, terá o seu próprio URL para que todos possam acessar.

Para criar um repositório devemos acessar a Aba "repositories" e clicar em "New". Com isso irá aparecer a seguinte página:

 

Em "Repository name" escolhemos o nome do repositório e também da URL, portanto, não pode haver espaço em branco.

Podemos criar uma descrição opcional para o repositório em Description.

Escolhemos se será um repositório Publico ou Privado.

Podemos adicionar um arquivo README. Esse arquivo é conhecido para manter as informações sobre o propósito do repositório, o que eles podem fazer com o projeto e como eles podem utilizá-lo.

Ao clicar em "Create Repository", teremos uma página com o Setup do repositório com arquivos locais por meio do comando Git. Por esse método é possível tanto utilizar o Git direto da sua máquina por meio de comandos para exportar os arquivos para o Github, quanto utilizar Add-ons nas IDE para exportar os arquivos por meios de cliques.

Agora já temos nosso primeiro repositório onde podemos inserir arquivos com códigos.

Mas antes disso, vamos conhecer algumas funcionalidades do Github.

Pull requests: Requisições de outros usuários para modificar o repositórios, utilizado para solucionar problemas e contribuir com os códigos

Branch: Versão paralela do repositório. Um repositório pode ter várias versões e por padrão utiliza-se a "Main".

Commit: Conjunto de mudanças no repositório.

Merge: Adiciona as mudanças no pull request e Branch do repositório.

Esses são alguns pontos importantes que devemos entender para começar a utilizar o Github.

Mas além do Github, devemos conhecer os métodos para criar Blog e Websites, mas como faremos isso? Isso deixaremos para a nossas próximas postagens, onde aprenderemos a como utilizar um aplicativo útil para construir Blogs com R e Python, conhecido como Quarto, e após isso, aprenderemos a como utilizar o Github Pages.

____________________________________________________

Quer aprender mais?

Veja nossa trilha Ciência de Dados para Economia e Finanças e também o Clube AM.

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Análise regional do mercado de trabalho com dados do CAGED usando Python

Os microdados dos CAGED fornecem informações detalhadas a nível de cidade, sexo, raça, nível de instrução, idade, salário e outras sobre os trabalhadores formais do Brasil, possibilitando ricas análises regionais de dados. Neste artigo mostramos como acessar, processar e analisar estes dados utilizando o Python.

Transfer Learning: mostrando porque o Python está na ponta do desenvolvimento

A aprendizagem por transferência (transfer learning) é o reuso de um modelo pré-treinado em um novo problema. Portanto, sua utilização torna-se um avanço enorme para a previsão de diferentes tipos de variáveis, principalmente para aquelas ordenadas no tempo. Mostramos nesta postagem o uso do Transfer Learning com o Python para o caso de Séries Temporais.

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.