Começando a programar com Python

Ontem, publiquei nesse espaço sobre como começar a programar com o R. O texto faz parte de uma série de textos que quero organizar ao longo das próximas semanas, com foco no público que ainda tem dúvidas sobre se deve mesmo embarcar na programação e, óbvio, no pessoal que está começando a programar. Meu foco nesses textos será programar em R, porque eu acabei adotando a linguagem como sendo a minha linguagem principal. Mas acho importante saber navegar por outros universos, por isso hoje vou falar um pouco sobre python.

Há uma briga boba entre alguns cientistas de dados sobre qual seria a "melhor" linguagem para análise de dados. Acho isso besteira porque sempre vai ter um "componente emocional" na resposta. Para os propósitos dessa série, voltada para gente iniciante, eu recomendo fortemente que você invista tempo em se tornar fluente em uma delas, a que lhe deixa mais confortável. Quando chegar em um nível de fluência, vá aos poucos incorporando a outra, de modo que com o tempo você irá programar nas duas com tranquilidade.

Controlado pelo "componente emocional", eu considero que você deva começar pelo R e só depois avançar para o Python. Por quê? Bom, acho mais simples aprender R para quem não teve nenhum treinamento formal em computação. Isto é, aprendeu informática no ambiente Windows, nunca usou Linux ou nem tem ideia onde fica o prompt de comando. Minha experiência como professor ao longo desses anos mostra que isso é uma barreira à entrada muito pertinente. E que pode abortar muitas aventuras no ramo da programação.

Isso dito, comece pelo R. À medida que você for se tornando fluente na linguagem, adquirindo maior experiência com o que está "por trás das cortinas", comece lentamente a aprender Python. E aqui você pode perguntar: há necessidade de saber as duas? A resposta é depende. Depende do seu objetivo de carreira. Se você quer trabalhar com equipes de ciência de dados, é razoável que você consiga ler e escrever scripts nas duas linguagem em um nível decente. Equipes de ciências de dados utilizam várias plataformas, mas em geral, a equipe "adota" uma linguagem para chamar de sua nos projetos de análise de dados.

Dou como exemplo aqui minha própria experiência. Como acho que já é claro a essa altura, eu sou #teamR, mas em certos momentos acabei prestando consultoria para empresas onde a equipe de dados "adota" python. Nesses casos, não tem jeito: eu tinha que entregar o trabalho em python. Além disso, como professor, acabei recebendo demandas de treinamento em python, então, não teve jeito, tive que jogar no #teamPython vez ou outra. O importante é entregar o projeto, em qualquer uma das linguagens. O "tesão" aqui não é pela sintaxe ou pelo purismo, mas pelo problema de análise de dados. E, cá entre nós, isso é que motiva a gente a conhecer diversas linguagens, de modo a atacar cada vez mais problemas...

Filosofia ao lado, se você quer começar a programar em Python também, eu recomendo que você instale já o Anaconda, de modo a ter acesso ao python propriamente dito e ao Jupyter, uma IDE bastante utilizada por quem lida com análise de dados.

Bom, se você chegou até aqui e seguiu o que eu recomendei, você já tem o R, o Python, o RStudio, o Miktex e o Jupyter instalados na sua máquina. Agora é começar, né? Como eu disse no post anterior, na próxima semana, eu falo de estruturas de dados, algo válido para qualquer linguagem. Até lá!

_________________________

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Transfer Learning: mostrando porque o Python está na ponta do desenvolvimento

A aprendizagem por transferência (transfer learning) é o reuso de um modelo pré-treinado em um novo problema. Portanto, sua utilização torna-se um avanço enorme para a previsão de diferentes tipos de variáveis, principalmente para aquelas ordenadas no tempo. Mostramos nesta postagem o uso do Transfer Learning com o Python para o caso de Séries Temporais.

Criando Tabelas com o Python: mostrando o poder da linguagem sobre o Excel

Nos dias atuais, pessoas que trabalham com dados estão constantemente confrontados com um dilema: criar uma tabela não tão genial no Excel ou manter em um formato ainda pior, como um dataframe, mas mantendo a flexibilidade de obtenção dos dados. Podemos resolver esse grande problema, unindo a flexibilidade e beleza ao usar a biblioteca great_tables do Python.

Análise do Censo Demográfico com o R

Como podemos analisar dados do Censo Demográfico para produzir pesquisas e implementar políticas públicas? Mostramos nesta postagem o resultado de uma breve análise dos dados preliminares do Censo Demográfico de 2022 usando o R.

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.