Começando a programar com Python

Ontem, publiquei nesse espaço sobre como começar a programar com o R. O texto faz parte de uma série de textos que quero organizar ao longo das próximas semanas, com foco no público que ainda tem dúvidas sobre se deve mesmo embarcar na programação e, óbvio, no pessoal que está começando a programar. Meu foco nesses textos será programar em R, porque eu acabei adotando a linguagem como sendo a minha linguagem principal. Mas acho importante saber navegar por outros universos, por isso hoje vou falar um pouco sobre python.

Há uma briga boba entre alguns cientistas de dados sobre qual seria a "melhor" linguagem para análise de dados. Acho isso besteira porque sempre vai ter um "componente emocional" na resposta. Para os propósitos dessa série, voltada para gente iniciante, eu recomendo fortemente que você invista tempo em se tornar fluente em uma delas, a que lhe deixa mais confortável. Quando chegar em um nível de fluência, vá aos poucos incorporando a outra, de modo que com o tempo você irá programar nas duas com tranquilidade.

Controlado pelo "componente emocional", eu considero que você deva começar pelo R e só depois avançar para o Python. Por quê? Bom, acho mais simples aprender R para quem não teve nenhum treinamento formal em computação. Isto é, aprendeu informática no ambiente Windows, nunca usou Linux ou nem tem ideia onde fica o prompt de comando. Minha experiência como professor ao longo desses anos mostra que isso é uma barreira à entrada muito pertinente. E que pode abortar muitas aventuras no ramo da programação.

Isso dito, comece pelo R. À medida que você for se tornando fluente na linguagem, adquirindo maior experiência com o que está "por trás das cortinas", comece lentamente a aprender Python. E aqui você pode perguntar: há necessidade de saber as duas? A resposta é depende. Depende do seu objetivo de carreira. Se você quer trabalhar com equipes de ciência de dados, é razoável que você consiga ler e escrever scripts nas duas linguagem em um nível decente. Equipes de ciências de dados utilizam várias plataformas, mas em geral, a equipe "adota" uma linguagem para chamar de sua nos projetos de análise de dados.

Dou como exemplo aqui minha própria experiência. Como acho que já é claro a essa altura, eu sou #teamR, mas em certos momentos acabei prestando consultoria para empresas onde a equipe de dados "adota" python. Nesses casos, não tem jeito: eu tinha que entregar o trabalho em python. Além disso, como professor, acabei recebendo demandas de treinamento em python, então, não teve jeito, tive que jogar no #teamPython vez ou outra. O importante é entregar o projeto, em qualquer uma das linguagens. O "tesão" aqui não é pela sintaxe ou pelo purismo, mas pelo problema de análise de dados. E, cá entre nós, isso é que motiva a gente a conhecer diversas linguagens, de modo a atacar cada vez mais problemas...

Filosofia ao lado, se você quer começar a programar em Python também, eu recomendo que você instale já o Anaconda, de modo a ter acesso ao python propriamente dito e ao Jupyter, uma IDE bastante utilizada por quem lida com análise de dados.

Bom, se você chegou até aqui e seguiu o que eu recomendei, você já tem o R, o Python, o RStudio, o Miktex e o Jupyter instalados na sua máquina. Agora é começar, né? Como eu disse no post anterior, na próxima semana, eu falo de estruturas de dados, algo válido para qualquer linguagem. Até lá!

_________________________

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Previsões do Boletim Focus em Anos Eleitorais

Eleições são momentos de incerteza, mas os dados do Boletim Focus mostram que nem toda incerteza é igual. Ao analisar as previsões de inflação, juros e câmbio nos anos que antecederam as eleições de 2014, 2018 e 2022, este post investiga como o mercado revisa cenários macroeconômicos ao longo do tempo.

Como Medir o Ciclo das Concessões de Crédito usando Python

Este exercício apresenta uma análise quantitativa da relação entre o ciclo de concessões de crédito, a atividade econômica e a política monetária no Brasil. Utilizando a linguagem Python, o estudo aplica técnicas de decomposição de séries temporais (X13-ARIMA e Filtro HP) para isolar os componentes cíclicos dos dados. Os resultados da modelagem econométrica confirmam a pró ciclicidade do crédito em relação ao hiato do produto e sua sensibilidade às variações no hiato da taxa de juros real.

Choque de juros e renda em bens duráveis e não duráveis usando Python

Este artigo analisa a dinâmica do consumo no Brasil utilizando Python e modelos de Vetores Autorregressivos (VAR). Ao segregar bens duráveis e não duráveis, o estudo quantifica a sensibilidade a choques de juros e renda. Criamos todo o processo através do ciclo de dados: coleta, tratamento, análise de dados, modelagem e apresentação dos resultados, tudo automatizado usando a linguagem Python.

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.