Como tratar dados no Python? Parte 3: modificando colunas

Como criar ou alterar as colunas de uma tabela de dados usando Python? Neste tutorial mostramos os métodos de modificação de colunas disponíveis na biblioteca pandas, que tem como vantagem sua sintaxe simples e prática.

A criação e modificação de colunas é uma etapa presente em quase todo tratamento/limpeza de dados. Afinal, com tabelas de dados cada vez maiores, é necessário tratar e processar os valores para a análise dos dados. Sendo assim, vamos a um exemplo prático.

Para obter o código e o tutorial deste exercício faça parte do Clube AM e receba toda semana os códigos em R/Python, vídeos, tutoriais e suporte completo para dúvidas.

Dados de exemplo

Primeiro, coletamos online uma tabela de dados CSV de exemplo. A fonte dos dados é o Banco Central do Brasil e para coletar os dados também usamos a biblioteca pandas. Abaixo uma visão geral da tabela:

valor
Date
2021-07-01 46549.1
2021-08-01 50691.8
2021-09-01 50263.7
2021-10-01 50022.6
2021-11-01 52720.8

Como criar ou alterar a coluna da tabela?

Para criar ou alterar colunas de uma tabela podemos usar a função assign() com a sintaxe tabela.assign(nome_coluna = valores_coluna), onde nome_coluna pode ser uma coluna nova ou preexistente e valores_coluna deve ser uma pandas Series, um scalar ou um callable, ou seja, uma função que é executada e retorna os valores para serem atribuídos na coluna.

Por exemplo, vamos supor que você queira adicionar uma coluna que identifica os valores, ou seja, com o nome da variável:

valor variavel
Date
2021-07-01 46549.1 IDP
2021-08-01 50691.8 IDP
2021-09-01 50263.7 IDP
2021-10-01 50022.6 IDP
2021-11-01 52720.8 IDP

Seguindo a mesma lógica, podemos criar quantas colunas forem necessárias, com novos valores ou valores modificados de colunas preexistentes. Repare que você pode usar funções lambda que fazem rerefência às colunas e retornam uma Series de valores:

valor variavel valor_log valor_lag1 valor_log_lag1 valor_copia valor_revertido
Date
2021-07-01 10.748263 IDP 10.748263 43533.0 10.681275 46549.1 46549.1
2021-08-01 10.833519 IDP 10.833519 46549.1 10.748263 50691.8 50691.8
2021-09-01 10.825038 IDP 10.825038 50691.8 10.833519 50263.7 50263.7
2021-10-01 10.820230 IDP 10.820230 50263.7 10.825038 50022.6 50022.6
2021-11-01 10.872765 IDP 10.872765 50022.6 10.820230 52720.8 52720.8

Para saber mais consulte a documentação da biblioteca.

Conclusão

Como criar ou alterar as colunas de uma tabela de dados usando Python? Neste tutorial mostramos os métodos de modificação de colunas disponíveis na biblioteca pandas, que tem como vantagem sua sintaxe simples e prática.

Tenha acesso ao código e suporte desse e de mais 500 exercícios no Clube AM!

Quer o código desse e de mais de 500 exercícios de análise de dados com ideias validadas por nossos especialistas em problemas reais de análise de dados do seu dia a dia? Além de acesso a vídeos, materiais extras e todo o suporte necessário para você reproduzir esses exercícios? Então, fale com a gente no Whatsapp e veja como fazer parte do Clube AM, clicando aqui.

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Determinantes do Preço do Ouro: VAR + Linguagem R

Este artigo realiza uma análise econométrica para investigar os determinantes dinâmicos do preço do ouro. Utilizando um modelo Vetorial Autorregressivo (VAR) em R, examinamos o impacto de variáveis como o dólar (DXY), a curva de juros e a incerteza global. Os resultados mostram que um fortalecimento inesperado do dólar tem um efeito negativo e significativo no curto prazo sobre os retornos do ouro, embora a maior parte de sua variância seja explicada por fatores intrínsecos ao seu próprio mercado.

Existe correlação entre vagas de emprego e o S&P 500?

O que explica a divergência entre S&P 500 e vagas de emprego? Seria o impacto da IA ou a política monetária? Utilizando um análise dados e modelo VAR e testes de causalidade de Granger usando a linguagem de programação R, investigamos a relação e o motivo por trás da "boca de jacaré".

Como medir a comunicação do Banco Central?

Descubra como o índice ALT transforma a linguagem do Banco Central em dados analisáveis, permitindo investigar como o tom das atas do COPOM varia conforme o cenário macroeconômico e as decisões de política monetária.

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.