Como criar ou alterar as colunas de uma tabela de dados usando Python? Neste tutorial mostramos os métodos de modificação de colunas disponíveis na biblioteca pandas, que tem como vantagem sua sintaxe simples e prática.
A criação e modificação de colunas é uma etapa presente em quase todo tratamento/limpeza de dados. Afinal, com tabelas de dados cada vez maiores, é necessário tratar e processar os valores para a análise dos dados. Sendo assim, vamos a um exemplo prático.
Para obter o código e o tutorial deste exercício faça parte do Clube AM e receba toda semana os códigos em R/Python, vídeos, tutoriais e suporte completo para dúvidas.
Dados de exemplo
Primeiro, coletamos online uma tabela de dados CSV de exemplo. A fonte dos dados é o Banco Central do Brasil e para coletar os dados também usamos a biblioteca pandas. Abaixo uma visão geral da tabela:
valor | |
---|---|
Date | |
2021-07-01 | 46549.1 |
2021-08-01 | 50691.8 |
2021-09-01 | 50263.7 |
2021-10-01 | 50022.6 |
2021-11-01 | 52720.8 |
Como criar ou alterar a coluna da tabela?
Para criar ou alterar colunas de uma tabela podemos usar a função assign()
com a sintaxe tabela.assign(nome_coluna = valores_coluna)
, onde nome_coluna
pode ser uma coluna nova ou preexistente e valores_coluna
deve ser uma pandas Series
, um scalar
ou um callable
, ou seja, uma função que é executada e retorna os valores para serem atribuídos na coluna.
Por exemplo, vamos supor que você queira adicionar uma coluna que identifica os valores, ou seja, com o nome da variável:
valor | variavel | |
---|---|---|
Date | ||
2021-07-01 | 46549.1 | IDP |
2021-08-01 | 50691.8 | IDP |
2021-09-01 | 50263.7 | IDP |
2021-10-01 | 50022.6 | IDP |
2021-11-01 | 52720.8 | IDP |
Seguindo a mesma lógica, podemos criar quantas colunas forem necessárias, com novos valores ou valores modificados de colunas preexistentes. Repare que você pode usar funções lambda
que fazem rerefência às colunas e retornam uma Series
de valores:
valor | variavel | valor_log | valor_lag1 | valor_log_lag1 | valor_copia | valor_revertido | |
---|---|---|---|---|---|---|---|
Date | |||||||
2021-07-01 | 10.748263 | IDP | 10.748263 | 43533.0 | 10.681275 | 46549.1 | 46549.1 |
2021-08-01 | 10.833519 | IDP | 10.833519 | 46549.1 | 10.748263 | 50691.8 | 50691.8 |
2021-09-01 | 10.825038 | IDP | 10.825038 | 50691.8 | 10.833519 | 50263.7 | 50263.7 |
2021-10-01 | 10.820230 | IDP | 10.820230 | 50263.7 | 10.825038 | 50022.6 | 50022.6 |
2021-11-01 | 10.872765 | IDP | 10.872765 | 50022.6 | 10.820230 | 52720.8 | 52720.8 |
Para saber mais consulte a documentação da biblioteca.
Conclusão
Como criar ou alterar as colunas de uma tabela de dados usando Python? Neste tutorial mostramos os métodos de modificação de colunas disponíveis na biblioteca pandas, que tem como vantagem sua sintaxe simples e prática.
Tenha acesso ao código e suporte desse e de mais 500 exercícios no Clube AM!
Quer o código desse e de mais de 500 exercícios de análise de dados com ideias validadas por nossos especialistas em problemas reais de análise de dados do seu dia a dia? Além de acesso a vídeos, materiais extras e todo o suporte necessário para você reproduzir esses exercícios? Então, fale com a gente no Whatsapp e veja como fazer parte do Clube AM, clicando aqui.