Como tratar dados no Python? Parte 3: modificando colunas

Como criar ou alterar as colunas de uma tabela de dados usando Python? Neste tutorial mostramos os métodos de modificação de colunas disponíveis na biblioteca pandas, que tem como vantagem sua sintaxe simples e prática.

A criação e modificação de colunas é uma etapa presente em quase todo tratamento/limpeza de dados. Afinal, com tabelas de dados cada vez maiores, é necessário tratar e processar os valores para a análise dos dados. Sendo assim, vamos a um exemplo prático.

Para obter o código e o tutorial deste exercício faça parte do Clube AM e receba toda semana os códigos em R/Python, vídeos, tutoriais e suporte completo para dúvidas.

Dados de exemplo

Primeiro, coletamos online uma tabela de dados CSV de exemplo. A fonte dos dados é o Banco Central do Brasil e para coletar os dados também usamos a biblioteca pandas. Abaixo uma visão geral da tabela:

valor
Date
2021-07-01 46549.1
2021-08-01 50691.8
2021-09-01 50263.7
2021-10-01 50022.6
2021-11-01 52720.8

Como criar ou alterar a coluna da tabela?

Para criar ou alterar colunas de uma tabela podemos usar a função assign() com a sintaxe tabela.assign(nome_coluna = valores_coluna), onde nome_coluna pode ser uma coluna nova ou preexistente e valores_coluna deve ser uma pandas Series, um scalar ou um callable, ou seja, uma função que é executada e retorna os valores para serem atribuídos na coluna.

Por exemplo, vamos supor que você queira adicionar uma coluna que identifica os valores, ou seja, com o nome da variável:

valor variavel
Date
2021-07-01 46549.1 IDP
2021-08-01 50691.8 IDP
2021-09-01 50263.7 IDP
2021-10-01 50022.6 IDP
2021-11-01 52720.8 IDP

Seguindo a mesma lógica, podemos criar quantas colunas forem necessárias, com novos valores ou valores modificados de colunas preexistentes. Repare que você pode usar funções lambda que fazem rerefência às colunas e retornam uma Series de valores:

valor variavel valor_log valor_lag1 valor_log_lag1 valor_copia valor_revertido
Date
2021-07-01 10.748263 IDP 10.748263 43533.0 10.681275 46549.1 46549.1
2021-08-01 10.833519 IDP 10.833519 46549.1 10.748263 50691.8 50691.8
2021-09-01 10.825038 IDP 10.825038 50691.8 10.833519 50263.7 50263.7
2021-10-01 10.820230 IDP 10.820230 50263.7 10.825038 50022.6 50022.6
2021-11-01 10.872765 IDP 10.872765 50022.6 10.820230 52720.8 52720.8

Para saber mais consulte a documentação da biblioteca.

Conclusão

Como criar ou alterar as colunas de uma tabela de dados usando Python? Neste tutorial mostramos os métodos de modificação de colunas disponíveis na biblioteca pandas, que tem como vantagem sua sintaxe simples e prática.

Tenha acesso ao código e suporte desse e de mais 500 exercícios no Clube AM!

Quer o código desse e de mais de 500 exercícios de análise de dados com ideias validadas por nossos especialistas em problemas reais de análise de dados do seu dia a dia? Além de acesso a vídeos, materiais extras e todo o suporte necessário para você reproduzir esses exercícios? Então, fale com a gente no Whatsapp e veja como fazer parte do Clube AM, clicando aqui.

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Como criar um Agente de IA coletor de dados

A tecnologia de agentes de IA está democratizando o acesso e a manipulação de dados econômicos complexos, tornando-a acessível mesmo para aqueles sem experiência em programação. Neste post discutimos a criação de agentes de IA para coletar dados econômicos brasileiros usando linguagem natural, como "Qual é a expectativa do IPCA para 2025?".

Como Criar um Agente Analista para Dados da Inflação com LangGraph

Este post mostra como automatizar a análise da inflação brasileira com o uso de agentes inteligentes. Utilizando o LangGraph, integramos dados do IPCA, núcleos de inflação e grupos do índice para criar um sistema capaz de gerar análises econômicas automatizadas com base em consultas em linguagem natural.

Como Criar um Agente para Análise da Atividade Econômica com LangGraph

Este post mostra como automatizar a análise da atividade econômica brasileira com agentes inteligentes. Utilizando o framework LangGraph e dados do IBGE e Banco Central, construímos um sistema capaz de gerar respostas analíticas a partir de perguntas em linguagem natural, unindo automação de consultas SQL e interpretação econômica.

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.