Como tratar dados no Python? Parte 3: modificando colunas

Como criar ou alterar as colunas de uma tabela de dados usando Python? Neste tutorial mostramos os métodos de modificação de colunas disponíveis na biblioteca pandas, que tem como vantagem sua sintaxe simples e prática.

A criação e modificação de colunas é uma etapa presente em quase todo tratamento/limpeza de dados. Afinal, com tabelas de dados cada vez maiores, é necessário tratar e processar os valores para a análise dos dados. Sendo assim, vamos a um exemplo prático.

Para obter o código e o tutorial deste exercício faça parte do Clube AM e receba toda semana os códigos em R/Python, vídeos, tutoriais e suporte completo para dúvidas.

Dados de exemplo

Primeiro, coletamos online uma tabela de dados CSV de exemplo. A fonte dos dados é o Banco Central do Brasil e para coletar os dados também usamos a biblioteca pandas. Abaixo uma visão geral da tabela:

valor
Date
2021-07-01 46549.1
2021-08-01 50691.8
2021-09-01 50263.7
2021-10-01 50022.6
2021-11-01 52720.8

Como criar ou alterar a coluna da tabela?

Para criar ou alterar colunas de uma tabela podemos usar a função assign() com a sintaxe tabela.assign(nome_coluna = valores_coluna), onde nome_coluna pode ser uma coluna nova ou preexistente e valores_coluna deve ser uma pandas Series, um scalar ou um callable, ou seja, uma função que é executada e retorna os valores para serem atribuídos na coluna.

Por exemplo, vamos supor que você queira adicionar uma coluna que identifica os valores, ou seja, com o nome da variável:

valor variavel
Date
2021-07-01 46549.1 IDP
2021-08-01 50691.8 IDP
2021-09-01 50263.7 IDP
2021-10-01 50022.6 IDP
2021-11-01 52720.8 IDP

Seguindo a mesma lógica, podemos criar quantas colunas forem necessárias, com novos valores ou valores modificados de colunas preexistentes. Repare que você pode usar funções lambda que fazem rerefência às colunas e retornam uma Series de valores:

valor variavel valor_log valor_lag1 valor_log_lag1 valor_copia valor_revertido
Date
2021-07-01 10.748263 IDP 10.748263 43533.0 10.681275 46549.1 46549.1
2021-08-01 10.833519 IDP 10.833519 46549.1 10.748263 50691.8 50691.8
2021-09-01 10.825038 IDP 10.825038 50691.8 10.833519 50263.7 50263.7
2021-10-01 10.820230 IDP 10.820230 50263.7 10.825038 50022.6 50022.6
2021-11-01 10.872765 IDP 10.872765 50022.6 10.820230 52720.8 52720.8

Para saber mais consulte a documentação da biblioteca.

Conclusão

Como criar ou alterar as colunas de uma tabela de dados usando Python? Neste tutorial mostramos os métodos de modificação de colunas disponíveis na biblioteca pandas, que tem como vantagem sua sintaxe simples e prática.

Tenha acesso ao código e suporte desse e de mais 500 exercícios no Clube AM!

Quer o código desse e de mais de 500 exercícios de análise de dados com ideias validadas por nossos especialistas em problemas reais de análise de dados do seu dia a dia? Além de acesso a vídeos, materiais extras e todo o suporte necessário para você reproduzir esses exercícios? Então, fale com a gente no Whatsapp e veja como fazer parte do Clube AM, clicando aqui.

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Coletando e integrando dados do BCB, IBGE e IPEA de forma automatizada

Quem trabalha com modelagem e previsão macroeconômica sabe o quanto é demorado reunir dados de diferentes fontes — Banco Central, IBGE, IPEA, FRED, IFI... Cada um com sua API, formato, frequência e estrutura. Esse gargalo de coleta e padronização consome tempo que poderia estar sendo usado na análise, nos modelos ou na comunicação dos resultados.

Foi exatamente por isso que criamos uma rotina de coleta automatizada, que busca, trata e organiza séries temporais econômicas diretamente das APIs oficiais, pronta para ser integrada a pipelines de previsão, dashboards ou agentes de IA econometristas.

Criando operações SQL com IA Generativa no R com querychat

No universo da análise de dados, a velocidade para obter respostas é um diferencial competitivo. Frequentemente, uma simples pergunta de negócio — “Qual foi nosso produto mais vendido no último trimestre na região Nordeste?” — inicia um processo que envolve abrir o RStudio, escrever código dplyr ou SQL, executar e, finalmente, obter a resposta. E se pudéssemos simplesmente perguntar isso aos nossos dados em português, diretamente no nosso dashboard Shiny?

Dashboard Financeiro com IA e Shiny Python: Análise de Dados Abertos da CVM

Este artigo apresenta um tutorial completo sobre como construir uma ferramenta de análise financeira de ponta. Utilizando Shiny for Python, demonstramos a automação da coleta de dados das Demonstrações Financeiras Padronizadas (DFP) da CVM e o tratamento dessas informações com Pandas. O ponto alto do projeto é a integração da IA Generativa do Google Gemini, que atua como um assistente de análise, interpretando os dados filtrados pelo usuário e fornecendo insights contábeis e financeiros em tempo real. O resultado é um dashboard dinâmico que democratiza a análise de dados complexos e acelera a tomada de decisão.

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.