SQL: Group by e Order by

A linguagem SQL permite melhorar o processo de manipulação de dados por meio da agregação de dados. O processo consiste em agregar os registros e aplicar um cálculo, normalmente através de funções.

Vamos utilizar um exemplo para entender melhor o método.

Utilizando a tabela station_data, é possível contar os registros, renomeando a coluna para um novo nome:

A função COUNT(*) permite aplicar um cálculo de contagem de registro das colunas da tabela. Podemos utilizar outros comandos, por exemplo, com WHERE, para obter os lugares onde ocorrerão tornado. (= 1 - verdadeiro).

E se quisermos saber o resultado da contagem de registro a cada ano em que ocorrerão tornados? Devemos aplicar o comando GROUP BY no final. O comando irá agregar a contagem para cada observação de ano diferente da coluna year.

Além do ano, vamos adicionar outra coluna para agregação. Que tal analisar a ocorrência de tornados por ano e mês?

Ordenação de registros

A partir de poucos comandos, transformamos os dados em algo que possa fazer sentido,. Podemos adicionar um comando que pode facilitar a forma que os registros estão disposto: ORDER BY.

Os dados da coluna mês estão em forma ascendente, podemos alterar para descendente adicionando o comando DESC.

Funções de agregação

Além da função COUNT(*), existem outras funções que permitem calcular os grupos de registros.

Começamos com a função COUNT(), porém, escolhendo apenas uma coluna. Esse método permite que seja calculado todos os registros não nulos do atributo.

Vamos para outra função, vamos calcular a média da temperatura para cada mês utilizando a função AVG() para anos após 2000.

Outra função para auxiliar no processo de agregação de registros é a SUM(), que permite somar os valores numéricos.

É possível usar qualquer número de funções em uma query:

____________________________________________________

Quer aprender mais?

Veja nosso curso de SQL para Economia e Finanças, onde ensinamos todo o processo para aqueles que desejam entrar na área. O curso faz parte da trilha Ciência de Dados para Economia e Finanças.

_________________________________________

Referências

Nield, Thomas. Getting Started with SQL: A Hands-On Approach for Beginners. O'Reilly Media, Inc., 2016.

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Sumarizando divulgações trimestrais de empresas usando IA no Python

Neste exercício, iremos utilizar a inteligência artificial no Python para analisar e sumarizar divulgações trimestrais de empresas. Focaremos no uso de ferramentas como Gemini e técnicas de processamento de linguagem natural para extrair informações de documentos PDF relacionados aos relatórios financeiros das empresas.

Prevendo efeitos de mudanças de preços em produtos usando TimeGPT

O exercício explora como prever os efeitos de mudanças nos preços de produtos utilizando o TimeGPT, uma ferramenta de previsão de séries temporais no Python. Usando elasticidade-preço, é possível medir a resposta da demanda a variações de preço. O exemplo prático utiliza dados de vendas de abacates nos EUA.

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.