SQL: Group by e Order by

A linguagem SQL permite melhorar o processo de manipulação de dados por meio da agregação de dados. O processo consiste em agregar os registros e aplicar um cálculo, normalmente através de funções.

Vamos utilizar um exemplo para entender melhor o método.

Utilizando a tabela station_data, é possível contar os registros, renomeando a coluna para um novo nome:

A função COUNT(*) permite aplicar um cálculo de contagem de registro das colunas da tabela. Podemos utilizar outros comandos, por exemplo, com WHERE, para obter os lugares onde ocorrerão tornado. (= 1 - verdadeiro).

E se quisermos saber o resultado da contagem de registro a cada ano em que ocorrerão tornados? Devemos aplicar o comando GROUP BY no final. O comando irá agregar a contagem para cada observação de ano diferente da coluna year.

Além do ano, vamos adicionar outra coluna para agregação. Que tal analisar a ocorrência de tornados por ano e mês?

Ordenação de registros

A partir de poucos comandos, transformamos os dados em algo que possa fazer sentido,. Podemos adicionar um comando que pode facilitar a forma que os registros estão disposto: ORDER BY.

Os dados da coluna mês estão em forma ascendente, podemos alterar para descendente adicionando o comando DESC.

Funções de agregação

Além da função COUNT(*), existem outras funções que permitem calcular os grupos de registros.

Começamos com a função COUNT(), porém, escolhendo apenas uma coluna. Esse método permite que seja calculado todos os registros não nulos do atributo.

Vamos para outra função, vamos calcular a média da temperatura para cada mês utilizando a função AVG() para anos após 2000.

Outra função para auxiliar no processo de agregação de registros é a SUM(), que permite somar os valores numéricos.

É possível usar qualquer número de funções em uma query:

____________________________________________________

Quer aprender mais?

Veja nosso curso de SQL para Economia e Finanças, onde ensinamos todo o processo para aqueles que desejam entrar na área. O curso faz parte da trilha Ciência de Dados para Economia e Finanças.

_________________________________________

Referências

Nield, Thomas. Getting Started with SQL: A Hands-On Approach for Beginners. O'Reilly Media, Inc., 2016.

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Resultado IPCA-15 - Novembro/2024

A Análise Macro apresenta os resultados do IPCA-15 de Novembro de 2024, com gráficos elaborados em Python para coleta, tratamento e visualização de dados. Todo o conteúdo, disponível exclusivamente no Clube AM, foi desenvolvido com base nos métodos ensinados nos cursos da Análise Macro, permitindo aos assinantes acesso aos códigos e replicação das análises.

Resultado PNADc Trimestral - 3° Trimestre/2024

A Análise Macro apresenta os resultados da PNADc Trimestral do 3º trimestre de 2024, com gráficos elaborados em Python para coleta, tratamento e visualização de dados. Todo o conteúdo, disponível exclusivamente no Clube AM, foi desenvolvido com base nos métodos ensinados nos cursos da Análise Macro, permitindo aos assinantes acesso aos códigos e replicação das análises.

Análise exploratória para modelagem preditiva no Python

Antes de desenvolver bons modelos preditivos é necessário organizar e conhecer muito bem os dados. Neste artigo, damos algumas dicas de recursos, como gráficos, análises e estatísticas, que podem ser usados para melhorar o entendimento sobre os dados usando Python.

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.