A linguagem SQL permite melhorar o processo de manipulação de dados por meio da agregação de dados. O processo consiste em agregar os registros e aplicar um cálculo, normalmente através de funções.
Vamos utilizar um exemplo para entender melhor o método.
Utilizando a tabela station_data, é possível contar os registros, renomeando a coluna para um novo nome:
A função COUNT(*) permite aplicar um cálculo de contagem de registro das colunas da tabela. Podemos utilizar outros comandos, por exemplo, com WHERE, para obter os lugares onde ocorrerão tornado. (= 1 - verdadeiro).
E se quisermos saber o resultado da contagem de registro a cada ano em que ocorrerão tornados? Devemos aplicar o comando GROUP BY no final. O comando irá agregar a contagem para cada observação de ano diferente da coluna year.
Além do ano, vamos adicionar outra coluna para agregação. Que tal analisar a ocorrência de tornados por ano e mês?
Ordenação de registros
A partir de poucos comandos, transformamos os dados em algo que possa fazer sentido,. Podemos adicionar um comando que pode facilitar a forma que os registros estão disposto: ORDER BY.
Os dados da coluna mês estão em forma ascendente, podemos alterar para descendente adicionando o comando DESC.
Funções de agregação
Além da função COUNT(*), existem outras funções que permitem calcular os grupos de registros.
Começamos com a função COUNT(), porém, escolhendo apenas uma coluna. Esse método permite que seja calculado todos os registros não nulos do atributo.
Vamos para outra função, vamos calcular a média da temperatura para cada mês utilizando a função AVG() para anos após 2000.
Outra função para auxiliar no processo de agregação de registros é a SUM(), que permite somar os valores numéricos.
É possível usar qualquer número de funções em uma query:
____________________________________________________
Quer aprender mais?
Veja nosso curso de SQL para Economia e Finanças, onde ensinamos todo o processo para aqueles que desejam entrar na área. O curso faz parte da trilha Ciência de Dados para Economia e Finanças.
_________________________________________
Referências
Nield, Thomas. Getting Started with SQL: A Hands-On Approach for Beginners. O'Reilly Media, Inc., 2016.