SQL: Group by e Order by

A linguagem SQL permite melhorar o processo de manipulação de dados por meio da agregação de dados. O processo consiste em agregar os registros e aplicar um cálculo, normalmente através de funções.

Vamos utilizar um exemplo para entender melhor o método.

Utilizando a tabela station_data, é possível contar os registros, renomeando a coluna para um novo nome:

A função COUNT(*) permite aplicar um cálculo de contagem de registro das colunas da tabela. Podemos utilizar outros comandos, por exemplo, com WHERE, para obter os lugares onde ocorrerão tornado. (= 1 - verdadeiro).

E se quisermos saber o resultado da contagem de registro a cada ano em que ocorrerão tornados? Devemos aplicar o comando GROUP BY no final. O comando irá agregar a contagem para cada observação de ano diferente da coluna year.

Além do ano, vamos adicionar outra coluna para agregação. Que tal analisar a ocorrência de tornados por ano e mês?

Ordenação de registros

A partir de poucos comandos, transformamos os dados em algo que possa fazer sentido,. Podemos adicionar um comando que pode facilitar a forma que os registros estão disposto: ORDER BY.

Os dados da coluna mês estão em forma ascendente, podemos alterar para descendente adicionando o comando DESC.

Funções de agregação

Além da função COUNT(*), existem outras funções que permitem calcular os grupos de registros.

Começamos com a função COUNT(), porém, escolhendo apenas uma coluna. Esse método permite que seja calculado todos os registros não nulos do atributo.

Vamos para outra função, vamos calcular a média da temperatura para cada mês utilizando a função AVG() para anos após 2000.

Outra função para auxiliar no processo de agregação de registros é a SUM(), que permite somar os valores numéricos.

É possível usar qualquer número de funções em uma query:

____________________________________________________

Quer aprender mais?

Veja nosso curso de SQL para Economia e Finanças, onde ensinamos todo o processo para aqueles que desejam entrar na área. O curso faz parte da trilha Ciência de Dados para Economia e Finanças.

_________________________________________

Referências

Nield, Thomas. Getting Started with SQL: A Hands-On Approach for Beginners. O'Reilly Media, Inc., 2016.

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

A Abordagem do Estudo de Eventos usando Python

A maioria das pesquisas em finanças está dedicada a investigar o efeito de um anúncio da companhia ou de um evento, sistêmico ou não, sobre o preço de uma ação. Esses estudos são conhecidos como “estudos de eventos”. Neste contexto, apresentaremos uma breve introdução à metodologia e demonstraremos como aplicá-la por meio de exemplos reais utilizando a linguagem de programação Python.

Como coletar dados do Eurostat usando a API com o Python?

Neste artigo mostramos como pesquisar e como coletar os dados do portal Eurostat através do sistema de API usando a linguagem Python. Este processo permite automatizar rotinas de extração de dados, eliminando trabalho manual e repetitivo de atualização de bases de dados econômicos.

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.