SQL: Group by e Order by

A linguagem SQL permite melhorar o processo de manipulação de dados por meio da agregação de dados. O processo consiste em agregar os registros e aplicar um cálculo, normalmente através de funções.

Vamos utilizar um exemplo para entender melhor o método.

Utilizando a tabela station_data, é possível contar os registros, renomeando a coluna para um novo nome:

A função COUNT(*) permite aplicar um cálculo de contagem de registro das colunas da tabela. Podemos utilizar outros comandos, por exemplo, com WHERE, para obter os lugares onde ocorrerão tornado. (= 1 - verdadeiro).

E se quisermos saber o resultado da contagem de registro a cada ano em que ocorrerão tornados? Devemos aplicar o comando GROUP BY no final. O comando irá agregar a contagem para cada observação de ano diferente da coluna year.

Além do ano, vamos adicionar outra coluna para agregação. Que tal analisar a ocorrência de tornados por ano e mês?

Ordenação de registros

A partir de poucos comandos, transformamos os dados em algo que possa fazer sentido,. Podemos adicionar um comando que pode facilitar a forma que os registros estão disposto: ORDER BY.

Os dados da coluna mês estão em forma ascendente, podemos alterar para descendente adicionando o comando DESC.

Funções de agregação

Além da função COUNT(*), existem outras funções que permitem calcular os grupos de registros.

Começamos com a função COUNT(), porém, escolhendo apenas uma coluna. Esse método permite que seja calculado todos os registros não nulos do atributo.

Vamos para outra função, vamos calcular a média da temperatura para cada mês utilizando a função AVG() para anos após 2000.

Outra função para auxiliar no processo de agregação de registros é a SUM(), que permite somar os valores numéricos.

É possível usar qualquer número de funções em uma query:

____________________________________________________

Quer aprender mais?

Veja nosso curso de SQL para Economia e Finanças, onde ensinamos todo o processo para aqueles que desejam entrar na área. O curso faz parte da trilha Ciência de Dados para Economia e Finanças.

_________________________________________

Referências

Nield, Thomas. Getting Started with SQL: A Hands-On Approach for Beginners. O'Reilly Media, Inc., 2016.

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Automatizando a Construção de Códigos em Python com LangGraph

Neste post, mostramos como construir um agente de código em Python utilizando LangGraph, LangChain e Gemini. A proposta é construir um protótipo para automatizar o ciclo completo de geração, execução e correção de código com o uso de LLMs, organizando o processo em um grafo de estados.

Análise de Dados com REPL Tool e LLM usando LangGraph

Neste post, vamos mostrar como você pode criar um agente que interpreta e executa código Python em tempo real, utilizando o REPL-Tool e um LLM da família Gemini. Começamos com um exemplo genérico e, em seguida, aplicamos a mesma estrutura à análise econômica de uma série histórica do IPCA.

Frameworks para criar AI Agents

Neste post, vamos dar o primeiro passo rumo à construção de Agentes de IA mais sofisticados, capazes de tomar decisões, interagir com ferramentas externas e lidar com tarefas complexas. Para isso, precisamos entender o papel dos frameworks agenticos (ou agentic frameworks) e como eles podem facilitar esse processo. Aqui introduzimos dois frameworks populares de desenvolvimento de Agentes de IA.

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.