Como estimar o índice de Gini no R

O índice de Gini é uma medida de distribuição de renda muito interessante e conhecida, que tenta expressar em um valor único a desigualdade apresentada na curva de Lorenz. Neste exercício mostramos como podemos estimar essa medida facilmente no R.

O índice de Gini consiste em um número entre 0 e 1, onde 0 corresponde à completa igualdade e 1 corresponde à completa desigualdade e pode ser calculado com a fórmula de Brown abaixo:

Onde:

G = coeficiente de Gini
X = proporção acumulada da variável "população"
Y = proporção acumulada da variável "renda"

Para esse exercício usaremos os microdados da PNAD Contínua trimestral do IBGE, que possui a variável Rendimento mensal efetivo de todos os trabalhos (VD4020). E para tornar o exercício interessante faremos a estimação do índice de Gini por estado (UF) brasileiro.

Pacotes

Para a finalidade do exercício utilizaremos os seguintes pacotes do R, todos disponibilizados no CRAN:


# Instalar/carregar pacotes
if(!require("pacman")) install.packages("pacman")
pacman::p_load(
"PNADcIBGE",
"survey",
"convey",
"tidyverse"
)

Dados

O último trimestre da pesquisa disponível na data deste exercício é referente ao 1º trimestre de 2021. Apontamos esse período na função get_pnadc(), especificamos as variáveis desejadas para coleta e convertemos o objeto resultante para a classe convey para poder fazer a estimação:


pnadc_0121 <- PNADcIBGE::get_pnadc(year = 2021, quarter = 1, vars = c("UF", "VD4020")) %>%
convey::convey_prep()

Estimar índice de Gini

Para estimar o índice de Gini o pacote convey oferece a função svygini, bastando especificar a variável de renda desejada. Como queremos a estimação por estado, usaremos também a função svyby do pacote survey, que serve justamente para calcularmos estatísticas por grupos dos nossos dados, nesse caso a UF.


gini_uf <- survey::svyby(
~VD4020,
by = ~UF,
design = pnadc_0121,
FUN = convey::svygini,
na.rm = TRUE
)

Visualizar os resultados

Por fim, vamos fazer um gráfico simples para visualizar o resultado da estimação, usando o ggplot2:


gini_uf %>%
dplyr::as_tibble() %>%
dplyr::mutate(UF = forcats::fct_reorder(UF, VD4020)) %>%
ggplot2::ggplot(ggplot2::aes(x = VD4020, y = UF)) +
ggplot2::geom_col(fill = "darkblue") +
ggplot2::theme_classic() +
ggplot2::labs(
title = "Índice de Gini por Estado",
subtitle = "Dados do 1º trimestre de 2021",
x = NULL,
y = NULL,
caption = "Fonte: Microdados PNADC-T/IBGE"
)

O que você achou do resultado? Surpreendente? Deixe suas impressões!

Quer aprender mais sobre utilização de microdados? Inscreva-se no curso de R e Python para Economistas.

 

________________________

(*) Para entender mais sobre micro dados e desigualdade, confira nosso Cursos de Micro Aplicada.

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Análise exploratória para modelagem preditiva no Python

Antes de desenvolver bons modelos preditivos é necessário organizar e conhecer muito bem os dados. Neste artigo, damos algumas dicas de recursos, como gráficos, análises e estatísticas, que podem ser usados para melhorar o entendimento sobre os dados usando Python.

Como usar modelos do Sklearn para previsão? Uma introdução ao Skforecast

Prever séries temporais é uma tarefa frequente em diversas áreas, porém exige conhecimento e ferramentas específicas. Os modelos de machine learning do Sklearn são populadores, porém são difíceis de aplicar em estruturas temporais de dados. Neste sentido, introduzimos a biblioteca Skforecast, que integra os modelos do Sklearn e a previsão de séries temporais de forma simples.

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.