Replicando o experimento STAR para o Piauí

Uma agenda de pesquisa muito importante é a alocação de gastos com educação. Uma das perguntas clássicas nesta área é qual é o impacto de gastar dinheiro para financiar salas de aula menores no desempenho e nos resultados dos alunos? Por muito tempo, não havia consenso sobre essa questão. Isso porque são muitos fatores que influenciam no sucesso de aprendizagem dos alunos, além do tamanho da sala. Infraestrutura da escola, experiência dos professores, qualidade dos colegas, acompanhamento familiar, entre outros. O problema é que praticamente todos esses fatores apresentam interdependência. Nesta postagem apresentamos os resultados do experimento STAR para o Piauí, uma análise simulada proveniente do nosso curso de Avaliação de Política Públicas usando o Python.

Experimento STAR

Em um experimento americano chamado STAR, iniciado em 1985 e com duração de quatro anos, os jovens alunos que iniciaram o jardim de infância e seus professores foram aleatoriamente alocados em três grupos possíveis:

  • Grupo 1 - turmas com 22-25 alunos
  • Grupo 2 - turmas com 13-17 alunos
  • Grupo 3 - turmas com 22-25 alunos, mas com um auxiliar de ensino em tempo integral.

O experimento custou 12 milhões de dólares e envolveu cerca de 6.000 alunos por ano, para um total de 11.600 alunos de 80 escolas. Cada escola era obrigada a ter pelo menos uma turma de cada tipo de tamanho acima, e a distribuição aleatória acontecia no nível da escola. No final de cada série escolar (jardim de infância e séries 1 a 3), os alunos receberam um teste padronizado. Os resultados, sumarizados por (Krueger 1999), indicaram que alunos de salas menores tiveram desempenho melhor e os alunos do grupo 3 não tiveram desempenho diferente dos alunos do grupo 1.

Replicando o experimento STAR para o Piauí

Agora suponha que o Governo do Piauí gostaria de implementar um estudo inspirado no STAR na microrregião do estado, chamada São Raimundo Nonato. Da mesma forma, aleatorizou a política a mesma política do STAR entre os 17 municípios da microrregião. Diferentemente do estudo original, o acompanhamento foi feito apenas com os alunos nascidos no mesmo ano e teve início na primeira série e foi até a quarta. No fim da quarta, os estudantes fizeram um teste padrão, com nota de 0 a 100. A avaliação se deu sobre esse teste.Quer saber como essa análise foi construída? Seja aluno do nosso curso Avaliação de Políticas Públicas usando Python, e tenha acesso às aulas teóricas e práticas, com o código disponibilizado em Python.Na base de dados estão as seguintes variáveis:

  • ID da criança
  • Variável binária de gênero, 1 se for menina e 0, se for menino
  • Variável binária de raça, 1 se for branco, 0 se não for
  • ID da escola
  • Experiência do professor
  • Nome do município
  • PIB do município
  • As variáveis de tratamento
  • A variável de nota na prova

Primeiramente, podemos realizar uma comparação visual da distribuição das notas entre os grupos. De modo semelhante ao estudo original, o grupo 2, que representa os alunos que ficaram nas menores salas, também teve média maior do que os outros dois grupos.

Para atestar o efeito da política, podemos rodar uma regressão dos diferentes tratamentos sobre a nota. Perceba que o tratamento é representa por variáveis binárias exclusivas, ou seja, o mesmo aluno só pode ter recebido uma das opções de sala. Veja que assim, nosso grupo de “controle”, que é o grupo 1, não recebe uma variável binária, por conta que isso acarretaria em multicolineariedade.

Assim, de forma semelhante a (Krueger 1999) estimamos quatro especificações de regressão diferentes. A primeira recebe apenas as duas variáveis binárias de tratamento. A segunda inclui efeitos fixos da escola. A terceira acrescenta algumas variáveis de controle. A última, não presente no estudo original, visa mostrar um possível efeito da interação entre o tratamento e a experiência do professor.

Os resultados encontrados se assemelham aos do estudo original. O efeito do tratamento no grupo 2 é igual a cerca de 17 pontos na prova. Já o tratamento 3 também apresenta efeito estatísticamente significante, mas de menor magnitude. A especificação com interação entre a o tratamento do grupo 2 e a experiência do professor mostrou-se positiva e significante. Ou seja, professores mais experientes melhoraram o desempenho de salas com menos alunos.

Este exemplo é importante para mostrar o poder dos estudos que envolvem RCT. Com um bom desenho de metodologia, é possível fazer inferência estatística causal sem utilizar métodos complexos ou hipóteses mais frágeis. Entretanto, o custo associado pode ser proibitivo.

Referências

Krueger, Alan B. 1999. «Experimental estimates of education production functions». The quarterly journal of economics 114 (2): 497–532.

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Como planejar um pipeline de previsão macroeconômica: da coleta ao dashboard

Montar um pipeline de previsão macroeconômica não é apenas uma tarefa técnica — é um exercício de integração entre dados, modelos e automação. Neste post, apresento uma visão geral de como estruturar esse processo de ponta a ponta, da coleta de dados até a construção de um dashboard interativo, que exibe previsões automatizadas de inflação, câmbio, PIB e taxa Selic.

Coletando e integrando dados do BCB, IBGE e IPEA de forma automatizada

Quem trabalha com modelagem e previsão macroeconômica sabe o quanto é demorado reunir dados de diferentes fontes — Banco Central, IBGE, IPEA, FRED, IFI... Cada um com sua API, formato, frequência e estrutura. Esse gargalo de coleta e padronização consome tempo que poderia estar sendo usado na análise, nos modelos ou na comunicação dos resultados.

Foi exatamente por isso que criamos uma rotina de coleta automatizada, que busca, trata e organiza séries temporais econômicas diretamente das APIs oficiais, pronta para ser integrada a pipelines de previsão, dashboards ou agentes de IA econometristas.

Criando operações SQL com IA Generativa no R com querychat

No universo da análise de dados, a velocidade para obter respostas é um diferencial competitivo. Frequentemente, uma simples pergunta de negócio — “Qual foi nosso produto mais vendido no último trimestre na região Nordeste?” — inicia um processo que envolve abrir o RStudio, escrever código dplyr ou SQL, executar e, finalmente, obter a resposta. E se pudéssemos simplesmente perguntar isso aos nossos dados em português, diretamente no nosso dashboard Shiny?

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

Boletim AM

Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.