Replicando o experimento STAR para o Piauí

Uma agenda de pesquisa muito importante é a alocação de gastos com educação. Uma das perguntas clássicas nesta área é qual é o impacto de gastar dinheiro para financiar salas de aula menores no desempenho e nos resultados dos alunos? Por muito tempo, não havia consenso sobre essa questão. Isso porque são muitos fatores que influenciam no sucesso de aprendizagem dos alunos, além do tamanho da sala. Infraestrutura da escola, experiência dos professores, qualidade dos colegas, acompanhamento familiar, entre outros. O problema é que praticamente todos esses fatores apresentam interdependência. Nesta postagem apresentamos os resultados do experimento STAR para o Piauí, uma análise simulada proveniente do nosso curso de Avaliação de Política Públicas usando o Python.

Experimento STAR

Em um experimento americano chamado STAR, iniciado em 1985 e com duração de quatro anos, os jovens alunos que iniciaram o jardim de infância e seus professores foram aleatoriamente alocados em três grupos possíveis:

  • Grupo 1 - turmas com 22-25 alunos
  • Grupo 2 - turmas com 13-17 alunos
  • Grupo 3 - turmas com 22-25 alunos, mas com um auxiliar de ensino em tempo integral.

O experimento custou 12 milhões de dólares e envolveu cerca de 6.000 alunos por ano, para um total de 11.600 alunos de 80 escolas. Cada escola era obrigada a ter pelo menos uma turma de cada tipo de tamanho acima, e a distribuição aleatória acontecia no nível da escola. No final de cada série escolar (jardim de infância e séries 1 a 3), os alunos receberam um teste padronizado. Os resultados, sumarizados por (Krueger 1999), indicaram que alunos de salas menores tiveram desempenho melhor e os alunos do grupo 3 não tiveram desempenho diferente dos alunos do grupo 1.

Replicando o experimento STAR para o Piauí

Agora suponha que o Governo do Piauí gostaria de implementar um estudo inspirado no STAR na microrregião do estado, chamada São Raimundo Nonato. Da mesma forma, aleatorizou a política a mesma política do STAR entre os 17 municípios da microrregião. Diferentemente do estudo original, o acompanhamento foi feito apenas com os alunos nascidos no mesmo ano e teve início na primeira série e foi até a quarta. No fim da quarta, os estudantes fizeram um teste padrão, com nota de 0 a 100. A avaliação se deu sobre esse teste.Quer saber como essa análise foi construída? Seja aluno do nosso curso Avaliação de Políticas Públicas usando Python, e tenha acesso às aulas teóricas e práticas, com o código disponibilizado em Python.Na base de dados estão as seguintes variáveis:

  • ID da criança
  • Variável binária de gênero, 1 se for menina e 0, se for menino
  • Variável binária de raça, 1 se for branco, 0 se não for
  • ID da escola
  • Experiência do professor
  • Nome do município
  • PIB do município
  • As variáveis de tratamento
  • A variável de nota na prova

Primeiramente, podemos realizar uma comparação visual da distribuição das notas entre os grupos. De modo semelhante ao estudo original, o grupo 2, que representa os alunos que ficaram nas menores salas, também teve média maior do que os outros dois grupos.

Para atestar o efeito da política, podemos rodar uma regressão dos diferentes tratamentos sobre a nota. Perceba que o tratamento é representa por variáveis binárias exclusivas, ou seja, o mesmo aluno só pode ter recebido uma das opções de sala. Veja que assim, nosso grupo de “controle”, que é o grupo 1, não recebe uma variável binária, por conta que isso acarretaria em multicolineariedade.

Assim, de forma semelhante a (Krueger 1999) estimamos quatro especificações de regressão diferentes. A primeira recebe apenas as duas variáveis binárias de tratamento. A segunda inclui efeitos fixos da escola. A terceira acrescenta algumas variáveis de controle. A última, não presente no estudo original, visa mostrar um possível efeito da interação entre o tratamento e a experiência do professor.

Os resultados encontrados se assemelham aos do estudo original. O efeito do tratamento no grupo 2 é igual a cerca de 17 pontos na prova. Já o tratamento 3 também apresenta efeito estatísticamente significante, mas de menor magnitude. A especificação com interação entre a o tratamento do grupo 2 e a experiência do professor mostrou-se positiva e significante. Ou seja, professores mais experientes melhoraram o desempenho de salas com menos alunos.

Este exemplo é importante para mostrar o poder dos estudos que envolvem RCT. Com um bom desenho de metodologia, é possível fazer inferência estatística causal sem utilizar métodos complexos ou hipóteses mais frágeis. Entretanto, o custo associado pode ser proibitivo.

Referências

Krueger, Alan B. 1999. «Experimental estimates of education production functions». The quarterly journal of economics 114 (2): 497–532.

Compartilhe esse artigo

Facebook
Twitter
LinkedIn
WhatsApp
Telegram
Email
Print

Comente o que achou desse artigo

Outros artigos relacionados

Criando um Dashboard de análise de Ações no Python

Um Dashboard é um painel de controle que consolida uma variedade de informações sobre um determinado objeto de estudo em um ou mais painéis. Ele simplifica significativamente o processo de análise de dados, oferecendo uma visão global e fácil de entender. Uma maneira simples de construir um Dashboard para acompanhar uma ação específica é utilizando duas ferramentas: Quarto e Python. Neste post, mostramos o resultado da criação de um Dashboard de Ação.

Analisando séries temporais no Python e esquecendo de vez o Excel

Séries temporais representam uma disciplina extremamente importante em diversas áreas, principalmente na economia e na ciência de dados. Mas, afinal, como lidar com esses dados que se apresentam ao longo do tempo? Neste exercício, demonstraremos como compreender uma série temporal e como o Python se destaca como uma das melhores ferramentas para analisar esse tipo de dado.

Cálculo do Retorno Econômico de uma Política Pública

Como podemos traduzir os efeitos de uma política pública para valores monetários? Essa é uma tarefa árdua que requer algumas premissas, entretanto, com métodos bem definidos, é possível obter estimativas precisas dos ganhos e os gastos de uma política pública.

Neste exercício, demonstramos tal método usando a política hipotética "Mãe Paranense”, um conjunto de ações que visam reduzir a mortalidade materna e infantil no estado. Usamos a linguagem R como ferramenta para analisar os dados.

como podemos ajudar?

Preencha os seus dados abaixo e fale conosco no WhatsApp

Boletim AM

Preencha o formulário abaixo para receber nossos boletins semanais diretamente em seu e-mail.