Uma agenda de pesquisa muito importante é a alocação de gastos com educação. Uma das perguntas clássicas nesta área é qual é o impacto de gastar dinheiro para financiar salas de aula menores no desempenho e nos resultados dos alunos? Por muito tempo, não havia consenso sobre essa questão. Isso porque são muitos fatores que influenciam no sucesso de aprendizagem dos alunos, além do tamanho da sala. Infraestrutura da escola, experiência dos professores, qualidade dos colegas, acompanhamento familiar, entre outros. O problema é que praticamente todos esses fatores apresentam interdependência. Nesta postagem apresentamos os resultados do experimento STAR para o Piauí, uma análise simulada proveniente do nosso curso de Avaliação de Política Públicas usando o Python.
Experimento STAR
Em um experimento americano chamado STAR, iniciado em 1985 e com duração de quatro anos, os jovens alunos que iniciaram o jardim de infância e seus professores foram aleatoriamente alocados em três grupos possíveis:
Grupo 1 - turmas com 22-25 alunos
Grupo 2 - turmas com 13-17 alunos
Grupo 3 - turmas com 22-25 alunos, mas com um auxiliar de ensino em tempo integral.
O experimento custou 12 milhões de dólares e envolveu cerca de 6.000 alunos por ano, para um total de 11.600 alunos de 80 escolas. Cada escola era obrigada a ter pelo menos uma turma de cada tipo de tamanho acima, e a distribuição aleatória acontecia no nível da escola. No final de cada série escolar (jardim de infância e séries 1 a 3), os alunos receberam um teste padronizado. Os resultados, sumarizados por (Krueger 1999), indicaram que alunos de salas menores tiveram desempenho melhor e os alunos do grupo 3 não tiveram desempenho diferente dos alunos do grupo 1.
Replicando o experimento STAR para o Piauí
Agora suponha que o Governo do Piauí gostaria de implementar um estudo inspirado no STAR na microrregião do estado, chamada São Raimundo Nonato. Da mesma forma, aleatorizou a política a mesma política do STAR entre os 17 municípios da microrregião. Diferentemente do estudo original, o acompanhamento foi feito apenas com os alunos nascidos no mesmo ano e teve início na primeira série e foi até a quarta. No fim da quarta, os estudantes fizeram um teste padrão, com nota de 0 a 100. A avaliação se deu sobre esse teste.Quer saber como essa análise foi construída? Seja aluno do nosso curso Avaliação de Políticas Públicas usando Python, e tenha acesso às aulas teóricas e práticas, com o código disponibilizado em Python.Na base de dados estão as seguintes variáveis:
ID da criança
Variável binária de gênero, 1 se for menina e 0, se for menino
Variável binária de raça, 1 se for branco, 0 se não for
ID da escola
Experiência do professor
Nome do município
PIB do município
As variáveis de tratamento
A variável de nota na prova
Primeiramente, podemos realizar uma comparação visual da distribuição das notas entre os grupos. De modo semelhante ao estudo original, o grupo 2, que representa os alunos que ficaram nas menores salas, também teve média maior do que os outros dois grupos.
Para atestar o efeito da política, podemos rodar uma regressão dos diferentes tratamentos sobre a nota. Perceba que o tratamento é representa por variáveis binárias exclusivas, ou seja, o mesmo aluno só pode ter recebido uma das opções de sala. Veja que assim, nosso grupo de “controle”, que é o grupo 1, não recebe uma variável binária, por conta que isso acarretaria em multicolineariedade.
Assim, de forma semelhante a (Krueger 1999) estimamos quatro especificações de regressão diferentes. A primeira recebe apenas as duas variáveis binárias de tratamento. A segunda inclui efeitos fixos da escola. A terceira acrescenta algumas variáveis de controle. A última, não presente no estudo original, visa mostrar um possível efeito da interação entre o tratamento e a experiência do professor.
Os resultados encontrados se assemelham aos do estudo original. O efeito do tratamento no grupo 2 é igual a cerca de 17 pontos na prova. Já o tratamento 3 também apresenta efeito estatísticamente significante, mas de menor magnitude. A especificação com interação entre a o tratamento do grupo 2 e a experiência do professor mostrou-se positiva e significante. Ou seja, professores mais experientes melhoraram o desempenho de salas com menos alunos.
Este exemplo é importante para mostrar o poder dos estudos que envolvem RCT. Com um bom desenho de metodologia, é possível fazer inferência estatística causal sem utilizar métodos complexos ou hipóteses mais frágeis. Entretanto, o custo associado pode ser proibitivo.
Referências
Krueger, Alan B. 1999. «Experimental estimates of education production functions». The quarterly journal of economics 114 (2): 497–532.
Neste exercício, contruímos um algoritmo simples de cenarização para a Dívida Bruta do Governo Geral (DBGG) em % do PIB, usando apenas dados públicos, simulações estatísticas, a literatura recente e a linguagem R. Em uma abordagem semi-automatizada, as simulações do modelo se aproximam das previsões do mercado para o ano de 2025.
Neste exercício, contruímos um modelo simples de previsão para o Resultado Primário do Setor Público Consolidado (acumulado em 12 meses, % PIB), usando apenas dados públicos, modelos econométricos, a literatura recente e a linguagem R. Em uma abordagem automatizada, as previsões do modelo se aproximam das previsões do mercado para o ano de 2025.
Este exercício estima o Hiato do Produto do Brasil utilizando quatro métodos univariados distintos. Para lidar com o problema de fim de amostra causado por filtros univariados, incorporamos previsões do PIB provenientes de agentes econômicos e projeções simples, estendendo a série temporal além da amostra original. Todo o processo de coleta, tratamento, estimação e visualização dos hiatos foi realizado na linguagem de programação R.
Boletim AM
Receba diretamente em seu e-mail gratuitamente nossas promoções especiais e conteúdos exclusivos sobre Análise de Dados!