Em post anterior das Dicas de R, vimos o modelo de regressão simples, onde pode ser explicado por uma única variável . O problema básico desse tipo de análise é que ela faz uma suposição bastante forte, qual seja, que não está correlacionado com o erro, dificultando a aplicação da condição ceteris paribus. A análise de regressão múltipla, por outro lado, é mais receptiva a esse tipo de condição, uma vez que ela permite que controlemos outros fatores que afetam , adicionando os mesmos na equação. Assim, por suposto, se queremos explicar , podemos utilizar variáveis, como abaixo:
(1)
onde é o intercepto, é o parâmetro associado a . De modo a obter uma estimativa para 1, devemos observar que
(2)
Isto é, que todos os fatores no termo de erro não observado sejam não correlacionados com as variáveis explicativas. De modo a obter estimativas para os parâmetros, é possível recorrer ao método de mínimos quadrados ordinários. Isto é, dado
(3)
onde é a estimativa de , o método de MQO escolhe as estimativas que minimizam a soma dos quadrados dos resíduos:
(4)
O problema acima pode ser resolvido por meio de cálculo multivariado, de onde obtemos as condições de primeira ordem
(5)
ou simplesmente, e .
# Interpretação da equação de regressão de MQO
Suponha que tenhamos
(6)
O intercepto será então o valor previsto de quando . Já as estimativas e devem ser interpretadas como efeito parcial ou simplesmente ceteris paribus. Isto é,
(7)
de modo que obtemos a variação prevista em dadas as variações em e . Em particular, quando é mantido fixo, de modo que , teremos
(8)
Ou, simplesmente,
(9)
onde irá medir o efeito da variação de em , mantido constante.
# Exemplo: equação do salário-hora
De modo a ilustrar, vamos considerar o exemplo 3.2 de Wooldridge (2003), em que o mesmo utiliza o conjunto de dados wage1, disponível no pacote wooldridge. Ele pode ser acessado como abaixo.
library(wooldridge) data(wage1) modelo = lm(log(wage) ~ educ+exper+tenure, data=wage1)
E abaixo, o nosso modelo.
Dependent variable: | |
log(wage) | |
educ | 0.092*** |
(0.007) | |
exper | 0.004** |
(0.002) | |
tenure | 0.022*** |
(0.003) | |
Constant | 0.284*** |
(0.104) | |
Observations | 526 |
R2 | 0.316 |
Adjusted R2 | 0.312 |
Residual Std. Error | 0.441 (df = 522) |
F Statistic | 80.391*** (df = 3; 522) |
Note: | *p<0.1; **p<0.05; ***p<0.01 |
De modo a obter a seguinte reta de regressão para o log do salário-hora
(10)
De onde se conclui, por exemplo, que o aumento de um ano na educação formal equivale a um aumento de 9.2% no salário-hora, mantidos exper e tenure fixos.
Quer aprender mais sobre econometria? Conheça nosso Curso de Introdução à Econometria usando o R.
_______________________
Wooldridge, J. M. 2013. Introductory Econometrics: A Modern Approach. Editora Cengage.