Universidade Federal Rural do Rio de Janeiro CPGA-CS Instituto de Agronomia Validação da Predição do Modelo Linear 0011 0010 1010 1101 0001 0100 1011 1 2 4 Carlos Alberto Alves Varella, [email protected] INTRODUÇÃO 0011 0010 1010 1101 0001 0100 1011 • A validação da predição constitui-se em ajustar um modelo linear de 1º grau dos valores preditos em função dos valores observados. • A significância da regressão é avaliada aplicando-se o teste F para as estimativas dos parâmetros, conforme metodologia descrita por GRAYBILL (1976). 1 2 4 Vetor dos Valores Preditos 0011 0010 1010 1101 0001 0100 1011 • São valores resultantes da predição feita pelo modelo ajustado, será denominadoY-chapéu. Definido por: yˆ1 yˆ 2 ˆ Y yˆ n 1 2 4 Vetor dos Valores Observados 0011 0010 1010 1101 0001 0100 1011 • São valores conhecidos da variável dependente, mas que não participaram do ajuste do modelo. Definido por: y1 y 2 Y yn 1 2 4 Ajuste do Modelo de 1º Grau 0011 0010 1010 1101 0001 0100 1011 • Consiste em se ajustar um modelo linear de 1º grau para Y-chapéu em função de Y. Considere que: ˆ Y Y 1 2 4 • Precisamos determinar Beta-chapéu o estimador de Beta. Determinação de Beta-chapéu 0011 0010 1010 1101 0001 0100 1011 • O Beta-chapéu será determinado pelo método dos mínimos quadrados, sendo assim: 1 ˆ ˆ Y' Y Y' Y 1 2 4 Esperança de Beta-chapéu 0011 0010 1010 1101 0001 0100 1011 • A esperança é que o vetor Beta-chapéu seja: 0 ˆ H0 : 0 0 e 1 1 1 1 2 4 • Se tal fato se confirmar significa que o modelo pode ser utilizado para fazer predições. Estatística F utilizada no teste 0011 0010 1010 1101 0001 0100 1011 F(H 0 ) 1 1 ˆ (C' )' [C' (X' X) C] (C' ˆ ) mˆ 2 • m= número de linhas da matriz C’; 1 2 4 2 ˆ 0 0 QMR 1 1 Determinação da matriz C’ 0011 0010 1010 1101 0001 0100 1011 • A matriz C’ é uma matriz com m linhas e p+1 colunas, de tal forma que: 1 2 1 0 0 0 H 0 : C' H 0 : 0 0 e 1 1 0 1 1 1 1 0 C' 0 1 4 Cálculo do F(H0) • Aceita-se a hipótese de nulidade quando F(H0) é menor que Fα%(m;n-p-1). Diz-se que o teste foi não significativo. 0011 0010 1010 1101 0001 0100 1011 • • • • α= grau de significância da análise; m= 2; n= número de observações; p= 1. 1 2 4 Exemplo Yi 2 3X1i 1X2i : é a equação de regressão 0011 0010 1010 1101 0001 0100 1011 Y X1 X2 Y-chapéu 1,5 6,5 10,0 11,0 11,5 16,5 0 1 1 2 2 3 0 2 4 2 4 6 2 7 9 10 12 17 1 2 4 Ajuste do Modelo de 1º Grau 0011 0010 1010 1101 0001 0100 1011 1 1 1 Y 1 1 1 1.5 6.5 10 11 11.5 16.5 2.0 7.0 9.0 ˆ Y 10.0 12.0 17.0 1 2 4 Determinação de Beta-chapéu 0011 0010 1010 1101 0001 0100 1011 1 ˆ ˆ Y' Y Y' Y 1 1 1 1 1 1 1 1 1 Y' Y 1.5 6.5 10 11 11.5 16.5 1 1 1 1.5 6.5 10 6 57 11 57 670 11.5 16.5 1 2 4 Determinação de Beta-chapéu 0011 0010 1010 1101 0001 0100 1011 1 ˆ ˆ Y' Y Y' Y 2.0 7.0 9.0 57 1 1 1 1 1 1 ˆ Y' Y 1.5 6.5 10 11 11.5 16.5 10.0 667 12.0 17.0 1 2 4 Determinação de Beta-chapéu 0011 0010 1010 1101 0001 0100 1011 1 ˆ ˆ Y' Y Y' Y 0.8690 - 0.0739 (Y' Y) - 0.0739 0.0078 1 1 2 4 Determinação de Beta-chapéu 0011 0010 1010 1101 0001 0100 1011 1 ˆ ˆ Y' Y Y' Y ˆ0 0.8690 - 0.0739 57 ˆ 1 - 0.0739 0.0078 667 1 ˆ0 0.2218 ˆ 1 0.9767 2 4 Cálculo do F(H0) 0011 0010 1010 1101 0001 0100 1011 1 0 0.2218 0.2218 ˆ C' 0 1 0 . 9767 0 . 9767 1 2 4 0.2218 0 0.2218 ˆ C' 0 . 9767 1 0.0233 Cálculo do F(H0) 1 1 ˆ Num (C' )' [C' (X' X) C] (C' ˆ ) 0011 0010 1010 1101 0001 0100 1011 0.8690 - 0.0739 C' (Y' Y) C - 0.0739 0.0078 1 C' (x' x) C 1 1 6 57 57 670 1 2 4 6 57 0.2218 Num 0.2218 - 0.0233 0.0698 57 670 - 0.0233 Cálculo do F(H0) ˆ 'Y ˆ ˆ ' Y' Y ˆ 2.9300 Y ˆ s QMR 0.7325 n p 1 6 1 1 0011 0010 1010 1101 0001 0100 1011 2 2 • QMR=quadrado médio do resíduo 1 0,0698 ns F (H0 ) 0,0478 2 0,7325 ˆ0 0.2218 ˆ ˆ 0.9767 1 2 4 F (5%, 2, 4) 6,9443 Exemplo de programa no SAS 0011 0010 1010 1101 0001 0100 1011 proc reg data=gps_ap.teste; /* x1 x2 y */ model y = x1 x2; output out=p p=yhat r=resid; print p; run; quit; proc reg; model yhat=y; test y=1, intercept=0; run; plot yhat*y; run; 1 2 4