Análise de Regressão Múltipla y = b0 + b1x1 + b2x2 + . . . bkxk + u Inferência Letícia e Idilio 1 Hipóteses do Modelo Linear Clássico (MLC) Dadas as hipóteses de Gass-Markov, o estimador de MQO é “BLUE”. Afim de aplicar os testes de hipóteses clássicos, uma nova hipótese é adicionada ao modelo (além das suposições de GaussMarkov): Assumir que u é independente de x1, x2,…, xk e u segue distribuição normal com média igual a 0 e variância s2. Ou seja, u ~ Normal(0,s2). 2 Hipóteses do MLC (cont.) Considerando as hipóteses do MLC, o estimador de MQO não somente é “BLUE”, como também o estimador não-viesado de menor variância. As hipóteses do MLC podem ser resumidas por: y|x ~ Normal(b0 + b1x1 +…+ bkxk, s2). Há casos em que a hipótese de “normalidade” não é verdadeira (neste momento, não serão considerados). 3 Exemplo de normal homoscedástica com uma variável independente. y f(y|x) . . E(y|x) = b + b x 0 1 Normais x1 x2 4 Distribuições amostrais Normais Considerando as hipótesesdo MLC, condicional aos valores amostraisdas variáveisindependentes, bˆ ~ Normalb , Var bˆ j P ortanto: bˆ b j j j j ~ Normal0,1 ˆ dp b j ondebˆ j é normalmente distribuído por ser uma combinação linear dos erros. 5 Testes de Hipóteses sobre um único parâmetro: Teste t Lembrando, modelo populacional pode ser escrito como: y =b0 + b1x1 +…+ bkxk + u A idéia é construir hipóteses sobre o valor de bj Utilizar inferência estatística para testar nossa hipótese. 6 O Teste t Considerando as hipótesesdo MLC, bˆ j b j ~ t n k 1 ˆ ep b j Notarque isto é uma distribuição t (e não uma Normal), porque s 2 foi estimadoporsˆ 2 . Notar tamb ém o grau de liberdade : n k 1 7 O Teste t (cont.) Saber essa distribuição amostral do estimador padrão permite que sejam feitos testes de hipóteses que envolvem bj. Começar pela hipótese nula, que é a mais utilizada. H0: bj=0. Dizer que bj=0 significa que xj não tem efeito em y, controlando os demais x’s. 8 O Teste t (cont.) Ex: log(salarioh)= b0 + b1 educ + b2 exper + b3 perm + u A hipótese nula H0: b2 =0 significa que, se a educação formal e a permanência foram consideradas, o número de anos no mercado de trabalho (exper) não tem nenhum efeito sobre o salário. 9 Teste t: Hipóteses alternativas Além da hipótese nula H0, é necessária uma hipótese alternativa H1 e um nível de significância. H1 pode ser unilateral ou bilateral. H1: bj > 0 e H1: bj < 0 são unilaterais. H1: bj 0 é a alternativa bilateral. 10 Escolha do nível de significância Nível de significância: probabilidade de rejeitar erroneamente Ho quando ela é verdadeira. Se o desejável é ter somente 5% de probabilidade de rejeitar H0 quando ela for verdadeira, então é dito que o nível de significância é de 5%. 11 A estatística t Para determinar se uma hipótese nula H0 deve ser rejeitada usaremos regras de rejeição junto com a estatística t. A estatística t de bˆ j é definida como: t bˆ j bˆ j ep bˆ j 12 Alternativas unilaterais Por exemplo, escolhendo um nível de significância 5%, procura-se pelo 95º percentil em uma distribuição t com n – k – 1 graus de liberdade. Este valor é chamado de c (valor crítico). Se t > c => a hipótese nula será rejeitada. Se t < c => não é possível rejeitar a hipótese nula. 13 Alternativas unilaterais (cont.) yi = b0 + b1xi1 + … + bkxik + ui H0: bj = 0 H1: bj > 0 Não-rejeitada Rejeitada 1 a 0 a c 14 Exemplo: Retomando o exemplo do salário: log(salarioh)= b0 + b1 educ + b2 exper + b3 perm + u log(salarioh)=0,284 +0,092 educ +0,0041exper +0,022 perm n=526 (0,104) (0,007) (0,0017) (0,003) Ho: b2=0 H1: b2>0 gl: 526-4=522 nível de significância: 1% => c=2,326 t = 0,0041/ 0,0017 =2,41 > 2,326 Logo, exper é estatisticamente significante ao nível de 1%, rejeitamos então H0. 15 Unilateral X bilateral Sendo a distribuição t simétrica, testar H1: bj < 0 é trivial. O valor crítico é o negativo do valor anterior. Rejeita-se a hipótese nula se o valor da estatística t < –c. Para o caso bilateral, o valor crítico será a/2 e rejeita-se H0: bj = 0 (em favor de H1: bj ≠ 0) se |t| > c. 16 Alternativa Bilateral yi = b0 + b1Xi1 + … + bkXik + ui H0: bj = 0 H1: bj ≠ 0 Não-rejeitada Rejeitada Rejeitada 1 a a/2 -c 0 a/2 c 17 Testando outras hipóteses Uma forma mais geral da estatística t pode ser escrita para verificar hipóteses do tipo H0: bj = aj Neste caso, a seguinte estatística t deve ser usada: Exemplo 4.5... bˆ t= j aj ep bˆ j onde : a j = 0 para o testepadrão 18 Calculando os “p-valores” para testes t Uma alternativa à abordagem clássica é perguntar: “qual o menor nível de significância no qual a hipótese nula pode ser rejeitada?” Para isto, calcule o valor da estatística t e procure em qual percentil ele se encontra em uma tabela com a distribuição t apropriada. Este será o “pvalor”. O “p-valor” é a probabilidade de observar-se o valor da estatística t, se a hipótese nula for verdadeira. 19 Calculando os “p-valores” para testes t 20 Significância x Importância Significância x Importância Normalmente, cria-se a hipótese antes de conhecer os dados. No caso de amostras pequenas, o erro tende a ser maior (mais difícil de rejeitar H0). Nestes casos é normal aumentar o nível de significância. 21 Intervalos de confiança Outra forma de utilizar os testes clássicos da estatística é construir um intervalo de confiança usando o mesmo valor crítico do teste bilateral. Um intervalo de confiança de (1 - a)% pode ser definido como: bˆ j c * ep bˆ j a onde c é o 1 - percent ilem uma distribuição t n k 1 2 22 Intervalos de confiança Interpretação: Se criarmos intervalos de confiança em várias amostrar aleatórias, o valor real de bj estará contido no intervalo em (1 - a)% dos intervalos criados. Por azar, justamente na amostra que você tinha disponível, bj não estava contido no intervalo (o intervalo está errado). Isso ocorrerá em a% dos casos. 23 Stata: p-valores, testes t etc. A maioria dos programas estatísticos computam os p-valores assumindo o teste bilateral. Se for o caso de um teste unilateral, basta dividir o p-valor do teste bilateral por 2. O Stata gera a estatística t, o p-valor e o intervalo de confiança de 95% para H0: bj = 0, nas colunas nomeadas “t”, “P > |t|” e “[95% Conf. Interval]”. Exemplo 4.7 24 Testando uma combinação linear Suponha que ao invés de testar se b1 é igual a uma constante, deseja-se testar se b1 é igual a outro parâmetro, isto é H0 : b1 = b2. Use o mesmo procedimento para criar a estatística t: bˆ1 bˆ2 t= ep bˆ1 bˆ2 25 Testando uma combinação linear Dado que Var bˆ bˆ = Var bˆ Var bˆ 2Covbˆ , bˆ epbˆ bˆ = epbˆ epbˆ 2 s onde s é uma estimativade Covbˆ , bˆ ep bˆ1 bˆ2 = Var bˆ1 bˆ2 , então 1 2 1 2 2 1 2 12 1 1 1 2 2 2 2 12 1 2 26 Testando uma combinação linear O cálculo de s12 é complicado. Alguns softwares terão uma opção para calculá-lo ou para executar o teste automaticamente, mas nem todos. Mas.... Há uma alternativa muito mais fácil, basta reorganizar o problema para obter o teste na forma necessária. 27 Exemplo: Suponha que queremos comparar se um ano de curso superior profissionalizante é equivalente a um ano de universidade (no salário). log(salário) =b0 + b1cp + b2univ + b3exper + u H0: b1 = b2 e H1: b1 < b2 Fazendo H0: q1 = b1 - b2 b1 = q1 + b2, substituindo e rearranjando: log(salário) =b0 + q1 + b2 cp + b2univ + b3exper + u 28 Exemplo: log(salário) =b0 + q1 + b2 cp + b2 univ + b3 exper + u log(salário) =b0 + q1 cp + b2 (cp +univ) + b3 exper + u log(salário) =b0 + q1cp + b2totalgrad + b3exper + u => Notar que agora q1 aparece explicitamente e ep(q1) é calculado junto com as demais estimativas. log(salário) =1,472 + 0,0102 cp + 0,0769 totalgrad+ 0,0049 exper (0,021) (0,0069) (0,0023) (0,0002) O modelo modificado é igual ao original, mas agora tem-se diretamente na saída da regressão o ep(q1). 29 Exemplo (cont.): Qualquer combinação linear das parâmetros pode ser testado de maneira similar. Outros exemplos de hipóteses sobre combinações lineares simples dos parâmetros: b1 = 1 + b2 ; b1 = 5b2 ; b1 = -1/2b2 30 Restrições Lineares Múltiplas Tudo apresentado até aqui envolvia apenas o teste de uma única restrição: (i.e. b1 = 0 ou b1 = b2 ). Porém, pode-se querer testar várias hipóteses sobre os parâmetros em conjunto. Um exemplo típico é testar “restrições excludentes” – um grupo de parâmetros é todo igual a zero. 31 Restrições Excludentes A hipótese nula agora será algo como: H0: bk-q+1 = 0, ... , bk = 0 A alternativa é H1: “H0 não é verdadeira”. Porque não analisar somente a estatística t de cada parâmetros em separado? Porque desejamos saber se os q parâmetros são conjuntamente significantes dado um nível de significância – é possível que nenhum seja significante no nível desejado (e que o grupo seja). 32 Restrições Excludentes (cont.) É necessário estimar: “modelo irrestrito” com todas variáveis x1,, …, xk incluídas. “modelo restrito” sem as variáveis xk-q+1,, …, xk Queremos verificar se as mudanças em SQR são grandes suficientes para justificar a inclusão de xk-q+1,, …, xk no modelo. SQRr SQRir q F SQRir n k 1 Onde: r é o modelo restrito ir é o irrestrito q = números de restrições, ou glr – glir n – k – 1 = glir 33 A estatística F É sempre positiva, dado que sempre SQR do modelo restrito >= SQR do modelo irrestrito. Essencialmente, é uma medida do crescimento relativo de SQR quando saímos do modelo irrestrito para o modelo restrito. Se o crescimento de SQR, quando mudamos de modelo, for “grande o suficiente” podemos rejeitar a exclusão das variáveis. 34 A estatística F (cont.) f(F) Rejeite H0 com nível de significância a se F>c Não-rejeitada a 1 a 0 c Rejeitada F 35 Exemplo: Modelo original (irrestrito): log(salário) =b0 + b1anos + b2jogosanos + b3medreb + b4rebpontos+ b5rebcorrida+ u n=353 SQR=183,186 Testar se as estatísticas que medem desempenho: medreb, rebpontos e rebcorrida não tem efeito sobre salário => Ho=b3=0, b4=0, b5 =0 Modelo restrito: log(salário) =b0 + b1anos + b2jogosanos +u n=353 SQR=198,311 36 Exemplo(cont.): Assim: 198,311 183,186 347 F * = 9.55 183,186 3 Com 347 graus de liberdade, o valor crítico a 1% de significância é c= 3,78 F > 3,78, portanto rejeitamos completamente a hipótese de que medreb, rebpontos e rebcorrida não tem efeito sobre salário . 37 A forma 2 R da estatística F Dado que os SQRs dos modelos podem ser grandes e de manipulação difícil, uma alternativa de formulação é útil neste caso. Usando o fato que SQR = SQT(1 – R2) para qualquer regressão, pode-se substituir SQRr e SQRir R Rr2 q F , 1 R n k 1 2 ir 2 ir onde, novamente, r é o modelorestrito ir é o modeloirrestrito 38 Significância completa Um caso especial de restrições excludentes é testar H0: b1 = b2 =…= bk = 0 Dado que o valor R2 de um modelo somente com intercepto será zero, o valor da estatística F é simplificado para: 2 R k F= 2 1 R n k 1 39 Restrições Lineares Gerais A forma básica da estatística F funcionará para qualquer conjunto de restrições lineares. Inicialmente, estime o modelo irrestrito e então estime o modelo restrito. Em cada caso, guarde o valor de SQR. Impor as restrições pode ser complicado, será necessário redefinir as variáveis novamente. Não usar a versão R2 neste caso. 40 Exemplo: Gastos implicam votos? O modelo: voteA = b0 + b1log(expendA) + b2log(expendB) + b3prtystrA + u H0: b1 = 1, b3 = 0 Substituindo as restrições: voteA = b0 + log(expendA) + b2log(expendB) + u Usa-se: voteA - log(expendA) = b0 + b2log(expendB) + u como modelo restrito. 41 Resumo da estatística F Assim como no caso da estatística t, os p-valores podem ser calculados procurando o percentil na tabela da distribuição F adequada. O Stata gerará estes valores com o comando: “display fprob(q, n – k – 1, F)” onde os valores apropriados de “F”, “q” e “n – k – 1” devem ser usados. Se somente uma exclusão está sendo testada, então F = t2 e os p-valores serão exatamente os mesmos. 42