Estatística: Aplicação ao Sensoriamento Remoto ANO 2010 Camilo Daleles Rennó [email protected] http://www.dpi.inpe.br/~camilo/estatistica/ Teste de Hipótese para Uma amostra de 25 valores foi selecionada, chegando a uma média amostral X igual a 11,3. Poderia esta média amostral ter sido obtida de uma população com média = 10 0,14 e variância s2 = 16? N (0,1) Hipóteses H0 : = 10 (hipótese nula) H1: 10 (hipótese alternativa) z X s ~ N (0,1) s 0,08 2 0,06 0 ~ N (0,1) n Região Crítica: •aceito H0 se –zcrít < z < zcrít •rejeito H0 caso contrário 2 1 0,02 0 Se H0 é verdadeira, então X 10 0,1 0,04 n z 0,12 - 5 -zcrít 10 0 zcrít 15 + rejeição aceitação rejeição de H0 de H0 de H0 z <<< 0 z=0 z >>> 0 Se H0 falsa Se H0 verdadeira Se H0 falsa P(–zcrít < z < zcrít) = 1 - P(|z| > zcrít) = Conclusão (sempre associada a um nível de significância) 20 Teste de Hipótese para Uma amostra de 25 valores foi selecionada, chegando a uma média amostral X igual a 11,3. Poderia esta média amostral ter sido obtida de uma população com média = 10 0,14 de significância... e variância s2 = 16? Adotando-se 5% N (0,1) Hipóteses H0 : = 10 (hipótese nula) H1: 10 (hipótese alternativa) z X s 0,1 0,08 2,5% 0,06 0,04 ~ N (0,1) 2 0 0 Se H0 é verdadeira, então X 10 ~ N (0,1) s4 5n 195% 2,5% 2 0,02 n z 0,12 z 11,3 10 1,625 4 5 - 5 -zcrít zcrít -1,96 0 1,96 10 15 + rejeição aceitação rejeição de H0 de H0 de H0 1,625 Região Crítica: •aceito H0 se –1,96 1,96 P(–zcrít < z < zcrít) = 1 - –zcrít <<z z<<zcrít •rejeito H0 caso contrário P(|z| > zcrít) = Conclusão associada um nívelque de asignificância) Conclusão:(sempre não há razões paraaduvidar média seja de fato 10, adotando-se 5% de significância 20 Teste de Hipótese para Hipóteses H0 : = 10 H1: > 10 (teste unilateral) 0,14 N (0,1) 0,12 0,1 z X s 0,08 ~ N (0,1) 0,06 1 0,04 n 0,02 Se H0 é verdadeira, então z X 100 s 0 0 - 5 ~ N (0,1) n 10 0 aceitação de H0 Região Crítica: •aceito H0 se z < zcrít P(z < zcrít) = 1 - •rejeito H0 caso contrário P(z > zcrít) = Conclusão (sempre associada a um nível de significância) zcrít 15 + rejeição de H0 20 Teste de Hipótese para Hipóteses H0 : = 10 H1: > 10 (teste unilateral) 0,14 N (0,1) 0,12 0,1 z X s 0,08 ~ N (0,1) 0,06 5% 195% 0,04 n 0,02 Se H0 é verdadeira, então z X 10 ~ N (0,1) s4 5n z 0 0 11,3 10 1,625 4 5 - 5 Região Crítica: 10 0 zcrít 1,645 aceitação de H0 15 + rejeição de H0 1,625 •aceito H0 se z < z1,645 P(z < zcrít) = 1 - crít •rejeito H0 caso contrário P(z > zcrít) = Conclusão Conclusão:(sempre não há razões associada paraaduvidar um nívelque de asignificância) média seja de fato 10, adotando-se 5% de significância (teste unilateral) 20 Teste de Hipótese – Erros I e II Hipóteses H0 : = 0 H1: > 0 XX 0 zcrít crít0 s s Existe a possibilidade de se selecionar uma amostra de uma população com média 0 e obter X alto de forma que 0,14 leve a conclusão errada de que H0 é0,12 falsa? 0,1 n n N (0,1) 0,08 0,06 1 0,04 0,02 0 0 - 5 10 0 zcrít 15 + 20 Teste de Hipótese – Erros I e II Hipóteses H0 : = 0 H1: > 0 zcrít Existe a possibilidade de se selecionar uma amostra de uma população com média 0 e obter X alto de forma que leve a conclusão errada de que H0 é falsa? X crít 0 s X crít 0 zcrít n n N ( 0 , 0,14 0,12 Sim. Este erro é chamado de erro do tipo I e equivale ao nível de significância . s s2 n ) 0,1 0,08 0,06 1 0,04 0,02 0 0 P(rejeitar H0 / H0 é verdadeira) = P(aceitar H0 / H0 é verdadeira) = 1 - - 5 0 10 X crít 15 + 20 Teste de Hipótese – Erros I e II Hipóteses H0 : = 0 H1: > 0 Existe a possibilidade de se selecionar uma amostra de uma população com média 1 (> 0) e obter X de 0,14 forma que leve a conclusão errada de que H0 0,12 é verdadeira? 0,1 N ( 0 , s2 n N ( 1 , ) s2 n ) 0,08 Sim. Este erro é chamado de erro 0,06 do tipo II ou erro . 0,04 1 0,02 0 0 - 5 0 X crít aceitação P(aceitar H0 / H1 é verdadeira) = de H0 P(rejeitar H0 / H1 é verdadeira) = 1 - (poder do teste) 10 1 15 20 + Teste de Hipótese – Erros I e II Hipóteses H0 : = 0 H1: > 0 H0 é verd. Aceita H0 H0 é falso 1- N ( 0 , 0,14 s2 n N ( 1 , ) s2 n ) 0,12 Rejeita H0 1 - 0,1 0,08 0,06 1 0,04 Alternativas para diminuir : • distanciar 1 de 0 • aumentar • aumentar n 0,02 0 0 - 5 0 X crít 10 1 15 20 + Teste de Hipótese para No exemplo anterior, uma amostra de 25 valores foi selecionada, chegando-se a uma média amostral X igual a 11,3. Através de um teste z unilateral, chegou-se a conclusão que a verdadeira média poderia ser igual a 10, adotando-se o nível de significância de 5% (considerando s2 = 16). Mas qual a probabilidade de chegarmos a esta mesma conclusão, sendo a verdadeira média igual a 12, ou seja, qual o valor de ? H0 : = 10 H1: > 10 z X s N (0,1) 11,3 10 z 0,14 1,625 4 0,12 5 0,1 ~ N (0,1) n Se H0 é verdadeira, então 0,08 0,06se z < 1,645 aceito H 0 0,04 rejeito H0 se z > 1,645 95% 0,02 5% 0 z X 10 s n 0 ~ N (0,1) - 5 10 0 15 + zcrít = ?1,645 Conclusão: Aceito H0, ou seja, a média é igual a 10 considerando 5% de significância Teste de Hipótese para Agora, considerando a igual a 12 H0 : = 10 H1: = 12 N (0,1) 0,14 0,12 H0 verdadeiro = P(aceitar H0 / H1 é verdadeiro) 0,1 0,08 P(Z 1,645/ 12) 0,06 95% 0,04 0,02 5% 0 0 - 5 10 0 15 + zcrít = ?1,645 20 Teste de Hipótese para Agora, considerando a igual a 12 H0 : = 10 H1: = 12 H0 = P(aceitar H0 / H1 é verdadeiro) H1 0,14 P(Z 1,645/ 12) 0,12 0,1 P( 0,08 X 10 1, 645 / 12) 0,06 4 0,04 5 95% 0,02 P( X 11,316/ 12) P( 5% 0 0 - X 12 11,316 12 ) 4 4 5 5 P(Z 0,855) P(Z 0,855) 0,1963 5 10 15 10 12 11,316 20 + Teste de Hipótese – valor-P (p-value) Toda conclusão de um teste de hipótese está associada a um nível de significância. Por exemplo: “Com base num teste z unilateral a 5% de significância, pôde-se concluir que a média é maior que 20 uma vez que a estatística z obtida foi de 2,5 (zcrítico = 1,645)”. N (0,1) H0 : = 20 H1: > 20 0,14 0,12 0,1 Se H0 é verdadeira, então 0,08 95% 0,06 z X s n z 2,5 0,04 ~ N (0,1)0,02 5% Aceita H0 0 0 - 5 Rejeita H0 10 15 0 1,645 + 20 2,5 A média continuaria ser significativamente maior do que 20 se fosse adotado um nível de significância de 1%? Teste de Hipótese – valor-P (p-value) Toda conclusão de um teste de hipótese está associada a um nível de significância. Por exemplo: “Com base num teste z unilateral a 5% de significância, pôde-se concluir que a média é maior que 20 uma vez que a estatística z obtida foi de 2,5 (zcrítico = 1,645)”. N (0,1) H0 : = 20 H1: > 20 0,14 0,12 0,1 Se H0 é verdadeira, então 0,08 99% 0,06 z X s n z 2,5 0,04 ~ N (0,1)0,02 Aceita H0 0 0 - 5 1% Rejeita H0 10 15 0 + 20 2,33 2,5 A média continuaria serdesignificativamente maior que 100 fosse adotado Para que valores de nível significância, a média do poderia serseconsiderada um nível de significância de 1%? igual a 20? Teste de Hipótese – valor-P (p-value) Toda conclusão de um teste de hipótese está associada a um nível de significância. Por exemplo: “Com base num teste z unilateral a 5% de significância, pôde-se concluir que a média é maior que 20 uma vez que a estatística z obtida foi de 2,5 (zcrítico = 1,645)”. N (0,1) H0 : = 20 H1: > 20 0,14 0,12 0,1 Se H0 é verdadeira, então 0,08 0,06 z X s n z 2,5 0,0062 ? 0,04 ~ N (0,1)0,02 Aceita H0 0 0 - 5 valor-P Rejeita H0 10 15 0 + 20 2,5 A média continuaria serdesignificativamente maior que 100 fosse adotado Para que valores de nível significância, a média do poderia serseconsiderada um nível de significância de 1%? igual a 20? Pode-se aceitar H0 para qualquer nível de significância () menor que 0,0062. valor-P = P(Z > z), ou seja, neste caso valor-P = P(Z > 2,5) = 0,0062 Teste de Hipótese – valor-P (p-value) Exemplo: Foram coletadas amostras (50 pontos) em mapas a fim de avaliar sua exatidão. Procedeu-se o teste z para verificar quais deles possuíam exatidão (p) de 0,90. A tabela abaixo apresenta a exatidão estimada, o resultado do teste (estatística z) e o valor-P de cada mapa. pˆ z valor-P Mapa 1 0,87 -0,707 0,2397 Mapa 2 0,62 -6,600 2,07e-11 Mapa 3 0,82 -1,886 0,0297 Mapa 4 0,84 -1,414 0,0786 z pˆ p pq n Quais mapas possuem exatidão menor que 0,90, com 5% de significância? Mapas 2 e 3 Quais mapas possuem exatidão menor que 0,90, com 1% de significância? Somente Mapa 2 Teste de Hipótese para s2 amostra s2 = 27,34 S s2 = 25 Uma população com variância s2 = 25 conhecida poderia produzir uma amostra com s2 = 27,34? Hipóteses H0 : s2 = 25 H1: s2 25 (hipótese nula) (hipótese alternativa) Teste de Hipótese para s2 amostra s2 = 27,34 Hipóteses H0 : s2 = 25 H1: s2 25 (n 1) s 2 s S s2 = 25 Uma população com variância s2 = 25 conhecida poderia produzir uma amostra com s2 = 27,34? 2 (hipótese nula) (hipótese alternativa) ~ n21 Se H0 é verdadeira, então (n 1) s 2 ~ n21 25 Teste de Hipótese para s2 Hipóteses H0 : s2 = 25 H1: s2 25 (n 1) s 2 s 2 (hipótese nula) (hipótese alternativa) ~ n21 Se H0 é verdadeira, então (n 1) s 2 ~ n21 25 n21 2 2 1 0 xa rejeição aceitação de H0 de H0 Região Crítica: •aceito H0 se xa < X < xb P(xa < X < xb) = 1 - •rejeito H0 caso contrário Conclusão (sempre associada a um nível de significância) xb + rejeição de H0 Teste de Hipótese para s2 Exemplo: uma v.a. qualquer tem uma distribuição desconhecida com média e variância s2 desconhecidas. Retira-se uma amostra de 25 valores e calcula-se a variância amostral. Supondo que s2 = 2,34, teste a hipótese de que a verdadeira variância s2 seja de fato igual a 4, considerando 5% de significância. 242 Hipóteses H0 : s2 = 4 H1: s2 4 (n 1) s 2 s2 2,5% ~ n21 Se H0 é verdadeira, então 2 24 s 2 ~ 24 4 X 24.2,34 14, 04 4 Região Crítica: 2,5% 95% 0 xa ? 12,40 xb ? 39,36 •aceito H0 se 12,40 < X < 39,36 •rejeito H0 caso contrário Conclusão: Aceito H0, ou seja, não há razões para discordar que, a 5%, s2 = 4 + Teste de Hipótese para com s2 desconhecida Exemplo: uma v.a. qualquer tem uma distribuição desconhecida com média e variância s2 também desconhecidas. Retira-se uma amostra de 25 valores e calcula-se a média amostral e a variância amostral. Supondo que X 12,7 e s2 = 4,5, teste a hipótese unilateral a 1% de que = 15. H0 : = 15 H1: < 15 t X ~ tn 1 s n Se H0 é verdadeira, então t24 12, 7 15 t 0,14 5, 43 2,12 0,12 25 0,1 0,08 0,06se t > -2,492 aceito H 0 0,04 rejeito H0 se t < -2,492 99% 0,02 1% 0 X 15 t ~ t24 s 25 0 - 5 10 0 tcrít = ?- 2,492 Conclusão: Rejeito H0, ou seja, a média é significativamente (a 1%) menor que 15 15 + Inferência entre parâmetros de duas populações n1 n2 X1 S1 E( X1 ) 1 S2 X2 E ( X 2 ) 2 Mesmo não se conhecendo as médias 1 e 2, seria possível verificar se elas são iguais a partir de seus valores amostrais? Se 1 e 2 são iguais, então 1 - 2 = 0. Teste de Hipótese para 1 = 2 Hipóteses H0 : 1 - 2 = 0 (1 = 2) H1: 1 - 2 0 X1 ~ N ( 1,s12 ) X1 ~ ?N ( 1 , s 12 ) n1 X 2 ~ N ( 2 , ( X 1 X 2 ) ( 1 2 ) s 2 1 n1 s 2 2 s 2 1 n1 s 2 2 n2 n2 X1 X 2 ~ ?N ( 1 2 , ) s 12 n1 s 22 n2 ) N (0,1) ~ ?N (0,1)0,12 0,1 0,08 Se H0 é verdadeira, então z s 22 0,14 n2 X1 X 2 i desconhecidas, mas s i2 conhecidas X 2 ~ N ( 2 ,s 22 ) 2 0,06 0,04 2 1 0,02 ~ N (0,1) 0 0 - 5 -zcrít 10 0 zcrít 15 + P( zcrít z zcrít ) 1 Teste de Hipótese para 1 = 2 X1 ~ N ( 1,s12 ) X 2 ~ N ( 2 ,s 22 ) ( X 1 X 2 ) ( 1 2 ) s 12 n1 s 22 ~ ?N (0,1) i e s i2 desconhecidas (n1 1)s12 s 12 (n2 1) s22 n2 1 n2 1 s 22 ~ ? n1 n2 2 2 n2 1 2 ( X 1 X 2 ) ( 1 2 ) s 12 n1 ( n1 1) s12 s 2 1 s 22 n2 ( n2 1) s22 s n1 n2 2 2 2 ~ ?tn1 n2 2 (fazendo s 12 s 22 s 2) (homocedástico) Teste de Hipótese para 1 = 2 X1 ~ N ( 1,s12 ) X 2 ~ N ( 2 ,s 22 ) ( X 1 X 2 ) ( 1 2 ) s 12 n1 s 22 ~ ?N (0,1) n2 ( X 1 X 2 ) ( 1 2 ) s2 n1 (n1 1) s s2 2 1 s2 n2 (n2 1) s s2 n1 n2 2 2 2 ~ tn1 n2 2 i e s i2 desconhecidas (n1 1)s12 s 12 (n2 1) s22 s 22 ~ ? n1 n2 2 2 Teste de Hipótese para 1 = 2 X1 ~ N ( 1,s12 ) X 2 ~ N ( 2 ,s 22 ) ( X 1 X 2 ) ( 1 2 ) s 12 n1 s 22 ~ ?N (0,1) n2 ( X 1 X 2 ) ( 1 2 ) 1 1 s n1 n2 1 s ( n1 1) s ( n2 1) s n1 n2 2 2 1 2 2 ~ tn1 n2 2 i e s i2 desconhecidas (n1 1)s12 s 12 (n2 1) s22 s 22 ~ ? n1 n2 2 2 Teste de Hipótese para 1 = 2 Hipóteses H0 : 1 - 2 = 0 (1 = 2) H1: 1 - 2 0 i e s i2 desconhecidas mas s12 s 22 (t homocedástico) ( X 1 X 2 ) ( 1 2 ) (n1 1) s (n2 1) s n1 n2 2 2 1 2 2 1 1 n1 n2 ~ tn1 n2 2 0,14 tn1 n2 2 0,12 0,1 0,08 Se H0 é verdadeira, então t 0,04 X1 X 2 2 1 0,02 (n1 1) s (n2 1) s n1 n2 2 2 1 2 0,06 2 2 1 1 n1 n2 ~ tn1 n2 2 0 0 - 5 -tcrít 10 0 tcrít 15 + P(tcrít t tcrít ) 1 Teste de Hipótese para 1 = 2 Hipóteses H0 : 1 - 2 = 0 (1 = 2) H1: 1 - 2 0 i e s i2 desconhecidas mas s12 s 22 (t heterocedástico) 2 ( X 1 X 2 ) ( 1 2 ) 2 1 2 2 s s n1 n2 ~ tg s12 s22 n n g 12 2 2 0,14 s12 s22 0,12 n1 n2 0,1 n1 1 n2 1 tg 0,08 Se H0 é verdadeira, então t X1 X 2 s12 s22 n1 n2 2 0,06 0,04 ~ tg 2 1 0,02 0 0 - 5 -tcrít 10 0 tcrít 15 + P(tcrít t tcrít ) 1 Teste de Hipótese para 1 = 2 Exemplo: duas v.a. quaisquer têm distribuições desconhecidas com médias e variâncias também desconhecidas. Retira-se uma amostra de cada população e calcula-se a média e a variância para cada amostra. Teste a hipótese de que as variâncias e médias populacionais não diferem significativamente a 5% entre si, considerando que: n1 26 X 1 10,3 s12 2,34 n2 41 X 2 15, 7 s22 1,91 Usar teste t homocedástico ou heterocedástico? primeiramente deve-se testar se s12 s 22 Distribuição [( g1 g 2 ) 2] g1 f ( x) ( g1 2) ( g 2 2) g 2 g1 / 2 g2 E( X ) g2 2 2 g22 ( g1 g2 2) Var( X ) g1 ( g2 2)2 ( g2 4) F (de Snedecor) g x g1 / 21 1 1 x g2 ( g1 g2 ) 2 x0 + 0 X ~ Fg1 ,g2 (lê-se: X tem distribuição F com g1 e g2 graus de liberdade) Propriedades: a) se U ~ g21 e V ~ g2 então 2 b) se X ~ Fg1 ,g2 Fg1 ,g2 U / g1 ~ Fg1 ,g2 V / g2 1 então ~ Fg2 , g1 X P ( Fg1 , g2 F ) P ( Fg2 , g1 F 0 1 ) F + Fg2 ,g1 0 1 F + Distribuição F g1 0 F + P( Fg1 ,g2 F ) 0,025 g2 P( F15,20 ?) 0,025 P( F15,20 2,57) 0,025 Distribuição F g1 0 F + P( Fg1 ,g2 F ) 0,025 g2 P( F25,5 ?) 0,025 P( F5,25 ?) 0,025 Distribuição F g1 0 F + P( Fg1 ,g2 F ) 0,025 g2 P( F25,5 ?) 0,025 P( F5,25 ?) 0,025 P( F5,25 3,13) 0,025 1 P( F25,5 ) 0,025 3,13 P( F25,5 0,319) 0,025 Distribuição Se X1 ~ N ( 1,s12 ) (n1 1) s12 s 12 ~ ? 2 n1 1 X 2 ~ N ( 2 ,s 22 ) (n2 1) s22 s 22 ~ ? n22 1 (n1 1) s12 s12 s 22 s12s 22 (n1 1)s 12 2 2 2 2 ~ Fn1 1,n2 1 2 (n2 1) s2 s2s 1 s 1 s2 (n2 1)s 22 F Teste de Hipótese para s s 2 1 2 2 Exemplo: duas v.a. quaisquer têm distribuições desconhecidas com médias e variâncias também desconhecidas. Retira-se uma amostra de cada população e calcula-se a média e a variância para cada amostra. Teste a hipótese de que as variâncias e médias populacionais não diferem significativamente a 5% entre si, considerando que: n1 26 X1 10,3 s12 2,34 n2 41 X 2 15,7 s22 1,91 Hipóteses H 0 : s 12 / s 22 1 (s 12 s 22 ) F25;40 H1 : s / s 1 2 1 2 2 s12s 22 ~ Fn1 1;n2 1 2 2 s2s1 Se H0 é verdadeira, então 2,34 s12 1, 2251 F 2 ~ Fn1 1;n2 1 F 1,91 s2 2,5% 2,5% 95% 0 fa fb Região Crítica: •aceito H0 se 0,47 < F < 1,99 •rejeito H0 caso contrário 1 ? ? 1,99 2,12 Conclusão: Aceito H0, ou seja, não há razões para discordar que, a 5%, s12 s 22 + Teste de Hipótese para 1 = 2 (cont.) Exemplo: duas v.a. quaisquer têm distribuições desconhecidas com médias e variâncias também desconhecidas. Retira-se uma amostra de cada população e calcula-se a média e a variância para cada amostra. Teste a hipótese de que as variâncias e médias populacionais não diferem significativamente a 5% entre si, considerando que: n1 26 X1 10,3 s12 2,34 Hipóteses H0 : 1 - 2 = 0 (1 = 2) H1: 1 - 2 0 0,14 (n1 1) s (n2 1) s n1 n2 2 2 2 0,1 0,08 1 1 n1 n2 ~ t0,06 n1 n2 2 (t0,04 homocedástico) 0 (n1 1) s (n2 1) s n1 n2 2 2 2 - 0 X1 X 2 2 1 2,5% 2,5% 95% 0,02 Se H0 é verdadeira, então t t65 0,12 ( X 1 X 2 ) ( 1 2 ) 2 1 n2 41 X 2 15,7 s22 1,91 1 1 n1 n2 5 -t 10 0 t 15 ~ tn1 n2 2 t = -14,9515 ? 1,997 Conclusão: Rejeito H0, ou seja, as médias são diferentes significativamente a 5% + Teste de Hipótese para p Hipóteses H0 : p = p 0 H1 : p p 0 0,14 N (0,1) 0,12 0,1 pˆ p ~ N (0,1) pq n Se H0 é verdadeira, então z pˆ p0 ~ N (0,1) p0 q0 n 0,08 2 0,06 0,04 0,02 0 0 - 5 -zcrít 0 10 zcrít 15 + rejeição aceitação rejeição de H0 de H0 de H0 Região Crítica: •aceito H0 se –zcrít < z < zcrít •rejeito H0 caso contrário 2 1 P(–zcrít < z < zcrít) = 1 - P(|z| > zcrít) = Conclusão (sempre associada a um nível de significância) 20 Teste de Hipótese para p1 = p2 Hipóteses H0 : p1 – p2 = 0 (p1 = p2) H1 : p 1 – p 2 0 ( pˆ1 pˆ 2 ) ( p1 p2 ) p1q1 p2 q2 n n2 1 0,14 0,1 ~ N (0,1) ( pˆ1 pˆ 2 ) ( p1 p2 ) 1 1 ˆ ˆ pq n1 n2 0,08 2 0,06 0,04 2 1 0,02 Se H0 é verdadeira, então z N (0,1) 0,12 0 0 pˆ n1 pˆ 1 n2 pˆ 2 n1 n2 - 5 -zcrít 0 zcrít 15 + rejeição aceitação rejeição de H0 de H0 de H0 Região Crítica: •aceito H0 se –zcrít < z < zcrít •rejeito H0 caso contrário 10 P(–zcrít < z < zcrít) = 1 - P(|z| > zcrít) = Conclusão (sempre associada a um nível de significância) 20 Teste de Hipótese (resumo) se s2 é conhecida N (0,1) para se s2 é desconhecida tn 1 para s2 para 1 - 2 z 2 n1 2 (n 1) s 2 X s n t X s n N (0,1) s2 se s 12 e s 22 são conhecidas tn1 n2 2 se s 12 e s 22 são desconhecidas, mas s 12 s 22 tg se s 12 e s 22 são desconhecidas, mas s12 s 22 thomo z ( X 1 X 2 ) ( 1 2 ) s 12 n1 s 22 n2 thetero ( X 1 X 2 ) ( 1 2 ) (n1 1) s12 (n2 1) s22 n1 n2 2 ( X 1 X 2 ) ( 1 2 ) s12 s22 n1 n2 1 1 n1 n2 Teste de Hipótese (resumo) N (0,1) se s2 é conhecida tn 1 se s2 é desconhecida para para s2 n21 para 1 - 2 N (0,1) se s 12 e s 22 são conhecidas tn1 n2 2 se s 12 e s 22 são desconhecidas, mas s 12 s 22 tg se s 12 e s 22 são desconhecidas, mas s12 s 22 s 12 para 2 s2 Fn1 1,n2 1 para p N (0,1) para p1 – p2 s12s 22 F 2 2 s2s 1 z N (0,1) pˆ p pq ˆ ˆ ( p1 p2 ) ( p1 p2 ) z n 1 1 ˆ ˆ pq n1 n2 pˆ n1 pˆ 1 n2 pˆ 2 n1 n2 Teste de Hipótese / EXCEL Exemplo: Para se comparar a resposta espectral de 2 alvos, 10 pixels são escolhidos aleatoriamente de cada alvo, cujos resultados são apresentados abaixo. Adotando um nível de significância de 5%, podemos concluir que, em média, os alvos apresentam a mesma resposta? amostra Alvo 1 Alvo 2 1 128 98 2 134 105 3 110 99 4 112 109 5 125 95 6 107 101 7 111 100 8 115 92 9 130 107 10 120 110 Teste-t: duas amostras presumindo variâncias equivalentes Comparação de duas médias: teste-t Alvoou 1 heterocedástico? Alvo 2 Alvo 1 Alvo 2 Mas qual? Homo Teste-F: duas amostras para variâncias Média Variância Observações gl F P(F<=f) uni-caudal F crítico uni-caudal H0 : 1 - 2 = 0 H1: 1 - 2 > 0 119,2 101,6 90,84444 36,04444 10 10 9 9 2,520345 0,092349 3,178893 Média Variância Observações Variância agrupada Hipótese da diferença de média gl Stat t P(T<=t) uni-caudal t crítico uni-caudal P(T<=t) bi-caudal t crítico bi-caudal 119,2 101,6 90,84444 36,04444 10 10 63,44444 0 18 4,940841 5,28E-05 1,734064 0,000106 2,100922 Conclusão: através do teste-t homocedástico unilateral, pôde-se concluir que a média do alvo 1 deve ser maior que a do alvo 2, adotando-se um nível de significância de 5%, uma vez que valor-P foi menor que 0,05 (0,0000528). Teste t pareado 10 pontos são escolhidos em cada imagem Esquema 1 amostra B 1 12 15 2 34 17 3 16 21 4 28 27 5 15 25 6 17 32 7 23 15 8 13 19 9 29 29 10 31 30 amostra A B 1 12 11 2 34 37 3 16 18 4 28 28 5 15 18 6 17 19 7 23 24 8 13 15 9 29 32 10 31 33 Imagem B Esquema 2 Imagem A A Esquema 2 Esquema 1 Teste t pareado amostra A B 1 12 15 2 34 17 3 16 21 4 28 27 5 15 25 6 17 32 7 23 15 8 13 19 9 29 29 10 31 30 amostra A B 1 12 11 2 34 37 3 16 18 4 28 28 5 15 18 6 17 19 7 23 24 8 13 15 9 29 32 10 31 33 Teste t X A 21,8 sA2 66,84 X B 23,0 sB2 41,11 Se H0 verdadeiro s A2 H0 : sA = s B 2 (valor-P = F 0,24) Fcalc 1,63 ~s FnA2A calc 2 1, ns 1 (Ac. H0 a 5%) B B H1: sA > s B sB (valor-P = 0,37) A B (Ac. H0 a 5%) tcalc 0,35 XA XB H0 : A = B tcalc ~ t n A nB 2 2 2 H1: A < B 1 1 (nA 1) s A (nB 1) sB nA nB nA nB 2 X A 21,8 sA2 66,84 Teste t X B 23,5 sB2 74,94 Fcalc 0,89 (valor-P = 0,57) s A2 s B2 (Ac. H0 a 5%) tcalc 0, 43 (valor-P = 0,34) A B (Ac. H0 a 5%) Esquema 2 Esquema 1 Teste t pareado amostra A B 1 12 15 2 34 17 3 16 21 4 28 27 5 15 25 6 17 32 7 23 15 8 13 19 9 29 29 10 31 30 amostra A B A-B 1 12 11 1 2 34 37 -3 3 16 18 -2 4 28 28 0 5 15 18 -3 6 17 19 -2 7 23 24 -1 8 13 15 -2 9 29 32 -3 10 31 33 -2 Teste t X A 21,8 sA2 66,84 X B 23,0 sB2 41,11 Fcalc 1,63 (valor-P = 0,24) s A2 s B2 (Ac. H0 a 5%) tcalc 0,35 (valor-P = 0,37) A B (Ac. H0 a 5%) X AB 1,7 s H0 : A-B = 0 H1: A-B < 0 2 A B 1,79 Teste t pareado Se H0 verdadeiro X tcalc A B ~ tn 1 s A B n tcalc 4,02 (valor-P = 0,0015) AB 0 (Rej. H0 a 5%) Comparando-se as médias de r populações n1 nr n2 X1 Xr S1 E( X1 ) 1 S2 X2 Sr E ( X 2 ) 2 E( X r ) r Xij é o i-ésimo elemento da amostra retirada da população j (população = tratamento) N (2 , s 2 ) 2 2 j é a média da população j N (s1 ,)s ) N (0, i = 1, ..., nj N (r , s 2 ) 2 j = 1, ..., r Xij = j + ij ij ~ N(0,s ) j = * + j Xij = * + j + ij - - 0 1 + 2 r + * média efeito efeito global da pop. aleatório j Todas r populações têm a mesma variância!!! Comparando-se as médias de r populações A B C D 12 14 19 24 18 12 17 30 13 21 Total Total 30 39 57 54 180 Média 15 13 19 27 18 nj 2 3 3 2 10 A B C D X11 X12 X13 X14 X21 X22 X23 X24 X32 X33 Total Total X*1 X*2 X*3 X*4 X** Média X1 X2 X3 X4 XT nj n1 n2 n3 n4 nT Comparando-se as médias de r populações A B C D 12 14 19 24 18 12 17 30 13 21 Total Total 30 39 57 54 180 Média 15 13 19 27 18 nj 2 3 3 2 10 30 25 X ij XT 20 X 32 XT 5 15 10 XT A B C D Comparando-se as médias de r populações A B C D 12 14 19 24 18 12 17 30 13 21 Total Total 30 39 57 54 180 Média 15 13 19 27 18 nj 2 3 3 2 10 30 25 20 X ij X j X3 15 10 X4 X14 X 4 3 X1 A X2 B C D Comparando-se as médias de r populações A B C D 12 14 19 24 18 12 17 30 13 21 Total Total 30 39 57 54 180 Média 15 13 19 27 18 nj 2 3 3 2 10 30 X4 25 X 4 XT 9 20 X3 15 10 X j XT X1 A XT X2 B C D Comparando-se as médias de r populações A B C D 12 14 19 24 18 12 17 30 13 21 Total Total 30 39 57 54 180 Média 15 13 19 27 18 nj 2 3 3 2 10 X ij X T X j X T X ij X j nj nj X ij XT n j X j XT X ij X j r 2 j 1 i 1 SQTO r r 2 j 1 = j 1 i 1 SQT + SQE 2 Análise de Variância A B C D 12 14 19 24 18 12 17 30 13 21 Total Total 30 39 57 54 180 Média 15 13 19 27 18 nj 2 3 3 2 10 ANOVA (Análise de Variância) Fonte de Variação Soma dos Quadrados Tratamentos SQT n j X j X T Erro SQE X ij X j Total SQTO X ij X T r j 1 n j r j 1 i 1 r nj j 1 i 1 Graus de Liberdade 2 r-1 2 nT - r 2 nT - 1 Quadrado Médio SQT r 1 SQE QME nT r QMT Análise de Variância A B C D 12 14 19 24 18 12 17 30 13 21 Total 30 39 57 54 180 Média 15 13 19 27 18 nj 2 3 3 2 10 ANOVA (Análise de Variância) Fonte de Variação Tratamentos Erro Total Total Soma dos Graus de Quadrados Liberdade SQT SQE SQTO r-1 nT - r nT - 1 Quadrado Médio QMT E QME s 2 r E QMT s 2 n ( j 1 j E QMT s 2 T ) 2 r 1 r QME j n j 1 j r 1 2 j Análise de Variância A B C D 12 14 19 24 18 12 17 30 13 21 Total 30 39 57 54 180 Média 15 13 19 27 18 nj 2 3 3 2 10 ANOVA (Análise de Variância) Fonte de Variação Total Soma dos Graus de Quadrados Liberdade Quadrado Médio Tratamentos SQT r-1 QMT Erro SQE nT - r QME Total SQTO nT - 1 H0 : 1 = 2 = ... = r H1: nem todos j são iguais HQMT 0 : j =~0?F r 1,nT r HQME 1: nem todos j = 0 Análise de Variância A B C D 12 14 19 24 18 12 17 30 13 21 Total 30 39 57 54 180 Média 15 13 19 27 18 nj 2 3 3 2 10 ANOVA (Análise de Variância) Fonte de Variação Soma dos Graus de Quadrados Liberdade Quadrado Médio Tratamentos SQT r-1 QMT Erro SQE nT - r QME Total Total SQTO nT - 1 H0 : 1 = 2 = ... = r H1: nem todos j são iguais Fr 1,nT r Fcalc QMT QME 0 1 + Fcrít H0 verd. H0 falso ac. H0 rej. H0 Análise de Variância A B C D 12 14 19 24 18 12 17 30 13 21 Total Total 30 39 57 54 180 Média 15 13 19 27 18 nj 2 3 3 2 10 ANOVA (Análise de Variância) Fonte de Variação Tratamentos Soma dos Graus de Quadrados Liberdade Quadrado Médio 258 3 86 Erro 46 6 7,67 Total 304 9 F calculado Valor - P 11,2 0,0072 Conclusão: rej. H0 a 5%, pelo menos uma média é diferente das demais Análise de Variância OBSERVAÇÕES: - Cada observação é independente das demais; - Cada tratamento tem distribuição normal; - Todas as distribuições têm a mesma variância; e - ANOVA com 2 tratamentos (r = 2) é similar a um teste t bilateral (homocedástico). SQT n j X j X T r r 2 j 1 j 1 nj X 2j X T2 nj nT SQE X ij X j SQTO SQT r 2 j 1 i 1 nj SQTO X ij X T r j 1 i 1 2 nj X T2 X nT j 1 i 1 r 2 ij Teste de Bartlett (igualdade de variâncias) Se s12, ... , sr2 são as variâncias amostrais de r populações com distribuição normal, então r QME (n j 1 j 1) s 2j nT r B ~ r21 Fazendo r 2,302585 2 B ( n r ) log QME ( n 1) log s T 10 j 10 j C j 1 H0 : s12 s 22 s r2 H1: nem todas s 2j são iguais onde 1 r 1 1 C 1 3(r 1) j 1 n j 1 nT r r21 0 X crít H0 verd. ac. H0 + rej. H0 falso H0 Teste de Bartlett (igualdade de variâncias) Usando-se o exemplo da ANOVA: A B C D 12 14 19 24 18 12 17 30 13 21 Total s2 18 1 4 18 nj 2 3 3 2 10 H0 : s12 s 22 s 32 s 42 H1: nem todas s 2j são iguais 1 1 1 r 1 11 1 1 C 1 1,3148 3( 9 r1 1)2 j 12n j 1 1 6 nT r r 2,302585 2 B 3, 7147 2, 7897 (nT r )log QME ( n 1) log s 5,3076 0 10 j 10 j 1,3148 C j 1 32 0,05 X crít + X crít 7,8147 Conclusão: aceito H0 a 5%, ou seja, as variâncias dos grupos podem ser as mesmas Teste de Tukey (teste para comparação múltipla) Utilizado quando se deseja comparar todos os pares de médias de r populações, adotando-se um único nível de significância. H0 : i j 0 H1: i j 0 i j O teste consiste em calcular um valor (Dcrít), acima do qual, a diferença entre duas médias amostrais (em absoluto) é significativamente diferente de zero. Dcrít qr ,nT r 2 1 1 QME ni n j onde qr ,nT r representa o valor tabelado (vindo de uma distribuição da amplitude studentizada – “studentized range”) associado ao nível de significância adotado. Distribuição da Amplitude Studentizada P(qr , g qtab ) 0, 05 r g Teste de Tukey (teste para comparação múltipla) Usando-se o exemplo da ANOVA: A B C D 12 14 19 24 18 12 17 30 13 21 Total 30 39 57 54 180 Média 15 13 19 27 18 nj 2 3 3 2 10 Dcrít q4,6 2 1 1 QME ni n j Xi 13 15 19 27 Total D 15 13 2 Dcrít q4,6 4,90 ( 5%) 4, 90 2 1 1 7, 67 8, 76 3 2 Teste de Tukey (teste para comparação múltipla) Usando-se o exemplo da ANOVA: A B C D 12 14 19 24 18 12 17 30 13 21 Total Total 30 39 57 54 180 Média 15 13 19 27 18 nj 2 3 3 2 10 Dcrít q4,6 2 1 1 QME ni n j q4,6 4,90 Xi a 13 a 15 19 27 D 19 13 6 Dcrít 4, 90 2 1 1 7, 67 7,83 3 3 Teste de Tukey (teste para comparação múltipla) Usando-se o exemplo da ANOVA: A B C D 12 14 19 24 18 12 17 30 13 21 Total Total 30 39 57 54 180 Média 15 13 19 27 18 nj 2 3 3 2 10 Dcrít q4,6 2 1 1 QME ni n j q4,6 4,90 Xi a 13 a 15 a 19 27 D 27 13 14 Dcrít 4, 90 2 1 1 7, 67 8, 76 3 2 Teste de Tukey (teste para comparação múltipla) Usando-se o exemplo da ANOVA: B C D 12 14 19 24 18 12 17 30 13 21 30 39 57 54 180 Média 15 13 19 27 18 nj 2 3 3 2 10 q4,6 2 1 1 QME ni n j Xi 13 15 19 27 Total Total Dcrít a a a b A D 19 15 4 q4,6 4,90 Teste de Tukey (teste para comparação múltipla) Usando-se o exemplo da ANOVA: B C D 12 14 19 24 18 12 17 30 13 21 Total Total 30 39 57 54 180 Média 15 13 19 27 18 nj 2 3 3 2 10 Dcrít a a a b A q4,6 2 1 1 QME ni n j q4,6 4,90 Xi 13 15 19 27 D 27 15 12 Dcrít 4, 90 2 1 1 7, 67 9, 60 2 2 Teste de Tukey (teste para comparação múltipla) Usando-se o exemplo da ANOVA: B C D 12 14 19 24 18 12 17 30 13 21 Total Total 30 39 57 54 180 Média 15 13 19 27 18 nj 2 3 3 2 10 Dcrít a a a b A q4,6 2 1 1 QME ni n j q4,6 4,90 Xi 13 15 19 27 D 27 19 8 Dcrít 4, 90 2 1 1 7, 67 8, 76 3 2 Teste de Tukey (teste para comparação múltipla) Usando-se o exemplo da ANOVA: a a ab b 13 15 19 27 B C D 12 14 19 24 18 12 17 30 13 21 Total Total 30 39 57 54 180 Média 15 13 19 27 18 nj 2 3 3 2 10 Dcrít Xi A q4,6 2 35 30 25 20 15 10 5 0 1 1 QME ni n j q4,6 4,90 b a a ab 10 A B C D B A C 20 D 30