Aula 8. Inferência para várias populações normais. ANOVA Capítulo 15, Bussab&Morettin “Estatística Básica” 7ª Edição Análise de variância (The ANalysis Of VAriance = ANOVA) Experimentos com um fator. http://www.uwsp.edu/psych/stat/12/anova-1w.htm On-line ANOVA http://faculty.vassar.edu/lowry//anova1u.html amostra 1 X 1 , X 2 , , X n população 1 x1 , x2 , , xn X i independentes X i N ( 1 , 2 ) μ1 e μ2 são iguais? amostra 2 população 2 y1 , y2 , , ym Y1 , Y2 , , Ym Yi independentes Yi N ( 2 , 2 ) amostra 1 X 1 , X 2 , , X n (sub)população 1 x1 , x2 , , xn X i independentes X i N ( 1 , 2 ) amostra 2 (sub)população 2 y1 , y2 , , ym Y1 , Y2 , , Ym Yi independentes Yi N ( 2 , 2 ) amostra 2 (sub)população 3 z1 , z2 , , z p Z1 , Z 2 , , Z p Yi independentes Yi N ( 3 , 2 ) μ1, μ2 e μ3 são iguais? Ideia básica: Vamos estimar a variância 𝜎2 por dois métodos diferentes: um que não depende da veracidade de 𝐻0 e outro que depende. Depois comparamos as duas estimativas. Se os grupos tiverem todos a mesma média (𝐻0 verdadeiro) as duas estimativas deverão ser próximas, senão deverão diferir significativamente. Sentre grupos Decomposição de soma de quadrados total k ni STotal ( yij y ) 2 i 1 j 1 y1 j k k ni ni ( yi y ) ( yij yi ) 2 2 i 1 i 1 j 1 j 1,, n1 y1 y2 j j 1,, n2 y2 y y3 j j 1,, n3 y3 y Decomposição de soma de quadrados total ni k k k ni STotal ( yij y ) ni ( yi y ) ( yij yi ) 2 2 i 1 j 1 2 i 1 i 1 j 1 k S Group ni ( yi y ) 2 i 1 k ni S Erro ( yij yi ) 2 i 1 j 1 STotal SGroup S Erro Height of tomato plants (in inches) y11 y21 y31 y12 y22 y32 Treatments 1 2 3 74 76 87 68 80 91 77 y13 Total Mean k ni 219 156 178 73 78 89 553 79 k k ni STotal ( yij y ) ni ( yi y ) ( yij yi ) 2 2 i 1 j 1 2 i 1 i 1 j 1 Group Total -5 -11 -2 -3 1 8 12 25 121 4 9 1 64 144 368 73 -6 36 78 -1 1 89 10 100 3 108 2 2 2 200 310 Erro 79 310 1 -5 4 -2 2 -2 2 1 25 16 4 4 4 4 58 1. Yij N ( i , ) Model 2 i 1, , k j 1, , ni 2. Yij são i.i.d y1 j Y1 j N (1 , 2 ) j 1,, n1 Y2 j N (2 , 2 ) j 1,, n2 Y3 j N (3 , 2 ) j 1,, n3 j 1,, n1 y2 j j 1,, n2 y3 j j 1,, n3 Model 1. Yij N ( i , 2 ) 1. Yij i ij i 1, , k i 1, , k j 1, , ni j 1, , ni 2. Yij são independentes 2. ij são i.i.d . ij N (0, 2 ) i i i 1,, k 𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑘 𝐴: caso contrário 1. Yij i ij i 1, , k j 1, , ni 2. ij são i.i.d . ij N (0, 2 ) 𝐻0 : 𝜏1 = 𝜏2 = ⋯ = 𝜏𝑘 𝐴: caso contrário Inferência k ni k k ni STotal ( yij y ) ni ( yi y ) ( yij yi ) 2 2 2 i 1 j 1 i 1 i 1 j 1 STotal SGroup S Erro 1. Se modelo vale e a hipótese nula é verdadeira: 1 2 k k S Group 2 2 n ( y y ) i i i 1 2 k21 2. Se modelo vale k S Erro 2 ni ( y ij i 1 j 1 2 3. Então F yi ) 2 N2 k SGroup /(k 1) S Erro /( N k ) N n1 n2 nk Fk 1, N k Tabela de Análise de Variância causas de graus de soma variação liberades quadrados quadrados médios entre grupos k -1 SSGroup MSSGroup=SSGroup/(k-1) dentro grupos N-k SSErro MSSErro=SSErro/(N - k) total N -1 SSTotal F-estatística nível descritivo MSSGroup MSSErro p Tabela de Análise de Variância causas de graus de soma variação liberades quadrados entre grupos 3 -1=2 310 dentro grupos 7-3=4 58 total 7-1=6 368 quadrados médios 310 / 2 =155 58 / 4 = 14.5 F-estatística 155 =10.7 14.5 nível descritivo 0.025 Exemplo (Exemplo 15.2 Bussab&Morettin) Uma escola analisa seu curso por meio de um questionário com 50 questões sobre diversos aspectos de interesse. Cada pergunta tem uma resposta, numa escala de 1 a 5, em que a maior nota significa melhor desempenho. Na última avaliação, usou-se uma amostra de alunos de cada período, e os resultados estão na tabela abaixo. Período Manhã Tarde Noite 4.2 2.7 4.6 4.0 2.4 3.9 3.1 2.4 3.8 2.7 2.2 3.7 2.3 1.9 3.6 3.3 1.8 3.5 4.1 3.4 2.8 Existem as indicações estatísticas para dizer que o desempenho no curso tem uma influencia de período de aplicação do curso? On-line ANOVA http://faculty.vassar.edu/lowry//anova1u.html On-line ANOVA http://faculty.vassar.edu/lowry//anova1u.html On-line ANOVA http://faculty.vassar.edu/lowry//anova1u.html