Estatística 13 – Comparação entre várias populações 1) Comparação de Médias (Análise de Variância) Prof. Antonio Fernando Branco Costa e-mail: [email protected] Página da FEG: www.feg.unesp.br/~fbranco Comparação de Médias de Várias Populações H 0 : 1 2 ... k H1 : PELO MENOS uma das médias é diferente Amostras: Assim: 1) 50 2) 50 3) 50 1) 64 66 59 65 62 x1 63,2 2) 71 73 66 70 68 x 2 69,6 3) 52 57 53 56 53 x3 54,2 59 62 64 65 66 60 70 80 66 68 70 71 73 53 52 53 60 70 80 60 70 80 56 57 A partir de uma análise “visual” é razoável supor que H0 deve ser REJEITADA. Análise de Variância - ANOVA Tabela 1: Medida da resistência de três tipos de concretos Média Concreto A 69 74 77 70 71 72,2 Concreto B 69 65 69 66 68 67,4 Concreto C 74 77 76 80 69 75,2 Tabela 2: Valores da Tabela (1) subtraídos de 71 Soma Concreto A -2 3 6 -1 0 6 Concreto B -2 -6 -2 -5 -3 -18 Concreto C 3 6 5 9 -2 21 Total 9 Tabela 3: Quadro de análise de variância Fonte de Soma dos Variação Quadrados Graus de Liberdade Quadrado Médio F F2,12,1% 7,56 6,93 Fator 154,8** 2 77,4 Erro 122,8 12 10,233 Total 277,6* 14 * SQ total (4+9+36+1+….+4) - 81/15 ** SQfator (36 324 441) / 5 81 / 15 Análise de Variância - ANOVA Hipótese Ho Rejeitada O que fazer? Calcular o ZETA verificar qual i j para Método de Tukey: os concretos que apresentarem uma diferença da resistência média nas amostras superior a Zeta, isto é, Xi X j > Zeta, para i, j A, B, C e i j serão considerados como tendo diferentes resistências médias. Tabela 1: Medida da resistência de três tipos de concretos Média Concreto A 69 74 77 70 71 72,2 Concreto B 69 65 69 66 68 67,4 Concreto C 74 77 76 80 69 75,2 Tabela 3: Quadro de análise de variância Fonte de Soma dos Variação Quadrados Graus de Liberdade Quadrado Médio F F2,12,1% 7,56 6,93 Fator 154,8** 2 77,4 Erro 122,8 12 10,233 Total 277,6* 14 S2R S2R Zeta = q k, , q 3,12,1% n n 10,233 5,04 7,21 5 k=número de níveis=3; n=tamanho da amostra=5, 12 q k, , é a Amplitude Studantizada. Análise de Variância - ANOVA Zeta 7,21 X A X B 72,2 67,4 4,8 X A XC 72,2 75,2 3 X B XC 67,4 75,2 7,8 Conclusão: Só podemos concluir que o concreto C é mais resistente que o concreto B. Comparação de Médias de Várias Populações 2º Experimento: Experimento com dois fatores, sem repetição Tabela 4: Experimento - dois fatores, sem repetição A B C D E F 5,4 3,2 3,8 4,6 5,0 4,4 Variedade 2 5,7 4,0 4,2 4,5 5,3 5,0 Fertilizante Variedade 1 Temos dois conjuntos de hipóteses: 1) Quanto ao fertilizante H 0 : A B C ... F H1 : Ao menos um i j , para i, j A, B, C,..., F e i j 2) Quanto a variedade H 0 : 1 2 H1 : 1 2 Comparação de Médias de Várias Populações Tabela 5: Dados da Tabela (4) Fertilizante A B C D E F Soma Variedade 1 5,4 3,2 3,8 4,6 5,0 4,4 26,4 Variedade 2 5,7 4,0 4,2 4,5 5,3 5,0 28,7 Soma 11,1 7,2 8 9,1 10,3 9,4 55,1 Tabela 6: Quadro de análise de variância Fonte Variação Soma dos Graus de de Quadrados Liberdade Quadrado Médio F FTabelado Fertilizante 5,154** 5 1,0308 22,03 F5;5;1% 10,97 Variedade 0,441*** 1 0,4410 9,42 F1;5;1% 16,26 Erro 0,234 5 Total 5,829* 11 0,0468 2 2 2 2 * SQtotal [(5,4) (3,2) ... (5) ] (55,1) / 12 2 2 2 2 ** SQfertilizante [(11,1) (7,2) ... (9,4) )] / 2 (55,1) / 12 2 2 2 *** SQvariedade [(26,4) (28,7) ] / 6 (55,1) / 12 Comparação de Médias de Várias Populações Tabela 6: Quadro de análise de variância Fonte Variação Soma dos Graus de de Quadrados Liberdade Fertilizante 5,154** 5 Quadrado Médio F 1,0308 22,03 10,97 Variedade 0,441*** 1 0,4410 9,42 16,26 Erro 0,234 5 Total 5,829* 11 0,0468 Fertilizante: Zeta = q n, , S2R S2R 0,0468 q 6,5,1% 8,91 1,36 k k 2 k=número de linhas=2; n=número de colunas=6, =5 Análise de Variância - ANOVA Tabela 5: Dados da Tabela (4) Fertilizante A B C D E F Variedade 1 5,4 3,2 3,8 4,6 5,0 4,4 Variedade 2 5,7 4,0 4,2 4,5 5,3 5,0 Média 5,55 3,6 4,0 4,55 5,15 4,7 2) Fertilizante: Zeta 1,36 X A X B 1,95 X A XC 1,55 X B X E 1,55 Conclusão: Podemos concluir que há diferença entre os fertilizantes A e B, A e C e B e E. Comparação de Médias de Várias Populações 3º Experimento: Experimento com dois fatores, com repetição Operário Método 1 2 3 4 I 54 46 55 51 I 52 47 54 60 II 59 61 59 56 II 57 55 61 57 III 59 63 63 59 III 62 58 61 60 Temos três conjuntos de hipóteses: 1) Quanto ao operário H 0 : 1 2 3 4 H1 : Ao menos um i j , para i, j 1,2,3,4 e i j 2) Quanto ao método H 0 : I II III H1 : Ao menos um i j , para i, j I, II, IIIe i j 3) Quanto a interação método-operário H 0 : 1I 2 I 3I ... 4III H1 : Ao menos um i j , para i, j 1I,2I,3I,...,4IIIe i j Tabela 7: Dados subtraídos de 59 Operário 1 Método 2 I -5 I -7 II 0 II -2 -12 -13 3 -25 -12 -2 2 3 III 3 4 -2 -9 3 0 2 -7 -53 -3 -5 -7 1 13 -2 4 6 2 -24 -8 1 2 -1 -11 -4 -5 -4 III 0 4 0 1 -1 -11 -47 Tabela 8: Quadro de Análise de Variância Fonte de Soma dos Variação Quadrados Graus de Liberdade Quadrado Médio F FTabelado Método 286,34** 2 143,17 20,08 6,93 Operário 44,46*** 3 14,82 2,08 5,95 MétodoOperário 72,66**** 6 (2x3) 12,11 1,70 4,82 Erro 85,50 12 7,13 Total 488,96* 23 2 2 2 2 * SQtotal [(5) (13) ... (1) ] (47) / 24 2 2 2 2 ** SQmetodo [( 53) (7) (13) )] / 8 (47) / 24 2 2 2 2 2 SQ [( 11 ) ( 24 ) ( 1 ) ( 11 ) ] / 6 ( 47 ) / 24 operario *** 2 2 2 2 SQ [( 12 ) ( 25 ) ... ( 1 ) ] / 2 ( 47 ) / 24 metodo operario **** SQ metodo SQoperario Comparação de Médias de Várias Populações Conclusão: De acordo com o Quadro de Análise de Variância, apenas o método influencia no tempo de execução da tarefa. Não há diferença entre operários e nem interação entre Método-Operário, ou seja, não existe um método específico com o qual um determinado operário se adapte melhor. 65 Tempo 60 metodo 1 55 metodo 2 50 metodo 3 45 40 1 2 3 4 Operario Figura 1: Interação Método - Operário Operário Método 1 2 3 4 I 54 46 55 51 I 52 47 54 60 II 59 61 59 56 II 57 55 61 57 III 59 63 63 59 III 62 58 61 60 65 60 Tempo metodo 1 55 metodo 2 metodo 3 50 45 40 1 2 3 4 Operario Distribuição F de Snedecor - P = 0,01 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 1 4052 98,50 34,12 21,20 16,26 13,75 12,25 11,26 10,56 10,04 9,65 9,33 9,07 8,86 8,68 8,53 8,40 8,29 8,18 8,10 8,02 7,95 7,88 7,82 7,77 7,72 7,68 7,64 7,60 7,56 7,31 7,08 6,85 2 4999 99,00 30,82 18,00 13,27 10,92 9,55 8,65 8,02 7,56 7,21 6,93 6,70 6,51 6,36 6,23 6,11 6,01 5,93 5,85 5,78 5,72 5,66 5,61 5,57 5,53 5,49 5,45 5,42 5,39 5,18 4,98 4,79 3 5403 99,17 29,46 16,69 12,06 9,78 8,45 7,59 6,99 6,55 6,22 5,95 5,74 5,56 5,42 5,29 5,18 5,09 5,01 4,94 4,87 4,82 4,76 4,72 4,68 4,64 4,60 4,57 4,54 4,51 4,31 4,13 3,95 4 5625 99,25 28,71 15,98 11,39 9,15 7,85 7,01 6,42 5,99 5,67 5,41 5,21 5,04 4,89 4,77 4,67 4,58 4,50 4,43 4,37 4,31 4,26 4,22 4,18 4,14 4,11 4,07 4,04 4,02 3,83 3,65 3,48 5 5764 99,30 28,24 15,52 10,97 8,75 7,46 6,63 6,06 5,64 5,32 5,06 4,86 4,69 4,56 4,44 4,34 4,25 4,17 4,10 4,04 3,99 3,94 3,90 3,85 3,82 3,78 3,75 3,73 3,70 3,51 3,34 3,17 6 5859 99,33 27,91 15,21 10,67 8,47 7,19 6,37 5,80 5,39 5,07 4,82 4,62 4,46 4,32 4,20 4,10 4,01 3,94 3,87 3,81 3,76 3,71 3,67 3,63 3,59 3,56 3,53 3,50 3,47 3,29 3,12 2,96 7 5928 99,36 27,67 14,98 10,46 8,26 6,99 6,18 5,61 5,20 4,89 4,64 4,44 4,28 4,14 4,03 3,93 3,84 3,77 3,70 3,64 3,59 3,54 3,50 3,46 3,42 3,39 3,36 3,33 3,30 3,12 2,95 2,79 8 5981 99,37 27,49 14,80 10,29 8,10 6,84 6,03 5,47 5,06 4,74 4,50 4,30 4,14 4,00 3,89 3,79 3,71 3,63 3,56 3,51 3,45 3,41 3,36 3,32 3,29 3,26 3,23 3,20 3,17 2,99 2,82 2,66