ME623 Planejamento e Pesquisa Diagnóstico do Modelo Análise de Resíduos A decomposição da variabilidade das observações na Análise de Variância é puramente algébrica No entanto, para realizar os testes estatísticos de igualdade das médias algumas suposições têm que satisfeitas: 1. As observações são descritas pelo modelo: 2. , ou seja, os erros são normais e independentes, com média 0 e variância σ2 constante. Na prática, nem sempre essas suposições são válidas ME623A – Aula 5 – 21/08/2013 2 Análise de Resíduos Não se deve confiar nos resultados da Análise de Variância até que as suposições sejam validadas Isso pode ser feito atráves da Análise de Resíduos O resíduo para a j-ésima observação no i-ésimo tratamento é definido como: em que é uma estimativa do observação obtida da seguinte forma ME623A – Aula 5 – 21/08/2013 , 3 Análise de Resíduos Os resíduos contém informação sobre a variabilidade não explicada pelo modelo Se as suposições são válidas, os resíduos não devem apresentar nenhuma tendência. Eles devem ser: 1. aparentemente normais 2. independentes 3. variância constante, ou seja, a variabilidade dos resíduos não deve mudar com os níveis do fator Essas características são verificadas através dos Gráficos dos Resíduos ME623A – Aula 5 – 21/08/2013 4 Gráficos dos Resíduos Gráfico de Probabilidade Normal 1. ◦ ◦ ◦ resíduos versus os quantis teóricos de uma variável normal visualmente os pontos devem estar sob uma linha reta também útil para detectar outliers Resíduos versus Ordem dos Dados 2. ◦ útil para detectar correlação entre os resíduos ◦ qualquer tendência indica não independência ME623A – Aula 5 – 21/08/2013 5 Gráficos dos Resíduos Resíduos versus Valores Ajustados 3. ◦ se o modelo está correto, esse gráfico não deve apresentar nenhuma tendência ◦ serve para detectar variância não constante Resíduos versus Níveis do Fator 4. ◦ detectar se a variância é constante ME623A – Aula 5 – 21/08/2013 6 Exemplo da Fibra Sintética % Algodã o 15 20 1 Resíduos ( yij) 2 3 5.2 −2.8 −2.8 (7) (7) (15) 1.6 −3.4 −3.4 (12) (17) (12) 0.4 (18) 3.4 (25) 25 −3.6 (14) 30 −2.6 (19) 35 −3.8 −0.8 (7) (10) eij 4 5 yˆij = yi· 1.2 −0.8 (11) (9) 2.6 2.6 (18) (18) 0.4 1.4 (18) (19) 0.4 −2.6 (22) (19) 1.4 (19) 1.4 (23) 0.2 (11) 0.2 (11) 4.2 (15) ME623A – Aula 5 – 21/08/2013 9.8 15.4 17.6 21.6 10.8 7 Exemplo da Fibra Sintética Usando a função lm do R: > dados <- read.table(“DadosAlgodao.txt”, header=TRUE) > fit <- lm(Obs ~ factor(Algodao), data=dados) > anova(fit) Analysis of Variance Table Response: Obs Df Sum Sq Mean Sq F value factor(Algodao) Residuals 4 475.76 118.94 20 161.20 8.06 Pr(>F) 14.757 9.128e-06 *** --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 > plot(fit, col=“red”, pch=15) ME623A – Aula 5 – 21/08/2013 8 Resíduos Resíduos Padronizados Gráficos de Probabilidade Normal ME623A – Aula 5 – 21/08/2013 9 Resíduos Padronizados Os resíduos padronizados são dados por: Aproximadamente N(0, 1), então um resíduo padronizado maior que 3 ou 4 é um potencial outlier No Exemplo da Fibra Sintética, o maior resíduo padronizado é: Então não temos indicação de outliers ME623A – Aula 5 – 21/08/2013 10 Gráfico dos Resíduos vs Ordem dos Dados Nenhuma tendência aparente nesse exemplo Então não há suspeita de violação da hipótese de independência Isso é sinal de que a aleatorização foi feita de forma correta ME623A – Aula 5 – 21/08/2013 11 Gráfico dos Resíduos vs Valores Ajustados Nenhuma tendência aparente nesse exemplo Se o gráfico apresentar o formato de um cone, temos indicação de variância não constante Nesse caso, transformase os dados para estabilizar a variância ME623A – Aula 5 – 21/08/2013 12 Gráfico dos Resíduos vs Níveis do Fator Usado para checar a hipótese de igualdade de variância dentro dos tratamentos No nosso exemplo, parece razoável assumir que as variâncias são iguais Podemos usar o teste de Bartlett para testar formalmente a igualdade de variância ME623A – Aula 5 – 21/08/2013 13 Teste de Bartlett Homogeneidade das Variâncias Hipóteses Estatística do Teste onde é a variância amostral do i-ésimo tratamento e a variância agrupada (MSE) ME623A – Aula 5 – 21/08/2013 14 Teste de Bartlett Homogeneidade das Variâncias Quando as a amostras referentes aos tratamentos são normais e independentes, a distribuição amostral de se aproxima de uma distribuição O valor q é grande quando os a zero quando são todos iguais Portanto, rejeita-se H0 para Alerta: O Teste de Bartlett é muito sensitivo à normalidade. Então, não devemos utilizá-lo se a suposição de normalidade não for validada s diferem muito e igual também grande, ou seja, ME623A – Aula 5 – 21/08/2013 15 Teste de Bartlett Exemplo da Fibra Sintética As variâncias para cada tratamento são: Exercício: Encontrar a estatística do teste a conclusão dado que ? . Qual No R > bartlett.test(Obs ~ factor(Algodao), data=dados) Bartlett test of homogeneity of variances data: Obs by factor(Algodao) Bartlett's K-squared = 0.9331, df = 4, p-value = 0.9198 ME623A – Aula 5 – 21/08/2013 16 Exemplo: Controle da Ansiedade Pesquisadores querem Depois de tomar a meditestar um novo medicacação, os pacientes dão mento no combate a uma nota de 1 – 10 para ansiedade o nível de ansiedade Eles irão testar três dosagens (0mg, 50mg e 100mg) 21 pacientes participaram do estudo e foram divididos igualmente entre os três grupos Pergunta: Existe diferença entre as dosagens da medicação no controle da ansiedade? ME623A – Aula 5 – 21/08/2013 17 Exemplo: Controle da Ansiedade Dosage m (mg) 0 50 100 Nível de Ansiedade ( yij) 1 2 3 4 5 6 7 9 7 4 8 6 3 7 6 2 8 7 3 8 9 8 8 7 6 4 3 2 Total Média 57 47 21 y·· =125 8.14 6.71 3 y·· =5.95 yi· yi· Exercício Faça a Análise de Variância para esse exemplo e responda a pergunta dos pesquisadores Faça a Análise dos Resíduos (use o R para obter os gráficos) ME623A – Aula 5 – 21/08/2013 18 Para relembrar as fórmulas... Tabela ANOVA com Um Fator E as SS podem ser simplificadas como: ME623A – Aula 5 – 21/08/2013 19