Pressuposições do Modelo Estatístico e Transformação de Dados Pressuposições do modelo estatístico Cada tipo de delineamento experimental é regido por um modelo estatístico (ou matemático) e para validar os testes de hipótese e inferências os modelos devem ter suas pressuposições atendidas. DIC: y ji ti eij DBC: y ji ti b j eij DQL: y jik ti l j ck eijk Quais são as pressuposições? 1. 2. 3. 4. Ausência de observações atípicas; Independência dos resíduos; Aditividade dos efeitos do modelo; Homogeneidade de variância dos resíduos para os tratamentos; 5. Normalidade dos resíduos; Testes Estatísticos e Análises Gráficas 1. Ausência de observações atípicas Observação atípica: valor muito grande ou muito pequeno em relação aos demais. Influenciam fortemente a média e variabilidade dos tratamentos Possíveis causas: a) Leitura, anotação ou transcrição incorreta; b) Erro na execução do experimento ou na tomada da medida; c) Mudanças não controláveis nas condições experimentais; d) Característica inerente à variável estudada; 1. Ausência de observações atípicas Como detectar observações atípicas? 1.5 0.5 -0.5 -1.5 Sample Quantiles a) Análise exploratória dos dados; b) Inspeção gráfica dos resíduos – box plot, Normal plot, Resíduos versus Preditos; 8 10 12 14 -2 -1 0 1 Theoretical Quantiles 2 2. Independência dos Resíduos Garantida pela Casualização – Princípio Básico da Experimentação; -Mesma unidade experimental é utilizada várias vezes para avaliar uma mesma característica; -Diferentes parcelas em contato físico direto; -Observações feitas por uma mesma pessoa durante um determinado intervalo de tempo; 3. Aditividade dos efeitos do modelo Aditividade dos efeitos de tratamentos com os efeitos das variáveis de blocagem (DBC e DQL) DIC: y ji t i eij DBC: y ji ti b j eij DQL: y jik ti l j ck eijk 4. Homogeneidade de variâncias dos resíduos Formulação das hipóteses H 0 : 12 22 ... I2 H a : pelo m enosdois i2 ' s diferem entre si (i 1,...,I ). Resíduos ordinários (eij) eij yij yi Resíduos padronizados (dij) dij eij QMErro Visualização Gráfica: • Box plot dos resíduos padronizados; • Resíduos padronizados versus valores preditos ( yi ). 4. Homogeneidade de variâncias dos resíduos Variâncias homogêneas Variâncias heterogêneas (amplitudes semelhantes) (amplitudes desiguais) 4. Homogeneidade de variâncias dos resíduos Variâncias homogêneas Variâncias heterogêneas (aleatório em torno do zero) (variabilidade aumenta com os preditos) 4. Homogeneidade de variâncias dos resíduos Padrão que indica homogeneidade Valor predito 4. Homogeneidade de variâncias dos resíduos Padrões que indicam heterogeneidade Valor predito 4. Homogeneidade de variâncias dos resíduos Padrões que indicam heterogeneidade Valor predito 4. Homogeneidade de variâncias dos resíduos Padrões que indicam heterogeneidade Valor predito 4. Homogeneidade de variâncias dos resíduos Padrões que indicam heterogeneidade Valor predito 4. Homogeneidade de variâncias dos resíduos Teste de Brown e Forsythe (1974) H 0 : 12 22 ... I2 H a : pelo m enosdois i2 ' s diferem entre si (i 1,...,I ). Se Fc F ,v1,v2 Rejeita-se a hipótese H0 Fc F ,v1,v 2 Não existem evidências para rejeitar a hipótese H0 Nos softwares R e SAS avaliamos o valor da probabilidade (valor p) Se o valor da probabilidade for menor que o nível de significância ( ) rejeitamos a hipótese H0. 5. Normalidade dos resíduos Não Normal (afastamento da reta) Normal (proximidade da reta) 5. Normalidade dos resíduos Formulação das hipóteses H 0 : os resíduos seguem um a distribuição Norm al H a : os resíduos não seguem um a distribuição Norm al O teste de Shapiro-Wilk é baseado na estatística W (0 W 1 ) Valores pequenos da estatística W levam a rejeitar a hipótese H0. Nos softwares R e SAS avaliamos o valor da probabilidade (valor p) Se o valor da probabilidade for menor que o nível de significância ( ) rejeitamos a hipótese H0. 5. Normalidade dos resíduos Saída do SAS: considerando 0,05 Nos softwares R e SAS avaliamos o valor da probabilidade (valor p) Se o valor da probabilidade for menor que o nível de significância ( ) rejeitamos a hipótese H0. 5. Normalidade dos resíduos Saída do R: considerando 0,05 Nos softwares R e SAS avaliamos o valor da probabilidade (valor p) Se o valor da probabilidade for menor que o nível de significância ( ) rejeitamos a hipótese H0. O que fazer quando uma das pressuposições for violada (não for atendida)? 1 - Transformação de dados; 2 - Modelos lineares generalizados; 3 - Testes não paramétricos. O que fazer quando uma das pressuposições for violada (não for atendida)? 1 - Transformação de Box-Cox; Se 0 : ytransf y Se 0 : ytransf log( y ) λ Transformação 1 Nenhuma 0,5 0 -0,5 -1 y log(y ) 1 y 1 y O que fazer quando uma das pressuposições for violada (não for atendida)? 1 - Transformação de Box-Cox; O que fazer quando uma das pressuposições for violada (não for atendida)? Após transformar os dados é necessário refazer as análises e verificar novamente todas as pressuposições do modelo