Pressuposições do Modelo
Estatístico
e
Transformação de Dados
Pressuposições do modelo estatístico
Cada tipo de delineamento experimental é regido
por um modelo estatístico (ou matemático) e para
validar os testes de hipótese e inferências os
modelos devem ter suas pressuposições atendidas.
DIC: y ji    ti  eij
DBC: y ji    ti  b j  eij
DQL:
y jik    ti  l j  ck  eijk
Quais são as pressuposições?
1.
2.
3.
4.
Ausência de observações atípicas;
Independência dos resíduos;
Aditividade dos efeitos do modelo;
Homogeneidade de variância dos resíduos
para os tratamentos;
5. Normalidade dos resíduos;
Testes Estatísticos e Análises Gráficas
1. Ausência de observações atípicas
Observação atípica: valor muito grande ou muito
pequeno em relação aos demais. Influenciam
fortemente a média e variabilidade dos
tratamentos
Possíveis causas:
a) Leitura, anotação ou transcrição incorreta;
b) Erro na execução do experimento ou na tomada da
medida;
c) Mudanças não controláveis nas condições
experimentais;
d) Característica inerente à variável estudada;
1. Ausência de observações atípicas
Como detectar observações atípicas?
1.5
0.5
-0.5
-1.5
Sample Quantiles
a) Análise exploratória dos dados;
b) Inspeção gráfica dos resíduos – box plot,
Normal plot, Resíduos versus Preditos;
8
10
12
14
-2
-1
0
1
Theoretical Quantiles
2
2. Independência dos Resíduos
Garantida pela Casualização – Princípio Básico
da Experimentação;
-Mesma unidade experimental é utilizada várias vezes
para avaliar uma mesma característica;
-Diferentes parcelas em contato físico direto;
-Observações feitas por uma mesma pessoa durante
um determinado intervalo de tempo;
3. Aditividade dos efeitos do modelo
Aditividade dos efeitos de tratamentos com os
efeitos das variáveis de blocagem (DBC e DQL)
DIC:
y ji    t i  eij
DBC:
y ji    ti  b j  eij
DQL:
y jik    ti  l j  ck  eijk
4. Homogeneidade de variâncias dos
resíduos
Formulação das hipóteses
H 0 :  12   22  ...   I2
H a : pelo m enosdois  i2 ' s diferem entre si (i  1,...,I ).
Resíduos ordinários (eij)
eij  yij  yi
Resíduos padronizados (dij)
dij 
eij
QMErro
Visualização Gráfica:
•
Box plot dos resíduos padronizados;
•
Resíduos padronizados versus valores preditos ( yi ).
4. Homogeneidade de variâncias dos
resíduos
Variâncias
homogêneas
Variâncias
heterogêneas
(amplitudes semelhantes)
(amplitudes desiguais)
4. Homogeneidade de variâncias dos
resíduos
Variâncias
homogêneas
Variâncias
heterogêneas
(aleatório em torno do zero)
(variabilidade aumenta com os preditos)
4. Homogeneidade de variâncias dos
resíduos
Padrão que indica homogeneidade
Valor predito
4. Homogeneidade de variâncias dos
resíduos
Padrões que indicam heterogeneidade
Valor predito
4. Homogeneidade de variâncias dos
resíduos
Padrões que indicam heterogeneidade
Valor predito
4. Homogeneidade de variâncias dos
resíduos
Padrões que indicam heterogeneidade
Valor predito
4. Homogeneidade de variâncias dos
resíduos
Padrões que indicam heterogeneidade
Valor predito
4. Homogeneidade de variâncias dos
resíduos
Teste de Brown e Forsythe (1974)
H 0 :  12   22  ...   I2
H a : pelo m enosdois  i2 ' s diferem entre si (i  1,...,I ).
Se Fc  F ,v1,v2 Rejeita-se a hipótese H0
Fc  F ,v1,v 2 Não existem evidências para rejeitar
a hipótese H0
Nos softwares R e SAS avaliamos o valor da probabilidade (valor p)
Se o valor da probabilidade for menor que o nível de significância
( ) rejeitamos a hipótese H0.
5. Normalidade dos resíduos
Não Normal
(afastamento da reta)
Normal
(proximidade da reta)
5. Normalidade dos resíduos
Formulação das hipóteses
H 0 : os resíduos seguem um a distribuição Norm al
H a : os resíduos não seguem um a distribuição Norm al
O teste de Shapiro-Wilk é baseado na estatística W (0  W  1 )
Valores pequenos da estatística W levam a rejeitar a hipótese H0.
Nos softwares R e SAS avaliamos o valor da probabilidade (valor p)
Se o valor da probabilidade for menor que o nível de significância
( ) rejeitamos a hipótese H0.
5. Normalidade dos resíduos
Saída do SAS: considerando   0,05
Nos softwares R e SAS avaliamos o valor da probabilidade (valor p)
Se o valor da probabilidade for menor que o nível de significância
( ) rejeitamos a hipótese H0.
5. Normalidade dos resíduos
Saída do R: considerando   0,05
Nos softwares R e SAS avaliamos o valor da probabilidade (valor p)
Se o valor da probabilidade for menor que o nível de significância
( ) rejeitamos a hipótese H0.
O que fazer quando uma das pressuposições for
violada (não for atendida)?
1 - Transformação de dados;
2 - Modelos lineares generalizados;
3 - Testes não paramétricos.
O que fazer quando uma das pressuposições for
violada (não for atendida)?
1 - Transformação de Box-Cox;
Se   0 : ytransf  y 
Se   0 : ytransf  log( y )
λ
Transformação
1
Nenhuma
0,5
0
-0,5
-1
y
log(y )
1
y
1
y
O que fazer quando uma das pressuposições for
violada (não for atendida)?
1 - Transformação de Box-Cox;
O que fazer quando uma das pressuposições for
violada (não for atendida)?
Após transformar os dados é necessário refazer
as análises e verificar novamente todas as
pressuposições do modelo
Download

LCE0602-Pressuposicoes_e_Transformacoes