Testes Não Paramétricos
Inferência e Decisão I
Catarina Soares
Tânia Silva
Janeiro 2004
Instituto Superior Técnico
Universidade Técnica de Lisboa
1
Sumário
Testes Paramétricos vs Testes Não Paramétricos
Testes Não Paramétricos para uma População
Teste de Wilcoxon dos Postos Sinalizados
Testes Não Paramétricos para várias Populações
Teste do Sinal
Teste da Mediana
Conclusão
2
Testes Paramétricos vs
Testes Não Paramétricos
Testes Paramétricos
Distribuição População é Conhecida
Inferências Relativas um/vários Parâmetros
Testes Não Paramétricos
Distribuição População Normalmente Desconhecida
Inferências Sujeitas a menos Restrições
Não Envolvem, geralmente, Parâmetros
3
Testes Não Paramétricos
Vantagens
 Poucos Pressupostos Relativos à População
 Facilidade de implementação
 Maior Perceptibilidade
 Aplicável em Situações Não Abrangidas Pela Normal
 Mais Eficientes quando as Populações não têm Dist.
Normal
Desvantagens
Não têm Parâmetros, Dificultando Julgamentos
Quantitativos entre Populações
Escasso Aproveitamento de Informação da amostra
4
Teste de Wilcoxon
2 Observações de cada População  total 2n observações
Pressupostos
Seja Zi  Yi  X i o Modelo é dado por Zi    ei , i  1, , n
Variáveis Aleatórias es são mutuamente independentes
Cada variável aleatória e provém de uma população contínua e
simétrica em relação à origem
Teste de H0:   0
Ordenar Observações Zi  ordem Crescente do valor Absoluto
Determinar Ranks Ri 
Definir Variável
1 se Z i  0
0 se Z i  0
i  
, i = 1, ..., n
5
Hipóteses:
B - Teste Unilateral
H0 :   0
H1 :   0
A - Teste Bilateral
H0:   0
H1:   0
Estatística de Teste:
C - Teste Unilateral
H0 :   0
H1:   0
n
T   Rii

i 1

Estatística T corresponde à Soma dos Postos Sinalizados Positivos
Regra de Decisão:
A - Teste Bilateral
Rejeitar
H0 T   t  2 , n  ou T  
Não
Rejeitar H0
n  n  1
 t 1 , n 
2
n  n  1
 t 1 , n   T   t  2 , n 
2
B - Teste Unilateral C - Teste Unilateral
T   t  , n 
T 
n  n  1
 t  , n 
2
c.c.
onde   1 2 e t  , n constante
c.c.
6
Amostra grande
Estatística de Teste:
T* 
T   E0 T  
 var0 T 



1/ 2

T   n  n  1 / 4
n  n  1 2n  1 / 24
1/ 2
Apresenta, quando n   , distribuição assintoticamente N(0,1)
Regra de Decisão:
Se T *  z 

Rejeitar H0
c.c.

Não Rejeitar H0
7
Exemplo:
Dados de nove pacientes que receberam um tranquilizante T. A medida
utilizada consistiu no factor de escala depressivo IV de Hamilton
(factor de suicídio).
X – 1ª visita ao paciente, após o início da terapia
Y – 2ª visita ao paciente
Os pacientes diagnosticados revelaram uma mistura de ansiedade e
depressão.
i
Zi
1
2
3
4
5
6
7
8
9
-0.952
0.147
-1.022
-0.430
-0.620
-0.590
-0.490
0.080
-0.010
Zi
0.952
0.147
1.022
0.430
0.620
0.590
0.490
0.080
0.010
i
Ri
8
3
9
4
7
6
5
2
1
Rii
0
1
0
0
0
0
0
1
0
0
3
0
0
0
0
0
2
0
8
Teste do Sinal
Amostra Aleatória Bivariada X1, Y1 , X 2 , Y2 , ..., X n' , Yn' 
Ordenação da Amostra
Comparação de cada par  X i , Yi 
Classificação de cada par
Se X i  Yi  “+”
Se X i  Yi  “-”
Se X i  Yi  “0”
Pressupostos
A amostra aleatória bivariada ,  X i , Yi , é mutuamente independente
A escala de medida é ordinal para cada par
Os pares  X i , Yi  são consistentes internamente
9
Hipóteses:
A - Teste Bilateral
B - Teste Unilateral
H0 : P   P 
H1 : P    P 
H0 : P  P 
H1 : P    P 
C - Teste Unilateral
H0 : P  P 
H1 : P   P 
Teste nem centrado nem consistente
H0 : E  X i  E Yi 
H0 : E  X i  E Yi 
H0 : E  X i  E Yi 
H1 : E  X i  E Yi 
H1 : E  X i  E Yi 
H1 : E  X i  E Yi 
Estatística de Teste:
T = número total de +’s
10
Regra de Decisão:
n = número total de +’s e –’s
Usar as regras de decisão A, B ou C, em função das hipóteses
A – Teste Bilateral
n  20
Se T  t ou T  n  t  Rejeitar H0
c.c.
 Não Rejeitar H0
n  20
t

1
n  w / 2 n
2

B – Teste Unilateral
n  20
Se T  n  t  Rejeitar H0
c.c.
 Não Rejeitar H0
11
n  20
t

1
n  w n
2

C – Teste Unilateral
n  20
Se T  t
c.c.
 Rejeitar H0
 Não Rejeitar H0
n  20
t

1
n  w n
2

12
Exemplo:
Artigos A e B tem a mesma função mas são fabricados por
processos diferentes.
Os produtores desejam determinar quando é que B é
preferido a A pelo consumidor. Para isso, seleccionam uma
amostra aleatória de 10 consumidores, dão a cada um deles
um artigo A e um artigo B e pedem-lhes que usem ambos os
produtos por um período de tempo.
No final desse período de tempo, oito consumidores
preferiram o artigo B, um preferiu o artigo A e o último disse
“não tenho preferência”.
13
Teste da Mediana
Construção de uma amostra aleatória para c populações
Determinar a mediana da amostra combinada
1
2
...
c
 Mediana
O11
O12
...
O1c
a
 Mediana
O21
O22
...
O2c
b
Total
n1
n2
...
Amostra
nc
Total
N
Pressupostos
Cada amostra é uma amostra aleatória
Existe independência entre amostras
A escala de medida é ordinal
Se todas as populações têm a mesma mediana então, apresentam a
mesma probabilidade p de uma observação exceder a mediana
14
Hipóteses:
H0: As c populações têm a mesma mediana
H1: Pelo menos duas das populações têm medianas diferentes
Estatística de Teste:
T
2
N
ab
c

i 1
O 
 1i

ni a

N 
2
ni
Regra de Decisão:
Se T excede x1
c.c.

Rejeitar H0

Não Rejeitar H0
15
Exemplo:
Considere-se quatro métodos diferentes de crescimento de
cereais atribuídos aleatoriamente a diferentes lotes de
terreno, sendo cada lote computorizado a fim de se obter um
lucro por hectare.
Determinar se o lucro obtido difere entre lotes como
consequência do método utilizado.
Método
1
83
91
94
89
89
96
91
92
90
2
91
90
81
83
84
83
88
91
89
84
3
101
100
91
93
96
95
94
4
78
82
81
77
79
81
80
81
16
Conclusão
Teste de Wilcoxon – Testa se Mediana de uma população
simétrica é Zero
•
Teste do Sinal – Testa hipóteses da diferença entre amostras
emparelhadas ser positiva ou negativa, com igual
probabilidade
•
Teste da Mediana – Testa se X e Y, são extraídas de
populações com a mesma mediana
•
17
 Não tem, em geral, Distribuição Conhecida
 Podem ser aplicados em situações para as quais testes
paramétricos não têm solução

Eficiência Relativa Assintótica de Testes baseados em
Ranks
Perda de Informação
Eficiência Relativa depender da escolha de ,  e H1
Geralmente, os testes paramétricos são mais potentes do
que os testes não paramétricos
18
Fim
07/01/2004
19
Download

Testes Não Paramétricos