Estatística: Aplicação ao Sensoriamento Remoto
SER 202 - ANO 2015
Estatística Não Paramétrica
Camilo Daleles Rennó
[email protected]
http://www.dpi.inpe.br/~camilo/estatistica/
Que Análise Estatística Usar?
TM R5G4B3
TM R3G4B5
TM R4G3B5
TM R5G3B4
Qual destas composições coloridas tem a melhor interpretabilidade?
...
...
d) Delimitação de corpos d’água
...
c) Definição de níveis de regeneração
R5G4B3 R3G4B5 R4G3B5 R5G3B4
4
3
2
1
3
4
2
1
3
4
1
2
4
3
2
1
1
2
4
3
4
3
1
2
4
3
1
2
...
b) Avaliação de áreas degradadas
(1 – melhor; 4 – pior)
a) Detecção de desmatamentos
3
4
2
1
Podemos dizer que há uma composição preferencial para uma dada aplicação?
2
Que Análise Estatística Usar?
Duas amostras foram obtidas a partir de duas populações distintas:
Amostra 1: 1003, 545, 875, 442, 13, 1209, 996, 57, 2356, 397 (n1 = 10)
Amostra 2: 233, 43, 157, 338, 113, 5, 99, 302, 475
(n2 = 9)
Podemos afirmar que a população 1 apresenta uma tendência de ter valores
maiores que a população 2?
3
Que Análise Estatística Usar?
Frequência absoluta
A partir de uma amostra de 200 valores obteve-se o seguinte histograma:
Podemos afirmar que esta população possui uma distribuição uniforme?
4
Estatística Paramétrica X Não Paramétrica
Estatísticas Paramétricas exigem grande número de condições para que sejam
válidas e tenham alto poder (1 – , probabilidade de rejeitar H0 quando H0 for
falso). Estas condições, em geral, são supostas válidas (ou previamente
testadas)
Por exemplo, a Análise de Variância (ANOVA) pressupõe:
independência das amostras;
tratamentos normalmente distribuídos; e
tratamentos homocedásticos (mesmas variâncias)
Estatísticas Não Paramétricas baseiam-se em suposições mais brandas e, quase
sempre, consideram a ordem dos dados e não seus valores numéricos. Além
disso, podem trabalhar diretamente com dados categóricos (classes)
5
Tipo de Mensuração
Nominal (Classes):
o atributo (numérico ou não) é usado apenas para identificar a que grupo ou
classe cada elemento da população pertence
exemplo: classe de uso e ocupação (floresta, pastagem, água, cidade, etc)
tipo de água (branca, preta e clara)
código DDD
Ordinal (Postos ou Rank):
o atributo (numérico ou não) tem significado de posicionamento numa lista
(crescente ou decrescente)
exemplo: nível de cinza de uma imagem
proximidade (junto, perto, longe)
ordem da bacia hidrográfica (método de Strahler)
6
Alguns Testes Não Paramétricos
Uma amostra
Várias amostras relacionadas
Teste de Aderência
Teste de Friedman
Teste de Kolmogorov-Smirnov
Duas amostras relacionadas
Várias amostras independentes
Teste de Kruskal-Wallis
Teste dos Sinais
Teste de Wilcoxon
Duas amostras independentes
Teste de Independência
Teste de Mann-Withney
Medidas não-paramétricas de correlação
Coeficiente de contingência
Coeficiente de correlação de Spearman
Coeficiente de correlação de Kendall
Teste de Kolmogorov-Smirnov para duas amostras
7
Teste de Aderência
Exemplo: Deseja-se testar a hipótese de que um dado seja honesto. Para tanto,
joga-se o mesmo 1200 vezes anotando-se os resultados:
Valor do dado
1
2
3
4
5
6
Freq. Abs. Obs.
180
207
191
203
210
209
1200
H0 : p
?i = 1/6 (i = 1, 2, ..., 6) (dado honesto)
H1: pelo menos algum pi  1/6
Se H0 é verdadeira, então
Valor do dado
1
2
3
4
5
6
Freq. Abs. Obs.
180
207
191
203
210
209
1200
Freq. Abs. Esp.
?
200
200
200
200
200
200
1200
c
X 
i 1
 FAObsi  FAEspi 
FAEspi
2
~
2
c 1
c21
c é o número de classes
0
H0 verd.
+
H0 falso
8
Teste de Aderência
Exemplo: Deseja-se testar a hipótese de que um dado seja honesto. Para tanto,
joga-se o mesmo 1200 vezes anotando-se os resultados:
Valor do dado
1
2
3
4
5
6
Freq. Abs. Obs.
180
207
191
203
210
209
1200
H0 : p
?i = 1/6 (i = 1, 2, ..., 6) (dado honesto)
H1: pelo menos algum pi  1/6
Se H0 é verdadeira, então
Valor do dado
1
2
3
4
5
6
Freq. Abs. Obs.
180
207
191
203
210
209
1200
Freq. Abs. Esp.
?
200
200
200
200
200
200
1200
c
X 
i 1
 FAObsi  FAEspi 
FAEspi
2
~
2
c 1
c21
c é o número de classes

0
X crít
ac. H0
rej. H0
+
9
Teste de Aderência
Exemplo: Deseja-se testar a hipótese de que um dado seja honesto. Para tanto,
joga-se o mesmo 1200 vezes anotando-se os resultados (tabela abaixo).
H0 : pi = 1/6 (i = 1, 2, ..., 6) (dado honesto)
H1: pi  1/6
Se H0 é verdadeira, então
Valor do dado
1
2
3
4
5
6
Freq. Abs. Obs.
180
207
191
203
210
209
1200
Freq. Abs. Esp.
200
200
200
200
200
200
1200
180  200
X
200
2
 207  200

200
2
 209  200
 ... 
200
2
 3,6
Conclusão: considerando 5% de significância,
aceita-se H0, ou seja,
não há razões para discordar que o dado seja honesto. 0
52
 = 0,05
? +
XXcrítcrít11,07
10
Teste de Aderência
OBSERVAÇÕES:
- Para variáveis aleatórias contínuas, deve-se agrupar os dados em 2 a 20
classes excludentes;
- Com apenas 2 classes, o valor esperado de cada uma deve ser ≥ 5;
- Considerando-se mais que 2 classes, não mais de 20% dos valores
esperados devem ser menores que 5, e nenhum deve ser nulo;
- Não é necessário que as classes sejam equiprováveis (mas é desejável);
- Este teste não é sensível ao ordenamento das classes; e
- Caso o teste seja usado para verificar a adequação do uso de alguma
distribuição específica com parâmetros desconhecidos, perde-se também
1 grau de liberdade para cada parâmetro estimado. Ex: para testar uma
distribuição que possui 2 parâmetros desconhecidos, o teste de
aderência teria c - 3 graus de liberdade.
11
Teste de Kolmogorov-Smirnov
Exemplo: Considere os dados abaixo, resultantes da observação de 40 valores
de uma variável aleatória qualquer Y. Deseja-se testar a hipótese de que esta
variável aleatória tenha distribuição normal.
2,2
4,1
3,5
4,5
5,0
3,7
3,0
2,6
3,4
1,6
3,1
3,3
3,8
3,1
4,7
3,7
2,5
4,3
4,9
3,6
2,9
3,3
3,9
3,1
4,8
3,1
3,7
4,4
3,2
4,1
1,9
3,4
4,7
3,8
3,0
2,6
3,9
3,0
4,2
3,5
X  3,5275

s2  0,6528
H0 : Y ~ N( = 3,5275; 2 = 0,6528)
H1 : Y ~ ?
 2
H0 : (Y – 3,5275)/0,8080 = Z ~ N(0,1)
H1: (Y – 3,5275)/0,8080 ~ ?

Valores padronizados:
-1,64
-0,53
0,71
-0,28
-0,03
0,34
1,20
-0,53
1,82
1,45
0,21
0,21
-0,65
-1,27
-1,15
0,96
-0,16
1,70
-2,39
0,09
-0,78
-2,01
-0,28
-0,16
0,46
1,45
-0,53
0,34
1,57
-0,65
-0,53
-1,15
0,21
0,46
1,08
-0,65
-0,41
0,83
0,71
-0,03
14
Teste de Kolmogorov-Smirnov
Exemplo: Considere os dados abaixo, resultantes da observação de 40 valores
de uma variável aleatória qualquer X. Deseja-se testar a hipótese de que esta
variável aleatória tenha distribuição normal com média  igual a 3,6 e
variância 2 igual a 0,8.
Valores padronizados ordenados:
-2,39
-2,01
-1,64
-1,27
-1,15
-1,15
-0,78
-0,65
-0,65
-0,65
-0,53
-0,53
-0,53
-0,53
-0,41
-0,28
-0,28
-0,16
-0,16
-0,03
-0,03
0,09
0,21
0,21
0,21
0,34
0,34
0,46
0,46
0,71
0,71
0,83
0,96
1,08
1,20
1,45
1,45
1,57
1,70
1,82
1
Fobs ( Z i )  FR( Z  Z i ) 
F(Z)
0,8
Fesp (Zi )  P(Z  Zi )
0,6
i
3
 Fobs (1, 64) 
n
40
 Fesp (Z  1,64)  0,0505
0,4
D  máx Fobs ( Z i )  Fesp ( Z i )
0,2
0
-3
-2
-1
0
Z
1
Observado
ObservadoEsperado
2
3
valores críticos tabelados!
Se H0
verdadeira
Se D maior que Dcrít, então rejeita-se H0 e
conclui-se que a distribuição teórica não é
válida, com certo nível de significância.
15
Valores Críticos do Teste KS
Tamanho da
amostra
(N)
0,20
0,15
0,10
0,05
0,01
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
25
30
35
0,900
0,684
0,565
0,494
0,446
0,410
0,381
0,358
0,339
0,322
0,307
0,295
0,284
0,274
0,266
0,258
0,250
0,244
0,237
0,231
0,21
0,19
0,18
0,925
0,726
0,597
0,525
0,474
0,436
0,405
0,381
0,360
0,342
0,326
0,313
0,302
0,292
0,283
0,274
0,266
0,259
0,252
0,246
0,22
0,20
0,19
0,950
0,776
0,642
0,564
0,510
0,470
0,438
0,411
0,388
0,368
0,352
0,338
0,325
0,314
0,304
0,295
0,286
0,278
0,272
0,264
0,24
0,22
0,21
0,975
0,842
0,708
0,624
0,565
0,521
0,486
0,457
0,432
0,410
0,391
0,375
0,361
0,349
0,338
0,328
0,318
0,309
0,301
0,294
0,27
0,24
0,23
0,995
0,929
0,828
0,733
0,669
0,618
0,577
0,543
0,514
0,490
0,468
0,450
0,433
0,418
0,404
0,392
0,381
0,371
0,363
0,356
0,32
0,29
0,27
Mais de 35
1, 07
N
1,14
N
1, 22
N
1,36
N
1, 63
N
Nível de significância para Dcrít = máx|Fobs(X) - Fesp(X)|
16
Teste de Kolmogorov-Smirnov
Exemplo: Considere os dados abaixo, resultantes da observação de 40 valores
de uma variável aleatória qualquer X. Deseja-se testar a hipótese de que esta
variável aleatória tenha distribuição normal com média  igual a 3,6 e
variância 2 igual a 0,8.
Valores padronizados ordenados:
-2,39
-2,01
-1,64
-1,27
-1,15
-1,15
-0,78
-0,65
-0,65
-0,65
-0,53
-0,53
-0,53
-0,53
-0,41
-0,28
-0,28
-0,16
-0,16
-0,03
-0,03
0,09
0,21
0,21
0,21
0,34
0,34
0,46
0,46
0,71
0,71
0,83
0,96
1,08
1,20
1,45
1,45
1,57
1,70
1,82
1
Fobs ( Z i )  FR( Z  Z i ) 
F(Z)
0,8
Fesp (Zi )  P(Z  Zi )
0,6
i
3
 Fobs (1, 64) 
n
40
 Fesp (Z  1,64)  0,0505
0,4
D  máx Fobs ( Z i )  Fesp ( Z i )
0,2
0
-3
-2
-1
Observado
0
Z
1
Esperado
2
3
D  0,0670
Dcrít  0,2150 (  5%)
Conclusão: pode-se aceitar a hipótese de que os
dados provenham de uma distribuição normal a 5%
de significância.
17
Teste de Kolmogorov-Smirnov
OBSERVAÇÕES:
- É o teste mais apropriado para dados ordenados;
- Ideal quando a variável tem distribuição contínua; e
- Não há uma modificação quando se estima os parâmetros de uma
distribuição (não há perdas de graus de liberdade como no teste 2).
18
Teste dos Sinais
Exemplo: Uma determinada técnica de processamento digital é conhecida por
melhorar a interpretabilidade visual de imagens. A fim de comprovar sua
eficiência, 20 imagens (de diferentes regiões e de usos e ocupação) foram
processadas e apresentadas a um especialista que as classificou (em notas de
1 a 5), de forma totalmente independente, segundo a facilidade em distinguir
os diferentes alvos presentes. Os resultados são apresentados abaixo (dados
fictícios). Baseando-se nesses resultados, pode-se concluir que esta técnica
realmente melhora a interpretabilidade das imagens?
Imagem Antes
Depois
Imagem Antes
Depois
Critérios:
1
4
5
+
11
2
3
+
2
3
5
+
12
3
2
-
3
2
2
0
13
3
4
+
4
4
3
-
14
3
4
+
5
3
4
+
15
3
5
+
6
1
2
+
16
1
3
+
7
5
4
-
17
4
4
0
8
3
4
+
18
2
4
+
# positivos: 14
9
1
3
+
19
4
5
+
10
5
5
0
20
2
3
+
# nulos: 3
Positivo: melhorou
Negativo: piorou
Nulo: indiferente
# negativos: 3
19
Teste dos Sinais
Exemplo: Uma determinada técnica de processamento digital é conhecida por
melhorar a interpretabilidade visual de imagens. A fim de comprovar sua
eficiência, 20 imagens (de diferentes regiões e de usos e ocupação) foram
processadas e apresentadas a um especialista que as classificou (em notas de
1 a 5), de forma totalmente independente, segundo a facilidade em distinguir
os diferentes alvos presentes. Os resultados são apresentados abaixo (dados
fictícios). Baseando-se nesses resultados, pode-se concluir que esta técnica
realmente melhora a interpretabilidade das imagens?
H0 : p(+) = 0,5 (a técnica não tem efeito sobre a interpretabilidade de imagens)
H1: p(+) > 0,5
(a técnica melhora a interpretabilidade de imagens)
Se X representa o número de resultados positivos nas n observações, então
X ~ Binomial
p = 0,5 (se H0 verdadeira)
n = 17 (os empates são desconsiderados)
20
Teste dos Sinais
Exemplo: Uma determinada técnica de processamento digital é conhecida por
melhorar a interpretabilidade visual de imagens. A fim de comprovar sua
eficiência, 20 imagens (de diferentes regiões e de usos e ocupação) foram
processadas e apresentadas a um especialista que as classificou (em notas de
1 a 5), de forma totalmente independente, segundo a facilidade em distinguir
os diferentes alvos presentes. Os resultados são apresentados abaixo (dados
fictícios). Baseando-se nesses resultados, pode-se concluir que esta técnica
realmente melhora a interpretabilidade das imagens?
H0 : p(+) = 0,5 (a técnica não tem efeito sobre a interpretabilidade de imagens)
(a técnica melhora a interpretabilidade de imagens)
H1: p(+) > 0,5
Adotando-se 5% de significância,
0,2
rejeita-se H0 se forem observados 13 ou
mais valores positivos, já que
P(X = x)
0,15
0,1
H0 falso
0,05
0
0
1
2
3
4
5
6
7
ac. H0
8
9 10 11 12 13 14 15 16 17
rej. H0
P(X  12) = 7,2%
P(X  13) = 2,5%
# positivos observados: 14
Conclusão: rejeito H0 a 5%, ou seja, a técnica
parece mesmo melhorar a interpretabilidade
de imagens
21
Teste dos Sinais
OBSERVAÇÕES:
- É comum calcular-se o valor-p = mín[P(X  xobs); P(X  xobs)], que indica o quão
raro é observar valores tão extremos quanto o observado
- Para grandes amostras (n > 25), a distribuição binomial aproxima-se da
normal e então um teste z (com correção de continuidade) pode ser
empregado
- Considera apenas o sentido da mudança e não sua grandeza
- É equivalente ao teste paramétrico t pareado (cujo poder é superior para
amostras grandes e quando as condições prévias recomendadas são
verdadeiras)
22
Teste de Wilcoxon
Exemplo (fictício): Para estimar a área plantada de uma cultura qualquer, um
classificador automático pode utilizar uma ou mais imagens de uma mesma
região. Espera-se que a utilização de imagens de duas datas resulte numa
classificação melhor do que quando é utilizada apenas uma imagem, dependendo
da época que estas imagens são obtidas. A fim de verificar se o classificador
realmente melhora seu desempenho ao utilizar duas imagens ao invés de uma
única imagem, 8 regiões foram selecionadas e a área de plantio corretamente
classificada foi avaliada usando-se uma ou duas imagens. Os resultados são
apresentados abaixo. O que se pode concluir?
Região
Área corretamente
classificada
1 imagem
1
70
2
51
3
60
4
57
5
43
6
15
7
25
8
103
2 imagens
117 +
48 63 +
90 +
41 21 +
36 +
122 +
Se a análise fosse feita usando-se o Teste dos
Sinais:
H0 : p(+) = 0,5
Se H0 verdadeira:
H1: p(+) > 0,5
X ~ Binomial p = 0,5 n = 8
Como o # positivos = 6 e H0 verdadeira:
Valor-P = P(X  6) = 14,5%
Conclusão: aceita-se H0
23
Teste de Wilcoxon
Exemplo (fictício): Para estimar a área plantada ... pode concluir?
Região
Área corretamente
classificada
Dif
1 imagem
2 imagens
1
70
117
47
2
51
48
-3
3
60
63
3
4
57
90
33
5
43
41
-2
6
15
21
6
7
25
36
11
8
103
122
19
Procedimento:
a)
Calculam-se as diferenças
24
Teste de Wilcoxon
Exemplo (fictício): Para estimar a área plantada ... pode concluir?
Região
Área corretamente
classificada
Dif
Posto
1 imagem
2 imagens
1
70
117
47
8
2
51
48
-3
2,5
3
60
63
3
2,5
4
57
90
33
7
5
43
41
-2
1
6
15
21
6
4
7
25
36
11
5
8
103
122
19
6
Procedimento:
a)
Calculam-se as diferenças
b)
Obtém-se os postos das diferenças em
módulo, desprezando-se as diferenças
nulas. Para diferenças repetidas, são
atribuídos postos médios
25
Teste de Wilcoxon
Exemplo (fictício): Para estimar a área plantada ... pode concluir?
Região
Área corretamente
classificada
Dif
Posto
1 imagem
2 imagens
1
70
117
47
8
2
51
48
-3
-2,5
3
60
63
3
2,5
4
57
90
33
7
5
43
41
-2
-1
6
15
21
6
4
7
25
36
11
5
8
103
122
19
6
Procedimento:
a)
Calculam-se as diferenças
b)
Obtém-se os postos das diferenças em
módulo, desprezando-se as diferenças
nulas. Para diferenças repetidas, são
atribuídos postos médios
c)
Agregam-se os sinais das diferenças aos
respectivos postos
26
Teste de Wilcoxon
Exemplo (fictício): Para estimar a área plantada ... pode concluir?
Região
Área corretamente
classificada
Dif
Posto
1 imagem
2 imagens
1
70
117
47
8
2
51
48
-3
-2,5
3
60
63
3
2,5
4
57
90
33
7
5
43
41
-2
-1
6
15
21
6
4
7
25
36
11
5
8
103
122
19
6
T(-) = 3,5
Procedimento:
a)
Calculam-se as diferenças
b)
Obtém-se os postos das diferenças em
módulo, desprezando-se as diferenças
nulas. Para diferenças repetidas, são
atribuídos postos médios
c)
Agregam-se os sinais das diferenças aos
respectivos postos
d)
Calcula-se a menor soma dos postos de
mesmo sinal
T(+) = 27,5
27
Teste de Wilcoxon
Exemplo (fictício): Para estimar a área plantada ... pode concluir?
Região
Área corretamente
classificada
Dif
Posto
1 imagem
2 imagens
1
70
117
47
8
2
51
48
-3
-2,5
3
60
63
3
2,5
4
57
90
33
7
5
43
41
-2
-1
6
15
21
6
4
7
25
36
11
5
8
103
122
19
6
Tobs = 3,5
H0 : T(+) = T(-)
H1: T(+) > T(-)
Procedimento:
a)
Calculam-se as diferenças
b)
Obtém-se os postos das diferenças em
módulo, desprezando-se as diferenças
nulas. Para diferenças repetidas, são
atribuídos postos médios
c)
respectivos postos
d)
A segunda imagem melhora a classificação
Calcula-se a menor soma dos postos de
mesmo sinal
e)
Não há diferença no uso de 2 imagens
Agregam-se os sinais das diferenças aos
Compara-se o valor obtido com o valor
crítico (tabelado). Se valor observado for
igual ou menor que o tabelado, rejeita-se
H0. Caso contrário, aceita-se H0.
28
Valores Críticos do Teste de Wilcoxon
Tamanho da
amostra
(N)
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Nível de significância (unilateral)
0,05
0,025
0,01
0,005
Nível de significância (bilateral)
0,1
0,05
0,02
0,01
2
4
6
8
11
14
17
21
26
30
36
41
47
54
60
68
75
83
92
101
0
2
4
6
8
11
14
17
21
25
30
35
40
46
52
59
66
73
81
89
--0
2
3
5
7
10
13
16
20
24
28
33
38
43
49
56
62
69
77
----0
2
3
5
7
10
13
16
20
23
28
32
38
43
49
55
61
68
29
Teste de Wilcoxon
Exemplo (fictício): Para estimar a área plantada ... pode concluir?
Região
Área corretamente
classificada
Dif
Posto
1 imagem
2 imagens
1
70
117
47
8
2
51
48
-3
-2,5
3
60
63
3
2,5
4
57
90
33
7
5
43
41
-2
-1
6
15
21
6
4
7
25
36
11
5
8
103
122
19
6
Tobs = 3,5
a)
Calculam-se as diferenças
b)
Obtém-se os postos das diferenças em
módulo, desprezando-se as diferenças
nulas. Para diferenças repetidas, são
atribuídos postos médios
c)
H1: T(+) > T(-)
Agregam-se os sinais das diferenças aos
respectivos postos
d)
Calcula-se a menor soma dos postos de
mesmo sinal
e)
H0 : T(+) = T(-)
Tcrít 5% = 6
Procedimento:
Não há diferença no uso de 2 imagens
A segunda imagem melhora a classificação
Conclusão: rejeita-se H0, ou seja, a inclusão
de uma nova imagem melhora o desempenho
do classificador a 5% de significância
Compara-se o valor obtido com o valor
crítico (tabelado). Se valor observado for
igual ou menor que o tabelado, rejeita-se
H0. Caso contrário, aceita-se H0.
30
Teste de Wilcoxon
OBSERVAÇÕES:
- Este teste é mais poderoso que o Teste dos Sinais, pois permite atribuir
maior peso aos pares com maiores diferenças (o Teste dos Sinais considera
apenas o sentido da mudança)
- É equivalente ao teste paramétrico t pareado
- Para grandes amostras (n > 25), a estatística T pode ser aproximada para
uma normal. Nesse caso, utiliza-se a estatística z:
0,14
z
T  T
T

N ( N  1)
T
4
N ( N  1)(2 N  1)
24
N (0,1)
0,12
Teste Bilateral
0,1
0,08

2
0,06
0,04

2
1
0,02
0
0
-
5
rejeição
de H0
-zcrít 0
10
aceitação
de H0
zcrít
15
+
rejeição
de H0
20
31
Teste de Independência
Exemplo (fictício): Algumas espécies de pássaro ocupam diferentes ambientes
dentro da floresta. A fim de comprovar se algumas espécies de uma família de
pássaros têm esta característica, durante um ano, um pesquisador identificou e
contou os pássaros capturados em 3 diferentes ambientes da floresta. Os
resultados encontram-se na tabela a seguir. O que se pode concluir? Podemos
afirmar que algumas espécies desta família se distribuem preferencialmente em
algum ambiente?
Espécie
I
II
III
IV
Total
Interior
5
1
34
26
66
Ambiente
Borda
2
4
2
3
11
Clareira
21
3
3
1
28
Total
28
8
39
30
105
pi = probabilidade de encontrar a espécie i em qualquer ambiente
pj = probabilidade de encontrar qualquer espécie no ambiente j
H0 : pij = pi * pj
H1: pij  pi * pj
as espécies não têm preferência por um ambiente específico
as espécies ocupam preferencialmente um determinado ambiente
43
Teste de Independência
Observado
Exemplo (fictício): Algumas espécies de pássaro ... em algum ambiente?
Espécie
I
II
III
IV
Total
Interior
5
1
34
26
66
Ambiente
Borda
2
4
2
3
11
Clareira
21
3
3
1
28
Total
28
8
39
30
105
Se H0 é verdadeira, então
Esperado
Espécie
I
II
III
IV
Total
Interior
?
66
Ambiente
Borda
Clareira
11
28
Total
28
8
39
30
105
H0 : pij = pi * pj
H1: pij  pi * pj
28 66
28*66
*
*105 
105 105
105
pˆ i
pˆ j
44
Teste de Independência
Observado
Exemplo (fictício): Algumas espécies de pássaro ... em algum ambiente?
Espécie
I
II
III
IV
Total
Interior
5
1
34
26
66
Ambiente
Borda
2
4
2
3
11
Clareira
21
3
3
1
28
Total
28
8
39
30
105
H0 : pij = pi * pj
H1: pij  pi * pj
l
c

 FAObsij  FAEspij 
i 1 j 1
FAEspij
Se H0 é verdadeira, então
Esperado
Espécie
I
II
III
IV
Total
Interior
17,60
5,03
24,51
18,86
66
Ambiente
Borda
2,93
0,84
4,09
3,14
11
Clareira
7,47
2,13
10,40
8,00
28
~ ?2(l 1)(c1)
2
l = no linhas
c = no colunas
(2l 1)(c1)
Total
28
8
39
30
105
2

X crít
0
aceitação
de H0
+
rejeição
de H0
45
Teste de Independência
Observado
Exemplo (fictício): Algumas espécies de pássaro ... em algum ambiente?
Espécie
I
II
III
IV
Total
Interior
5
1
34
26
66
Ambiente
Borda
2
4
2
3
11
Clareira
21
3
3
1
28
Total
28
8
39
30
105
H0 : pij = pi * pj
H1: pij  pi * pj
l
c

 FAObsij  FAEspij 
i 1 j 1
Se H0 é verdadeira, então
Esperado
Espécie
I
II
III
IV
Total
4
3
X  
2
i 1 j 1
Interior
17,60
5,03
24,51
18,86
66
Ambiente
Borda
2,93
0,84
4,09
3,14
11
 FAObs
ij  FAEspij 
FAEspij
2
Clareira
7,47
2,13
10,40
8,00
28
~ ?2(l 1)(c1)
2
62
Total
28
8
39
30
105
FAEspij
2
 = 0,05
0
2
? +
XXcrít
crít12,59
Conclusão:
 68,19 rejeita-se H0 a 5%, ou seja, as espécies não
ocupam a floresta independentemente do
ambiente (há uma preferência de cada espécie) 46
Teste de Independência
OBSERVAÇÕES:
- Para l = c = 2, ou seja, para tabelas de contingência 2x2, usa-se a estatística
2
A
B
A+B
C
D
C+D
A+C
B+D
N
N

N  AD  BC  
2

X2 
~ 12
( A  B)(C  D)( A  C )( B  D)
onde N = A + B + C + D ;
- Só pode ser aplicado quando no máximo 20% dos valores esperados sejam
menores que 5 e nenhum seja inferior a 1; e
- Este teste não é sensível ao ordenamento das classes.
47
Teste de Kolmogorov-Smirnov (2 amostras)
Exemplo: Um pesquisador deseja saber se duas regiões de uma mesma imagem apresentam
a mesma distribuição de valores (desconhecida). Para testar esta hipótese, amostrouse 15 pontos independentes de cada região. Os valores observados são apresentados
na tabela abaixo. O que se conclui a partir destes valores?
Região A
81
78
61
89
69
58
64
84
89
83
88
56
87
95
75
Região B
56
55
76
54
83
97
85
66
78
80
61
69
71
55
91
OBS: Apesar de nA = nB = n, os valores são independentes entre
si (não são dados pareados)
48
Teste de Kolmogorov-Smirnov (2 amostras)
Exemplo: Um pesquisador deseja saber se duas regiões de uma mesma imagem apresentam
a mesma distribuição de valores (desconhecida). Para testar esta hipótese, amostrouse 15 pontos independentes de cada região. Os valores observados são apresentados
na tabela abaixo. O que se conclui a partir destes valores?
Valor FRAA FRAB
Região A
81
78
61
89
69
58
64
84
89
83
88
56
87
95
75
Região B
56
55
76
54
83
97
85
66
78
80
61
69
71
55
91
54
0
1/15
55
0
3/15
56
1/15
4/15
58
2/15
4/15
61
3/15
5/15
64
4/15
5/15
66
4/15
6/15
69
5/15
7/15
71
5/15
8/15
75
6/15
8/15
76
6/15
9/15
78
7/15
10/15
80
7/15
11/15
81
8/15
11/15
83
9/15
12/15
84
10/15
12/15
85
10/15
13/15
87
11/15
13/15
88
12/15
13/15
89
14/15
13/15
91
14/15
14/15
95
15/15
14/15
97
15/15
15/15
Procedimento:
a) Organiza-se uma lista ordenada com todos os
valores de ambas regiões (valores repetidos
aparecem apenas uma vez)
b) Calcula-se a Frequência Relativa Acumulada
de cada valor para cada região
49
Teste de Kolmogorov-Smirnov (2 amostras)
Exemplo: Um pesquisador deseja saber se duas regiões de uma mesma imagem apresentam
a mesma distribuição de valores (desconhecida). Para testar esta hipótese, amostrouse 15 pontos independentes de cada região. Os valores observados são apresentados
na tabela abaixo. O que se conclui a partir destes valores?
Valor FRAA FRAB
|Dif|
54
0
1/15
1/15
55
0
3/15
3/15
56
1/15
4/15
3/15
58
2/15
4/15
2/15
61
3/15
5/15
2/15
64
4/15
5/15
1/15
66
4/15
6/15
2/15
69
5/15
7/15
2/15
71
5/15
8/15
3/15
75
6/15
8/15
2/15
76
6/15
9/15
3/15
78
7/15
10/15
3/15
80
7/15
11/15
4/15
81
8/15
11/15
3/15
83
9/15
12/15
3/15
84
10/15
12/15
2/15
85
10/15
13/15
3/15
87
11/15
13/15
2/15
88
12/15
13/15
1/15
89
14/15
13/15
1/15
91
14/15
14/15
0
95
15/15
14/15
1/15
97
15/15
15/15
0
Dobs = 4/15
KDobs = 4
H0 : As duas amostras
provêem da mesma
população
H1: As duas amostras
provêem de populações
diferentes (bilateral)
Procedimento:
a) Organiza-se uma lista ordenada com todos os
valores de ambas regiões (valores repetidos
aparecem apenas uma vez)
b) Calcula-se a Frequência Relativa Acumulada
de cada valor para cada região
c) Calcula-se a diferença, em módulo, das
Frequências Relativas Acumuladas de cada
valor
d) Identifica-se a maior diferença relativa (Dobs)
e/ou o seu numerador (KDobs), considerando
que o denominador é igual a n (= nA = nB).
e) Compara-se o valor obtido com o valor crítico
(tabelado). Se valor observado for igual ou
maior que o tabelado, rejeita-se H0. Caso
contrário, aceita-se H0.
50
Valores Críticos de KD para o Teste KS (2 amostras)
Unilateral
Bilateral
n
(n1 = n2)  = 0,05  = 0,01  = 0,05  = 0,01
3
3
4
4
4
5
4
5
5
5
6
5
6
5
6
7
5
6
6
6
8
5
6
6
7
9
6
7
6
7
10
6
7
7
8
11
6
8
7
8
12
6
8
7
8
13
7
8
7
9
14
7
8
8
9
15
7
9
8
9
16
7
9
8
10
17
8
9
8
10
n > 40
Unilateral
  0, 005
1, 63
n1  n2
n1n2
Unilateral
Bilateral
n
(n1 = n2)  = 0,05  = 0,01  = 0,05  = 0,01
18
8
10
9
10
19
8
10
9
10
20
8
10
9
11
21
8
10
9
11
22
9
11
9
11
23
9
11
10
11
24
9
11
10
12
25
9
11
10
12
26
9
11
10
12
27
9
12
10
12
28
10
12
11
13
29
10
12
11
13
30
10
12
11
13
35
11
13
12
14
40
11
14
13
15
  0, 01
1,52
n1  n2
n1n2
  0, 025
1,36
n1  n2
n1n2
  0, 05
1, 22
n1  n2
n1n2
51
Teste de Kolmogorov-Smirnov (2 amostras)
Exemplo: Um pesquisador deseja saber se duas regiões de uma mesma imagem apresentam
a mesma distribuição de valores (desconhecida). Para testar esta hipótese, amostrouse 15 pontos independentes de cada região. Os valores observados são apresentados
na tabela abaixo. O que se conclui a partir destes valores?
Valor FRAA FRAB
|Dif|
54
0
1/15
1/15
55
0
3/15
3/15
56
1/15
4/15
3/15
58
2/15
4/15
2/15
61
3/15
5/15
2/15
64
4/15
5/15
1/15
66
4/15
6/15
2/15
69
5/15
7/15
2/15
71
5/15
8/15
3/15
75
6/15
8/15
2/15
76
6/15
9/15
3/15
78
7/15
10/15
3/15
80
7/15
11/15
4/15
81
8/15
11/15
3/15
83
9/15
12/15
3/15
84
10/15
12/15
2/15
85
10/15
13/15
3/15
87
11/15
13/15
2/15
88
12/15
13/15
1/15
89
14/15
13/15
1/15
91
14/15
14/15
0
95
15/15
14/15
1/15
97
15/15
15/15
0
Dobs = 4/15
KDobs = 4
H0 : As duas amostras
provêem da mesma
população
H1: As duas amostras
provêem de populações
diferentes (bilateral)
KDcrít 5% = 8
Conclusão: aceita-se H0, ou
seja, as duas amostras
provêem da mesma
população, adotando-se
5% de significância
Procedimento:
a) Organiza-se uma lista ordenada com todos os
valores de ambas regiões (valores repetidos
aparecem apenas uma vez)
b) Calcula-se a Freqüência Relativa Acumulada
de cada valor para cada região
c) Calcula-se a diferença, em módulo, das
Freqüências Relativas Acumuladas de cada
valor
d) Identificar a maior diferença relativa (Dobs)
e/ou o seu numerador (KDobs), considerando
que o denominador é igual a n (= nA = nB).
e) Compara-se o valor obtido com o valor crítico
(tabelado). Se valor observado for igual ou
maior que o tabelado, rejeita-se H0. Caso
contrário, aceita-se H0.
52
Teste de Kolmogorov-Smirnov (2 amostras)
OBSERVAÇÕES:
- para amostras pequenas com n1  n2, deve-se buscar tabelas específicas
para encontrar os valores críticos (http://www.jstor.org/stable/2285616)
- para amostras grandes, pode-se definir um número arbitrário de intervalos
para os quais serão calculadas as freqüências relativas acumuladas de cada
grupo (utilizar tantos intervalos quanto possível)
53