Teste de hipóteses
Aula 06
Prof. Christopher Freire Souza
Centro de Tecnologia
Universidade Federal de Alagoas
www.ctec.ufal.br/professor/cfs
2
Christopher Souza: Teste
de hipóteses
Objetivos
• Desenvolver habilidades para inferir o
comportamento da população a partir de dados
de uma amostra
• Desenvolver habilidades para inferir se o
comportamento de duas populações diferem a
partir de dados de duas amostras
• Desenvolver habilidades para estimar o poder de
um teste em rejeitar uma hipótese
3
Christopher Souza: Teste
de hipóteses
Relevância do conteúdo
• Definição e avaliação de hipóteses são o cerne de estudos
científicos
• Testes de hipóteses trazem o respaldo matemático para
apoiar afirmações sobre o comportamento da população
em estudo
4
Christopher Souza: Teste
de hipóteses
Conteúdo
• Fundamentos de testes de hipóteses
• Testes sobre uma população
• Testes sobre duas populações
5
Christopher Souza: Teste
de hipóteses
Fundamentos de testes de
hipóteses
•
•
•
•
•
•
•
•
Hipótese
Hipótese nula e alternativa
Estatística de teste
Valor crítico
Valor p
Decisões e conclusões
Erro do tipo I e do tipo II
Poder de um teste
6
Christopher Souza: Teste
de hipóteses
Hipótese: nula e alternativa
• Em estatística, hipótese é uma afirmação sobre
uma propriedade da população
• Teste de hipótese: teste da afirmação
• Hipótese nula: afirmação em que o valor de um
parâmetro é comparado a um valor específico
▫ H0: m=m0
• Hipótese alternativa: afirmação que se deseja
testar
▫ H1: m≠m0, H1: m>m0, H1: m<m0
7
Christopher Souza: Teste
de hipóteses
Estatística de teste
• Valor usado para tomar decisão sobre a hipótese
nula (rejeitá-la ou não)
• Estimativa pela conversão da estatística
amostral em um escore (z, t, c², F), a partir da
suposição de que a hipótese nula seja verdadeira
8
Christopher Souza: Teste
de hipóteses
Região crítica
• Conjunto de todos os valores da estatística que
podem nos fazer rejeitar a hipótese nula
• Definição a partir da escolha do valor crítico,
assim como estimado no estudo de intervalos de
confiança
9
Christopher Souza: Teste
de hipóteses
Intervalos de confiança
“Estamos 95% confiantes de que o
intervalo qˆ ± E contém o valor de q”
10
Christopher Souza: Teste
de hipóteses
Intervalos de confiança
(proporção)
• Requisitos:
▫ Amostra aleatória simples.
▫ Condições para a distribuição
binomial satisfeitas.
▫ Haver pelo menos 5 sucessos População
e 5 fracassos, o que permite
Margem de
aproximar pela distribuição
Erro
normal
• Associa-se um grau de
confiança, e.g. 95%, de que o
valor do parâmetro de
proporção esteja inserido no
intervalo construído a partir
da proporção amostral
Tamanho da
Amostra
Infinita
Finita
11
Christopher Souza: Teste
de hipóteses
Intervalos de confiança
(m, para s conhecido)
• Requisitos:
▫ Amostra aleatória simples.
▫ Teorema do limite central
(Normal se não houver
outlier e histograma ~ forma
de sino)
• Associa-se um grau de
confiança, e.g. 95%, de que o
valor do parâmetro de média
esteja inserido no intervalo
construído a partir da média
amostral
População
Margem de
Erro
Tamanho da
Amostra
Infinita
Finita
12
Christopher Souza: Teste
de hipóteses
Intervalos de confiança
(m, para s desconhecido)
• Requisitos:
▫ Amostra aleatória simples.
▫ Teorema do limite central
(Normal se não houver
outlier e histograma ~ forma
de sino)
• Associa-se um grau de
confiança, e.g. 95%, de que o
valor do parâmetro de média
esteja inserido no intervalo
construído a partir da média
amostral
• Margem de Erro
▫ População infinita
▫ População finita
13
Christopher Souza: Teste
de hipóteses
Intervalos de confiança (s²)
• Requisitos:
▫ Amostra aleatória simples.
▫ Distribuição normal mesmo
para grandes amostras
• Associa-se um grau de
confiança, e.g. 95%, de que o
valor do parâmetro de
variância esteja inserido no
intervalo construído a partir
da variância amostral
• Estima-se desvio amostral a
partir da raiz da estimativa do
parâmetro de variância
14
Christopher Souza: Teste
de hipóteses
Valor P
• Probabilidade de obter, no mínimo, um valor da
estatística teste tão extremo quanto o valor representado
pela amostra
• Obtenção de magnitude do valor P permite a decisão de
rejeitar ou não a hipótese nula sem definir a priori o
valor crítico
• Rejeitar ou não a hipótese depende da ponderação sobre
o que se considera crítico e sua relação com o valor P
• Em testes bilaterais, dobra-se a área estimada com a
estatística de teste para um dos lados para avaliar se
rejeita a hipótese nula (P>a)
15
Christopher Souza: Teste
de hipóteses
Decisão e conclusões
• Teste da hipótese nula permite:
▫ Rejeitá-la
▫ Deixar de a rejeitar
• Se afirmativa original contiver igualdade e for rejeitada, pode se
concluir que:
▫ Há evidência suficiente para garantir a rejeição de H0
• Senão
▫ Não há evidência suficiente para garantir a rejeição de H0
• Se afirmativa original não contiver igualdade (H1) e a hipótese nula
for rejeitada, pode se concluir que:
▫ Os dados amostrais apóiam a afirmativa de que H1
• Senão
▫ Não há evidência amostral suficiente para apoiar H1
16
Christopher Souza: Teste
de hipóteses
Erros
• Tipo I (a)
▫ Rejeitar H0 quando deveria
ser aceita
• Tipo II (b)
▫ Não rejeitar H0 quando
deveria ser rejeitada
• Controle de erros: a, b e n
estão relacionados
17
Christopher Souza: Teste
de hipóteses
Investigações sobre Erro do tipo I
• Supondo:
▫
▫
▫
▫
a = 0,05
s = 0,0625
n = 64
Ho: p=0,5
• Tem-se:
▫ za/2=1,96
▫ pa/2=0,5  0,1225
• Se utilizarmos a=0,01
▫ za/2=2,575
▫ pa/2=0,5  0,1609
• Se utilizarmos n=100
▫
▫
▫
▫
a = 0,05
s = 0,05
za/2=1,96
pa/2=0,5  0,098
18
Christopher Souza: Teste
de hipóteses
Investigações sobre Erro do tipo II
• Supondo:
▫
▫
▫
▫
▫
▫
a = 0,05
n = 64
s = 0,0625
Ho: p=0,5
pa/2=0,5  0,1225
Ha: p=0,7
• Tem-se:
▫ z1 = (0,5-0,1225-0,7) / 0,0625
= -5,16
▫ z2= (0,5+0,1225-0,7)/ 0,0625
= -1,24
▫ b=0,107488
• Se utilizarmos H1: p=0,55
▫ z1=(0,5-0,1225-0,55) /
0,0625 = -2,76
▫ z2= (0,5+0,1225-0,55)/
0,0625 = 1,16
▫ b=0,877-0,0029=0,8741
• Se utilizarmos n=100
▫ z1 = (0,5-0,098-0,7) / 0,05 = 5,96
▫ z2= (0,5+0,098-0,7)/ 0,05 = 2,04
▫ b=0,0207
19
Christopher Souza: Teste
de hipóteses
Investigações sobre Erro do tipo II
• Supondo:
▫
▫
▫
▫
▫
▫
a = 0,05
n = 64
s = 0,0625
Ho: p=0,5
pa/2=0,5  0,1225
H1: p=0,7
• Tem-se:
▫ z1 = (0,5-0,1225-0,7) / 0,0625
= -5,16
▫ z2= (0,5+0,1225-0,7)/ 0,0625
= -1,24
▫ b=0,107488
• Se utilizarmos a=0,01
▫ z1=(0,5-0,1609-0,7) / 0,0625
= -5,77
▫ z2= (0,5+0,1609-0,7)/ 0,0625
= -0,625
▫ b=0,266
20
Christopher Souza: Teste
de hipóteses
Resumo de investigações
• Quando n aumenta, os dois
erros diminuem
• Quando a diminui, b aumenta
• Erro tipo II mais provável se
Ha se aproxima de H0
• Maior interesse em detectar
grandes diferenças entre
valores supostos (H0) e
verdadeiros (Ha)
pa/2
n
a
b,p=0,7
b,p=0,55
0,5  0,1225
64
5%
0,107488
0,8741
0,5  0,1609
64
1%
0,266
0,5  0,098
100
5%
0,0207
21
Christopher Souza: Teste
de hipóteses
Poder de um teste
• Poder de apoiar uma hipótese
alternativa verdadeira (1-b).
22
Christopher Souza: Teste
de hipóteses
Testes de hipóteses sobre uma
população
Método tradicional
Valor P
• Comparação de estatística de
teste, z, t ou c², com valor
crítico para o nível de
confiança
• Estatística de teste é estimada
como visto nas distribuições
de estatísticas amostrais,
normal para médias, t e c²,
• Avaliação de significância da
área sob a curva estimada a
partir da estatística de teste e
da distribuição do parâmetro
populacional definido na
hipótese nula
• MATLAB: ztest, ttest, vartest
23
Christopher Souza: Teste
de hipóteses
Testes de hipóteses sobre uma
população
• Método do intervalo de confiança
▫ Comparação de intervalos de confiança com
parâmetro em avaliação na hipótese nula para o
nível de significância
▫ Em testes unilaterais, o intervalo de confiança é
construído para nível de confiança de 1-2a
▫ Se parâmetro em avaliação na hipótese nula
estiver fora do intervalo, rejeita-se a hipótese nula
24
Christopher Souza: Teste
de hipóteses
Amostra não-normal
• Uma hipótese (a ser testada):
▫ Estatística de teste = valor obtido da amostra
original
▫ Se distribuição de estatísticas amostrais, seguir
normal, t ou c², valor crítico estimado como antes
▫ (Dúvida:) Intervalo de confiança da estatística de
teste pode ser estimado via bootstrap?
25
Christopher Souza: Teste
de hipóteses
Inferências sobre duas proporções
• Requisitos:
▫ Amostras aleatórias simples.
▫ Condições para a distribuição
binomial satisfeitas.
▫ Haver pelo menos 5 sucessos
e 5 fracassos em cada
amostra, o que permite
aproximar pela distribuição
normal
• Proporção amostral
combinada:
• Estatística de teste:
• Estimativa de intervalo de
confiança
26
Christopher Souza: Teste
de hipóteses
Inferências sobre duas médias
Amostras independentes, s conhecido
• Requisitos:
• Estatística de teste:
▫ Amostras aleatórias simples.
▫ Distribuições normais ou
n>30
• Sugestão:
▫ Analise preliminarmente as
amostras
• Estimativa de intervalo de
confiança
27
Christopher Souza: Teste
de hipóteses
Inferências sobre duas médias
Amostras independentes, s desconhecido
• Requisitos:
• Estatística de teste:
▫ Amostras aleatórias simples.
▫ Distribuições normais ou
n>30
• Sugestão:
▫ Analise preliminarmente as
amostras
• Para identificar valores
críticos:
• Estimativa de intervalo de
confiança
• MATLAB: ttest2
28
Christopher Souza: Teste
de hipóteses
Inferências sobre duas médias
Amostras emparelhadas, s desconhecido
• Requisitos:
• Estatística de teste:
▫ Amostras aleatórias simples.
▫ Distribuições normais ou
n>30
• Sugestão:
▫ Analise preliminarmente as
amostras
• Dados trabalhados como
diferenças de valores
emparelhados (d)
• Estimativa de intervalo de
confiança
• MATLAB: ttest2
29
Christopher Souza: Teste
de hipóteses
Inferências sobre duas variâncias
• Requisitos:
• Estatística de teste:
▫ Amostras aleatórias simples.
▫ Populações independentes
▫ Distribuição normal
• std1>std2
• MATLAB: vartest2
30
Christopher Souza: Teste
de hipóteses
Inferências sobre duas variâncias
• Método Conte Cinco
▫ Não requer distribuição
normal
▫ Tamanhos amostrais iguais
▫ Se uma das amostras têm
pelo menos cinco dos maiores
desvios médios absolutos, sua
população tem uma maior
variância
• Teste de Levene-BrownForsythe
▫ Transforma-se cada conjunto
de dados por meio da
subtração de cada dado por
sua mediana
▫ Em seguida, aplica-se o teste
t para duas populações
31
Christopher Souza: Teste
de hipóteses
Testes não-paramétricos
Vantagens
Desvantagens
• Não exigem que a distribuição
seja normal
• São aplicáveis a dados
categóricos (qualitativos)
• Cálculos mais simples
• Desperdiçam informação por
tratarem dados de forma
qualitativa
• Menor eficiência dos testes
32
Christopher Souza: Teste
de hipóteses
Eficiência
Teste não-paramétrico vs paramétrico (população normal)
Aplicação
Paramétrico
Pares combinados t ou z
Nãoparamétrico
Eficiência
Sinais
0,63
Postos com sinais
de Wilcoxon
0,95
Duas amostras
independentes
t ou z
Soma de postos
de Wilcoxon
0,95
Várias amostras
independentes
F
Kruskal-Wallis
0,95
Correlação
Correlação linear
Correlação de
postos
0,91
Aleatoriedade
-
Seqüências
-
33
Christopher Souza: Teste
de hipóteses
Postos
• Número atribuído a um item
da amostra de acordo com sua
posição na lista ordenada.
• Em caso de empates, aplica-se
a média dos postos como valor
de posto de cada item com
igual valor
•
•
•
•
•
Ex:
x: [12 10 5 5 4 5 11 12]
xo: [4 5 5 5 10 11 12 12]
io: [1 3 3 3 5 6 7,5 7,5]
i: [7,5 5 3 3 1 3 6 7,5]
34
Christopher Souza: Teste
de hipóteses
Testes não-paramétricos
• Sinais
▫ Igualdade de medianas
(pareado)
▫ Proporção = 50%
▫ Mediana de uma população
• Soma de Postos de Wilcoxon
(igualdade de medianas)
▫ Pareado
▫ Homogeneidade – MannWhitney
• Kruskal-Wallis – igualdade de
medianas de três ou mais
populações
• Sequências - Inflexões
(Aleatoriedade)
• Wald-Wolfowitz
(Independência)
• Correlação de Spearman
▫ Significância da correlação
▫ Estacionariedade da série
• Pettitt (Quebra de tendência)
• Grubbs e Beck (Outlier)
35
Christopher Souza: Teste
de hipóteses
Teste dos sinais
Pares combinados (igualdade de medianas)
• Procedimento:
▫ Subtrair cada valor da
segunda variável pelo
correspondente na primeira
▫ Posições de diferenças nulas
são excluídas
▫ Série constituída apenas por
sinais de diferenças
• Fundamento:
▫ Se medianas são iguais,
número de sinais positivos e
negativos são iguais
• Estatística de teste:
• p/ n≤25: x
• p/ n>25:
• Valor crítico:
• p/ n≤25, buscar x na tabela A7 do Triola
• p/ n>25, buscar z na tabela A2 do Triola
• MATLAB: signtest
36
Christopher Souza: Teste
de hipóteses
Teste dos sinais
Dados nominais (Proporção = 50%)
• Requisitos
▫ Amostra aleatória
• Fundamento: teste de
freqüência de sinais
▫ x = número de vezes que
ocorreu sinal menos
freqüente
▫ n = número de sinais
positivos e negativos
combinados
• Cuidado:
▫ Se dados contradizem H1
nem aplica teste, pois deixa
de fazer sentido o teste
• Estatística de teste:
• p/ n≤25: x
• p/ n>25:
• Valor crítico:
• p/ n≤25, buscar x na tabela A7 do Triola
• p/ n>25, buscar z na tabela A2 do Triola
37
Christopher Souza: Teste
de hipóteses
Teste dos sinais
Mediana de uma população
• Procedimento:
▫ Subtrair cada valor da
amostra do valor da mediana
sugerida em H0
▫ Posições de diferenças nulas
são excluídas
▫ Série constituída apenas por
sinais de diferenças
• Estatística de teste:
• p/ n≤25: x
• p/ n>25:
• Valor crítico:
• p/ n≤25, buscar x na tabela A7 do Triola
• p/ n>25, buscar z na tabela A2 do Triola
• MATLAB: signtest
38
Christopher Souza: Teste
de hipóteses
Soma de postos de Wilcoxon
Diferença de amostras emparelhadas
• Requisito:
▫ Diferenças tem distribuição
aproximadamente simétrica.
• a=soma de valores absolutos
dos postos negativos das
diferenças d não-nulas (51)
• b=soma dos postos positivos
das diferenças d não-nulas (15)
• T=min(a,b)
• Estatística de teste:
• p/ n≤30: T (tab. A-8 para Ta)
• p/ n>30:
Reg.
Sec.
d
Postos
Sinais
1903
2009
-106
10
-10
1935
1915
20
1
1
1910
2011
-101
9
-9
2496
2463
33
3
3
2108
2180
-72
8
-8
1961
1925
36
4
4
2060
2122
-62
6
-6
1444
1482
-38
5
-5
1612
1542
70
7
7
1316
1443
-127
11
-11
1511
1535
-24
2
-2
39
Soma de postos de
Wilcoxon
Duas amostras independentes
• Requisito:
▫ n>10 para cada amostra
• Trabalha também dados ordinais
• Equivale a Mann-Whitney
• R=soma dos postos de uma das
amostras
• Estatística de teste:
• Onde:
• MATLAB: ranksum
Christopher Souza: Teste
de hipóteses
Homens
Mulheres
Posto
IMC
IMC
Posto
11,5
23,8
19,6
2,5
9
23,2
23,8
11,5
14
24,6
19,6
2,5
17
26,2
29,1
22
10
23,5
25,2
15,5
13
24,5
21,4
5
6
21,5
22,0
7
24
31,4
27,5
19
18
26,4
33,5
25
8
22,7
20,6
4
20
27,8
29,9
23
21
28,1
17,7
1
15,5
25,2
R1=187
n1=13
n1=12
R2=138
40
Kruskal-Wallis
Christopher Souza: Teste
de hipóteses
Igualdade de medianas de três
ou mais populações
• Requisito:
▫ n>5 para cada amostra
• H ~ c²k-1
• Equivale a ANOVA
• H grande para amostras
muito diferentes (teste
unilateral à direita)
• R=soma dos postos de uma
das amostras
• Estatística de teste:
• Onde:
• Para corrigir H em função do
número de empates, divida H
por
• Onde (m = número de valores
com empates e ti é o número
de observações empatadas no
próprio grupo):
• Valor crítico estimado via c²k-1
• MATLAB: kruskalwallis
41
Sequências
Christopher Souza: Teste
de hipóteses
Aleatoriedade
• Sequência: sucessão de dados
com mesma característica
• Ex.: valores acima ou abaixo da
mediana
• Trabalha também dados
ordinais
• G=número de sequências na
amostra
• Aleatoriedade definida se
0<<G<<n
• Estatística de teste:
▫ G, se n1<20 e n2<20 e a=0,05
▫ senão,
• onde
▫ n1 e n2 representam número
de valores de mesma
característica
• Para G como estatística de
teste, compare com valores
críticos apresentados na tabela
A-10 do Triola
• MATLAB: runstest
42
Wald-Wolfowitz
Christopher Souza: Teste
de hipóteses
Independência
• Séries aleatórias podem não ser
independentes
• Influência de contribuições
subterrâneas às vazões de rio
resulta em maior dependência
para intervalos menores de
discretização
• Para tanto, calcula-se:
• Estatística de teste:
• onde
43
Christopher Souza: Teste
de hipóteses
Significância de correlação de
postos de Spearman
• H0: rs=0
• H1: rs≠0
• Estatística de teste:
▫ Se não houver empate para
um mesmo conjunto de
dados:
▫ Se houver empate:
• Valores críticos:
▫ Se n≤30, use tabela A-9 do
Triola
▫ Senão,
44
Christopher Souza: Teste
de hipóteses
Estacionariedade
• Teste de correlação de
Spearman entre postos de
dados e suas respectivas
posições na série
45
Christopher Souza: Teste
de hipóteses
Teste de Grubbs e Beck
Identificação de outliers
• Limites para consideração de
outliers são estimados por:
▫ Limite superior
▫ Limite inferior
▫ onde
Download

Slide 1 - Universidade Federal de Alagoas