Testes de
Hipóteses
Testes de hipóteses
• Testes paramétricos
• Testes não paramétricos
Testes paramétricos
Requisitos
O primeiro requisito para utilizar a estatística paramétrica exige que seja possível
realizar operações numéricas sobre os dados experimentais. Não é suficiente que
se possa apenas ordenar os dados, como nos testes paramétricos. As variáveis
devem ser naturalmente numéricas, como uma escala contínua de tempos de
leitura, ou a nota de um exame.
O segundo requisito obriga a que os resultados se distribuam normalmente. No
entanto, como os testes paramétricos são bastante robustos, podem ser utilizados
mesmo quando este pressuposto é violado, a menos que os dados tenham uma
distribuição muito diferente da normal.
O terceiro requisito designa-se por homogeneidade da variância. Isto significa que
a variabilidade dos resultados em cada situação deve ser sensivelmente a mesma.
No entanto, este requisito perde a relevância se o número de sujeitos for o mesmo
em cada situação experimental.
Testes não paramétricos
Os testes não paramétricos não necessitam de requisitos tão fortes,
como os testes paramétricos, para serem utilizados. São úteis em
situações em que as amostras são pequenas, e onde a distância a
esses requisitos é grande.
A desvantagem destes testes, face aos testes paramétricos, é não
encontrarem tantas diferenças entre os dados, quando elas
realmente existem.
Testes paramétricos
Testes t
Testes t
Numa dada situação de teste, a variabilidade total dos resultados é
igual à variabilidade devida às variáveis independentes mais a
variabilidade devida a variáveis desconhecidas. A esta última dá-se
o nome de erro.
Um investigador deseja, naturalmente, que uma grande proporção da
variabilidade total dos resultados seja devida à manipulação das
variáveis independentes, enquanto uma proporção relativamente
pequena seja devida a outras variáveis (erro).
Testes t
As proporções destas variabilidades podem ser expressas como um
rácio.
Variabilidade prevista pelas variáveis independentes
Variabilidade devida ao erro
Se a percentagem de probabilidades de obter um determinado rácio
devido ao acaso for baixa (5% ou 1%), a hipótese nula pode ser
rejeitada e os resultados da investigação podem ser interpretados
como suportando as previsões efectuadas pela hipótese de teste.
Testes t
A Hipótese de Teste
A primeira coisa que é necessário que aconteça numa hipótese de
teste é que ela preveja uma relação entre dois, ou mais,
acontecimentos.
Exemplo 1: “O saldo médio dos clientes do Norte é superior ao saldo médio
dos clientes do Sul.”
Exemplo 2: “O volume de empréstimos bancários diminui em épocas de crise
económica.”
Tais factos são conhecidos como variáveis porque variam na situação
de teste.
A Hipótese de Teste
Um aspecto particularmente importante a considerar, de forma a que
se possa testar uma hipótese de teste, é o de que os efeitos
previstos possam ocorrer ou não ocorrer.
Tendo em consideração os exemplos anteriores, deve ser possível:
1.
2.
Observar-se uma diferença nos saldos dos clientes do Norte e do Sul, ou não.
Observar-se uma diferença nos volumes de empréstimos bancários, em épocas
de crise económica face a épocas de crescimento, ou não.
Esta é a regra básica em investigação: Se não existe a possibilidade
de um teste rejeitar a hipótese de teste, então não existe qualquer
interesse em realizar o teste.
A Hipótese Nula
Em consequência, uma hipótese de teste tem que ser sempre testada
em função de uma hipótese nula, a qual indica que o investigador
não encontrará os resultados de teste que espera.
Segundo a hipótese nula, quaisquer resultados obtidos num teste são
devidos a flutuações ocasionais e não aos efeitos previstos da
variável em que o investigador está interessado.
Nos nossos exemplos, a hipótese nula afirma que:
1.
2.
Não há diferença nos saldos dos clientes do Norte e do Sul.
Não há diferença nos volumes de empréstimos bancários, em épocas de crise
económica face a épocas de crescimento.
Identificação de variáveis
Numa situação de teste deparamos com variáveis de duas ordens
diferentes:
Variáveis independentes – São as que definem as situações
ou categorias a testar.
Variáveis dependentes – São aquelas cujos valores são
avaliados e comparados durante
o teste.
Nos nossos exemplos:
1.
2.
Variável independente: região (Norte ou Sul); variável dependente: saldo.
Variável independente: época (crise ou crescimento); variável dependente:
empréstimos bancários.
Situações de teste
Nos testes de hipóteses podemos deparar com duas situações de teste:
Dados não relacionados – Quando as categorias da variável
dependente, definidas pela variável
independente, provêm de indivíduos
ou situações distintas.
Dados relacionados – Quando os indivíduos ou situações em
estudo nas diversas categorias são
os mesmos.
Nos nossos exemplos:
1.
2.
Não relacionados, pois os indivíduos são distintos nas duas categorias (clientes
do Norte e clientes do Sul).
Relacionados, pois os clientes são os mesmos nas duas situações de teste (crise
e crescimento económico).
Procedimento
O procedimento seguinte é comum a todos os testes de hipóteses:
•
Formular a hipótese de teste em termos dos resultados previstos face aos
valores de uma determinada variável independente.
•
Implicitamente, a hipótese nula postula que os resultados da investigação são
devidos, não aos efeitos previstos pela hipótese de teste, mas a diferenças
aleatórias de outras variáveis irrelevantes.
•
Decida qual o teste estatístico apropriado.
•
Efectue os cálculos apropriados aos seus dados.
•
Consulte a tabela estatística apropriada (tendo em conta os graus de
liberdade, e se é um teste unicaudal ou bicaudal) para verificar se a
probabilidade de o seu teste ser devido ao acaso é inferior a 5% ou a 1%.
•
Com base nisso, decida se tem que aceitar a hipótese nula, de os seus dados
serem devidos ao acaso; ou se pode rejeitar a hipótese nula e interpretar os
seus resultados como suportando a hipótese experimental.
Cálculo
O valor do teste t, para dados não relacionados, obtém-se a partir da
expressão:
t
M1  M 2
2
2








x
x
 x2   1    x2   2 
2 n 
 1
n1  
2

 
   1  1 
n n 
n1  1  n2  1
2 
 1
Em que M1 e M2 representam as médias dos valores da variável
dependente para as duas categorias.
Cálculo
O valor do teste t, para dados relacionados, obtém-se a partir da
expressão:
t
d
N  d 2   d 
N  1
2
Em que d representa a diferença entre os valores das duas categorias
da variável para cada caso, e N é o número de casos.
Consulta da tabela
A tabela de valores críticos do teste t tem diversos parâmetros de
entrada:
•
O número de graus de liberdade:
gl  n1 1  n2 1 (não relacionado)
gl  N  1
(relacionado)
•
A direccionalidade do teste: unicaudal, se a comparação é
efectuada apenas num sentido (média maior ou menor); bicaudal,
se a comparação é efectuada nos dois sentidos (média igual ou
diferente).
•
O nível de significância do teste que, tipicamente, tem os valores
de 5% ou 1%, e é escolhido pelo investigador no início do
processo de teste de hipóteses.
Decisão
A comparação do valor de teste calculado com o valor crítico obtido
na tabela permite decidir se se deve aceitar ou rejeitar a hipótese
nula.
•
Rejeita-se a hipótese nula quando o valor calculado do teste t é
superior ao valor crítico do teste t consultado na tabela.
•
Aceita-se a hipótese nula quando o valor calculado do teste t é
inferior ao valor crítico do teste t consultado na tabela.
gl
0,20
Nível de significância para testes unicaudais
0,05
0,025
0,01
Nível de significância para testes bicaudais
0,10
0,05
0,02
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120

3,078
1,886
1,638
1,533
1,476
1,440
1,415
1,397
1,383
1,372
1,363
1,356
1,350
1,345
1,341
1,337
1,333
1,330
1,328
1,325
1,323
1,321
1,319
1,318
1,316
1,315
1,314
1,313
1,311
1,310
1,303
1,296
1,289
1,282
6,314
2,920
2,353
2,132
2,015
1,943
1,895
1,860
1,833
1,812
1,796
1,782
1,771
1,761
1,753
1,746
1,740
1,734
1,729
1,725
1,721
1,717
1,714
1,711
1,708
1,706
1,703
1,701
1,699
1,697
1,684
1,671
1,658
1,645
0,10
12,706
4,303
3,182
2,776
2,571
2,447
2,365
2,306
2,262
2,228
2,201
2,179
2,160
2,145
2,131
2,120
2,110
2,101
2,093
2,086
2,080
2,074
2,069
2,064
2,060
2,056
2,052
2,048
2,045
2,042
2,021
2,000
1,980
1,960
31,821
6,965
4,541
3,747
3,365
3,143
2,998
2,896
2,821
2,764
2,718
2,681
2,650
2,624
2,602
2,583
2,567
2,552
2,539
2,528
2,518
2,508
2,500
2,492
2,485
2,479
2,473
2,467
2,462
2,457
2,423
2,390
2,358
2,326
0,005
0,0005
0,01
0,001
63,657
9,925
5,841
4,604
4,032
3,707
3,499
3,355
3,250
3,169
3,106
3,055
3,012
2,977
2,947
2,921
2,898
2,878
2,861
2,845
2,831
2,819
2,807
2,797
2,787
2,779
2,771
2,763
2,756
2,750
2,704
2,660
2,617
2,556
636,619
31,598
12,941
8,610
6,859
5,959
5,405
5,041
4,781
4,587
4,437
4,318
4,221
4,140
4,073
4,015
3,965
3,922
3,883
3,850
3,819
3,792
3,767
3,745
3,725
3,707
3,690
3,674
3,659
3,646
3,551
3,460
3,373
3,291
Tabela t
Consulte
esta tabela
Exemplo
Vamos testar a hipótese do nosso 1º exemplo:
“O saldo médio dos clientes do Norte é superior ao saldo médio dos
clientes do Sul.”
A hipótese nula indica que não há diferença entre os saldos médios
dos clientes do Norte e do Sul.
Escolhemos um nível de significância de 5% para o teste.
Exemplo
Supor os valores dos saldos médios de 10 clientes do Norte e 10
clientes do Sul, considerando que são a totalidade da população:
Grupo 1 (Norte)
Grupo 2 (Sul)
Resultados Quadrado dos resultados Resultados Quadrado dos resultados
Cliente
x1
x 12
x2
x 22
1
10
100
2
4
2
5
25
1
1
3
6
36
7
49
4
3
9
4
16
5
9
81
4
16
6
8
64
5
25
7
7
49
2
4
8
5
25
5
25
9
6
36
3
9
10
5
25
4
16
Total (S )
64
450
37
165
Média
6,4
3,7
Consulte
esta tabela
Exemplo
O cálculo da estatística de teste resulta em:
t
6,4  3,7

642  
372 
 450
  165

10  
10   1 1 

  
99
 10 10 
 3,096
Exemplo
O valor crítico do teste t deve ser consultado na tabela:
• Para um número de graus de liberdade de 18 [gl=(10-1)+(10-1)]
• Para um teste unicaudal, com um nível de significância de 5%
O valor crítico obtido é de 1,734.
Exemplo
Uma vez que o valor calculado do teste t (3,096) é superior ao
valor crítico do teste t consultado na tabela (1,734), podemos
rejeitar a hipótese nula.
Assim, concluímos que os saldos médios dos clientes do
Norte são superiores aos saldos médios dos clientes do
Sul, ou seja, que a diferença que existe nos seus saldos
médios é estatisticamente significativa.
SPSS
Vejamos, agora, como utilizar o SPSS para resolver o mesmo
problema.
Uma das questões mais importantes, no SPSS, é saber organizar a
informação.
Cada variável deve ser colocada numa coluna. Assim, a variável
dependente saldo ocupa uma coluna e a variável independente
região ocupa outra coluna.
SPSS
De notar que a variável região é uma
variável numérica, apesar de parecer
ser do tipo texto.
Acontece que foi estabelecida a
relação:
1 – Norte
2 – Sul
Consulte
esta tabela
SPSS
Inserir os dados, como indicado anteriormente.
Na barra de menus escolher:
Analyze  Compare Means  Independent Samples T Test…
SPSS
Seleccionar a variável, ou variáveis, cuja média se pretende testar
e colocá-la na lista de variáveis de teste.
Seleccionar a variável que define os grupos de casos e movê-la
para a lista de variáveis de agrupamento.
Premir o botão Define Groups para indicar a forma como os
grupos são definidos.
SPSS
Depois, premir o botão OK.
SPSS
Obtém-se o quadro:
Independent Samples Test
Levene's Test for
Equality of Variances
t-test for Eq uality of
Means
F
Sig .
t
df
Sig . (2-tailed)
Mean Difference
Std. Error Difference
95% Confidence Interval
of the Difference
Lower
Upper
Equal
variances
assumed
,423
,524
3,095
18
,006
2,70
,87
,87
4,53
Equal
variances
not
assumed
3,095
17,438
,006
2,70
,87
,86
4,54
Consulte
esta tabela
SPSS
Nesse quadro pode ler-se que o valor do teste t é 3,095.
Mas mais importante que esse facto é o parâmetro da
significância (Sig.) que, como se pode ver, vale 0,006. Este
valor é bastante inferior ao valor de significância escolhido
por nós inicialmente (5%).
Uma vez que a significância obtida é inferior a 5%, rejeita-se
a hipótese nula.
Download

003-testesHipoteses