Teste t de Student para o caso de uma amostra (Teste de hipóteses
para a média populacional)
Exemplo:
Quinze alunos foram inquiridos quanto ao seu grau de satisfação (numa escala de 0 a
100) em relação à sua Universidade, obtendo-se os seguintes resultados:
75 60 55 80 52 90 60 91 72 58 77 80 66 40 62
Teste a hipótese de que a média é 72, sendo α=5%.
Resolução usando o SPSS:
H 0 : µ1 = 72
H 1 : µ1 ≠ 72 (Teste bilateral)
1
Output
T-Test
One-Sample Statistics
N
Grau de satisfação
15
Mean
67,87
Std. Deviation
14,451
Std. Error
Mean
3,731
One-Sample Test
Test Value = 72
Grau de satisfação
t
-1,108
df
14
Sig. (2-tailed)
,287
2
Mean
Difference
-4,133
95% Confidence
Interval of the
Difference
Lower
Upper
-12,14
3,87
Interpretação:
Neste exemplo, dado tratar-se de um teste bilateral, compara-se directamente o valor de
p-value=0.287 com α=0.05 (nível de significância). Como p-value=0.287 > 0.05 não se
rejeita H0. Assim, não há evidência estatística para rejeitar a hipótese de que a média de
satisfação (numa escala de 0 a 100) em relação à sua Universidade na população de
alunos que frequentam aquela Universidade é 72, com α=0.05.
Testes de hipóteses para a diferença entre duas médias
populacionais)
A) Teste t de Student para amostras independentes
Exemplo:
Com o objectivo de testar a influência do olfacto no sono dos recém nascidos, foi
registado o tempo (em minutos) que um bebé com uma semana demora a adormecer,
tendo sido considerados dois grupos de bebés: grupo I (em que se colocou no berço
uma peça de roupa utilizada pela mãe) e grupo II (em que se colocou no berço uma
peça de roupa utilizada por outra pessoa). Os resultados obtidos encontram-se no quadro
seguinte:
Grupo I 2 5 4 6 8 9 7 5 6 5
Grupo II 9 3 8 7 10 11 9 11 7 8
Sabendo que a variável em estudo segue uma distribuição normal, teste se existem
diferenças significativas entre o tempo que os dois grupos de bebés levaram a
adormecer (α=0.05).
Resolução usando o SPSS:
H 0 : µ1 − µ 2 = 0 ou H 0 : µ1 = µ 2
H1 : µ1 − µ2 ≠ 0 ou H1 : µ1 ≠ µ 2 (Teste bilateral)
3
Analyze/compare means/independent sample t-test
4
<Define Groups>
<Continue>
<OK>
T-Test
Group Statistics
tempo levado
até adormecer
Grupo
1
2
N
10
10
Mean
5,70
8,30
5
Std. Deviation
2,003
2,359
Std. Error
Mean
,633
,746
Independent Samples Test
Levene's Test for
Equality of Variances
F
tempo levado Equal variance
até adormece assumed
Equal variance
not assumed
,103
Sig.
,751
t-test for Equality of Means
t
Mean
Std. Error
Sig. (2-tailed) Difference Difference
df
95% Confidence
Interval of the
Difference
Lower
Upper
-2,657
18
,016
-2,600
,979
-4,656
-,544
-2,657
17,537
,016
-2,600
,979
-4,660
-,540
Interpretação:
A primeira tabela apresenta as medidas descritivas dos dados (dimensão n de cada
amostra), média, desvio-padrão e erro-padrão amostrais) e o segundo quadro diz
respeito ao teste de Levene para a homogeneidade (igualdade) das variâncias e ao teste t
para a comparação de duas médias no caso de duas amostras independentes.
No teste de Levene, as hipóteses são:
H 0 : σ 12 = σ 22
H 0 : σ 12 ≠ σ 22
Note que neste caso no que concerne ao teste de Levene p=0.751, pelo que não se
rejeita a hipótese de que, neste exemplo, as variâncias são iguais. Assim, considera-se
que as variâncias populacionais, embora desconhecidas, são iguais.
O quadro anterior apresenta a seguir o valor da estatística do teste (t) para a igualdade
das médias, o número de graus de liberdade e a probabilidade de significância do teste
(nível de significância descritivo do teste/p-value - sig.).
Neste exemplo, dado tratar-se de um teste bilateral, compara-se directamente pvalue=0.016 com α=0.05 (nível de significância). Como p-value=0.016 ≤ 0.05 rejeita-se
H0. Assim, podemos afirmar com 95% de confiança que existem diferenças
significativas entre o tempo que os dois grupos de bebés levaram a adormecer.
Obs. Se o teste fosse unilateral comparava-se o valor de p-value/2 com o valor de α.
6
B) Teste t de Student para amostras emparelhadas;
Exemplo:
Um grupo de 10 pessoas é submetido a um tipo de dieta durante um mês, sendo
avaliado o peso no início da dieta (X) e no final da dieta (Y), tendo-se obtido os
seguintes resultados:
X
Y
120
116
104
102
93
90
87
83
85
86
98
97
102
98
106
108
88
82
90
85
Ao nível de 5%, podemos concluir que houve diminuição do peso médio pela aplicação
da dieta?
Resolução usando o SPSS:
H 0 : µ1 − µ 2 = 0 ou H 0 : µ1 = µ 2
H1 : µ1 − µ2 > 0 ou H1 : µ1 > µ 2 (Teste unilateral à direita)
7
<Ok>
Output
T-Test
Paired Samples Statistics
Pair
1
Mean
97,30
94,70
X
Y
N
Std. Deviation
10,924
11,499
10
10
Std. Error
Mean
3,455
3,636
Paired Samples Correlations
N
Pair 1
X&Y
10
Correlation
,975
Sig.
,000
Paired Samples Test
Paired Differences
Pair 1 X - Y
Mean Std. Deviation
2,600
2,591
Std. Error
Mean
,819
Interpretação:
O valor da estatística do teste é 3.174.
8
95% Confidence
Interval of the
Difference
Lower
Upper
,747
4,453
t
3,174
df
9
Sig. (2-tailed)
,011
Neste exemplo, como o teste é unilateral, o valor do p-value dado pelo output deve ser
p − value
dividido por 2 e comparado apenas com α. Assim,
≅ 0.0055 ≤ 0.05 , logo
2
rejeita-se H0, podendo afirmar-se, com 95% de confiança, que houve diminuição do
peso médio pela aplicação da dieta.
9
Teste de aderência do Qui-Quadrado - Resolução no SPSS
Exemplo 1:
Um modelo de carro de determinada marca é vendido no mercado em 5 cores:
vermelha, branca, preta, azul e cinzenta. Num estudo de mercado para saber a
popularidade das várias cores, analisou-se uma amostra casual tendo-se obtido os
seguintes resultados:
Cor
v
b
p
a
c
Nº de Observações
88
65
52
45
50
Em face desta amostra, haverá razões para dizer que há preferência por determinada
cor ?
<Data> – <weight Cases>
10
Output:
NPar Tests
Chi-Square Test
Frequencies
11
cor
v
b
p
a
c
Total
Observed N
88
65
52
45
50
300
Expected N
60,0
60,0
60,0
60,0
60,0
Residual
28,0
5,0
-8,0
-15,0
-10,0
Test Statistics
Chi-Squarea
df
Asymp. Sig.
cor
19,967
4
,001
a. 0 cells (,0%) have expected frequencies less than
5. The minimum expected cell frequency is 60,0.
Exercício 2:
Uma moeda foi lançada ao ar 100 vezes e observaram-se 42 caras e 58 coroas. Serão os
resultados compatíveis com a hipótese de que a moeda é não viciada.
Output:
NPar Tests
Chi-Square Test
Frequencies
face
cara
coroa
Total
Observed N
42
58
100
Expected N
50,0
50,0
Residual
-8,0
8,0
12
Test Statistics
Chi-Squarea
df
Asymp. Sig.
face
2,560
1
,110
a. 0 cells (,0%) have expected frequencies less than
5. The minimum expected cell frequency is 50,0.
Exercício 3:
O último algarismo de 60 números telefónicos escolhidos ao acaso de uma lista foi:
Nº
0
1
2
3
4
5
6
7
8
9
Freq. 8
3
2
5
4
11
5
11
6
5
Será razoável admitir a equiprobabilidade dos números?
Output:
NPar Tests
Chi-Square Test
Frequencies
13
NUMERO
0
1
2
3
4
5
6
7
8
9
Total
Observed N
8
3
2
5
4
11
5
11
6
5
60
Expected N
6,0
6,0
6,0
6,0
6,0
6,0
6,0
6,0
6,0
6,0
Residual
2,0
-3,0
-4,0
-1,0
-2,0
5,0
-1,0
5,0
,0
-1,0
Test Statistics
Chi-Squarea
df
Asymp. Sig.
NUMERO
14,333
9
,111
a. 0 cells (,0%) have expected frequencies less than
5. The minimum expected cell frequency is 6,0.
14
Teste de Homogeneidade do Qui-Quadrado
Exemplo:
Um investigador efectuou uma experiência para determinar o efeito da
idade de um conferencista sobre a disposição estudantil para assistir às suas
conferências. Para tal, foram eleitos ao acaso 50 estudantes. A todos os estudantes foi
feita uma descrição igual do professor conferencista excepto no que diz respeito à idade:
a metade foi dito que o professor tinha 65 anos e à outra metade foi dito que tinha 30
anos. Mais tarde foi pedido aos alunos que manifestassem a sua disposição para assistir
à conferência, obtendo-se os seguintes resultados:
Disposição para
assistir à conf.
Com disposição
Situação experimental
Estudantes a quem se Estudantes a quem se
disse que o prof.
disse que o prof. tinha 30
tinha 65 anos
anos
8
15
Totais
23
Sem disposição
17
10
27
Totais
25
25
50
Será que existem diferenças entre os 2 grupos de estudantes quanto à disposição para
assistir à conferência (α=0.05) ?
Resolução no SPSS
Disp_conf- “disposição para assistir à conferência”
Idade – “Situação experimental”
15
16
Output:
Crosstabs
Case Processing Summary
Valid
N
Disposição para
assistir à conferência *
Situação experimental
Percent
50
100,0%
17
Cases
Missing
N
Percent
0
,0%
Total
N
Percent
50
100,0%
Chi-Square Tests
Pearson Chi-Square
Continuity Correctiona
Likelihood Ratio
Fisher's Exact Test
N of Valid Cases
Value
3,945b
2,899
4,000
df
1
1
1
Asymp. Sig.
(2-sided)
,047
,089
,045
Exact Sig.
(2-sided)
Exact Sig.
(1-sided)
,088
,044
50
a. Computed only for a 2x2 table
b. 0 cells (,0%) have expected count less than 5. The minimum expected count is
11,50.
Teste de Independência do Qui-Quadrado
Exemplo: Inquiriu-se 200 pessoas sobre a frequência com que vêem TV e sobre o tipo
de analgésicos antipiréticos que consumiam. A informação obtida resultou na seguinte
tabela:
Frequência com
que vê TV
Nunca
Por vezes
Com frequência
Total
Analgésicos
A B C
10 10 5
25 40 9
40 31 30
75 81 44
18
Total
25
74
101
200
Haverá alguma relação entre o consumo de analgésicos e a frequência com que se vê
televisão ? Comente.
Resolução no SPSS
Output:
Crosstabs
Case Processing Summary
Cases
Missing
N
Percent
Valid
N
Frequência com que
vê TV * Analgésicos
Percent
200
100,0%
0
19
,0%
Total
N
Percent
200
100,0%
Chi-Square Tests
Pearson Chi-Square
Likelihood Ratio
N of Valid Cases
Value
12,215a
12,486
200
df
4
4
Asymp. Sig.
(2-sided)
,016
,014
a. 0 cells (,0%) have expected count less than 5. The
minimum expected count is 5,50.
20
Teste de Fisher
Exemplo: Um estudo sobre hábitos tabágicos e consumo de álcool pretendia comparar
dois grupos de indivíduos, fumadores e não-fumadores, quanto à proporção de
consumidores de álcool. Recolhida uma amostra de 9 pessoas, obtiveram-se os
seguintes dados:
Fumadores
Não Fumadores
Totais
Consumidor de álcool
1
3
4
Não consumidor de álcool
3
2
5
Totais
4
5
9
Pretende-se testar se (α=0.05):
a) a proporção de consumidores de álcool é menor no grupo de fumadores;
b) a proporção de consumidores de álcool é maior no grupo de fumadores;
c) a proporção de consumidores de álcool é igual nos dois grupos;
Resolução no SPSS
Output:
Crosstabs
Case Processing Summary
Cases
Missing
N
Percent
0
,0%
Valid
N
Alcool * Fumador
9
Percent
100,0%
Alcool * Fumador Crosstabulation
Count
Fumador
não
Alcool
Total
não
sim
sim
2
3
5
Total
3
1
4
5
4
9
21
Total
N
9
Percent
100,0%
Chi-Square Tests
Pearson Chi-Square
Continuity Correctiona
Likelihood Ratio
Fisher's Exact Test
Linear-by-Linear
Association
N of Valid Cases
Value
1,102b
,141
1,137
,980
df
1
1
1
1
Asymp. Sig.
(2-sided)
,294
,708
,286
Exact Sig.
(2-sided)
Exact Sig.
(1-sided)
,524
,357
,322
9
a. Computed only for a 2x2 table
b. 4 cells (100,0%) have expected count less than 5. The minimum expected count is
1,78.
Nota: Para realizar o teste de Fisher usa-se os mesmos comandos do SPSS usados no
caso do teste do qui-quadrado.
A nota de rodapé do 2º quadro indica que 100% dos Eij são inferiores a 5. Neste caso
não se deve utilizar o teste do qui-quadrado. A alternativa é o teste de Fisher, cuja
probabilidade de significância unilateral é 0.357. O SPSS fornece também a
probabilidade de significância exacta para um teste bilateral, neste caso, igual a 0.524.
Para decidir sobre a rejeição ou não da hipótese nula deve-se, em ambos os casos,
comparar-se p-value com α, rejeitando-se a H0 quando p ≤ α.
22
Teste de McNemar
Exemplo: Suponha que uma determinada empresa decide fazer uma campanha
publicitária para promover um produto que tinha colocado no mercado há algum tempo.
A admininstração da empresa pretende saber se as preferências dos consumidores se
modificaram após a campanha publicitária. As respostas de 70 consumidores, aos quais
se perguntou, antes e depois da campanha, se consumiam o produto em causa,
encontram-se resumidas no quadro seguinte:
Depois da campanha
Não
Sim
Antes da campanha Sim
5
12
Não
33
20
Terá existido uma mudança significativa no consumo do produto em causa (α=0.05) ?
Resolução no SPSS
Input:
<Analyse>- Nonparametric tests > - <two related samples tests>
23
Output:
NPar Tests
McNemar Test
Crosstabs
Antes & Depois
Depois
Antes
0
1
0
1
33
5
20
12
Test Statisticsb
N
Exact Sig. (2-tailed)
Antes &
Depois
70
,004a
a. Binomial distribution used.
b. McNemar Test
Sendo p = 0.004 < α = 0.05 rejeitamos H0 e concluímos que houve uma mudança
significativa do consumo após a campanha publicitária.
24
Download

Teste t de Student para o caso de uma amostra (Teste de hipóteses