Variáveis categóricas: 2 grupos
Com duas amostras independentes /
relacionadas de indivíduos queremos
saber se na população as proporções de
indivíduos com determinada característica
em cada grupo são iguais.
Teste de Qui-quadrado
Amostras independentes
Grupo1
Grupo2
Total
Com
a
b
a+b
Sem
c
d
c+d
Total
n1=a+c
n2=b+d
n
Teste de Qui-quadrado
Amostras independentes:
Com um objectivo de comparar a prevalência de
seropositivos para o HHV-8 entre os homens
homossexuais e os heterossexuais analisaram-se 271
homens, obtendo-se os seguintes resultados:
Homossexuais
Heterossexuais
HHV-8 +
14 (33%)
14
36 (16%)
36
HHV-8 -
29 (67%)
29
192192
(84%)
Total
43 (100%)
43
228 228
(100%)
Teste de Qui-quadrado
Definimos a Hipótese
H0: 1=2
H1: 12
Obtemos a estatística do teste com os dados de uma amostra
2 = (|O-E|-1/2)2/E segue uma distribuição de qui-quadrado com 1 grau de liberdade
O – valores observado
E – velores esperados
Obtemos o valor de p
Definimos o nível se significancia
Interpretamos o valor de p
Teste de Qui-quadrado
H0: Na população a proporção de HHV8 + entre os homossexuais é igual à
proporção de HHV8 + entre os heterossexuais
2 = (|O-E|-1/2)2/E segue
HHV8 * coluna Crosstabulation
uma distribuição de quiHomossexuais
Heterossexuais
Total
quadrado com 1 grau de
HHV8 +
Count
14
36
50
Expected Count
7.9
42.1
50.0
liberdade
Count
29
192
221
O – valores observado
Expected Count
35.1
185.9
221.0
Total
Count
43
228
271
E – valores esperados
Expected Count
43.0
228.0
271.0
(43x50)/271=7.9
2 = 6.761
p = 0.009
Chi-Square Tests
Pearson Chi-Square
Continuity Correction a
Likelihood Ratio
Fisher's Exact Test
Linear-by-Linear
Association
N of Valid Cases
Value
6.761b
5.692
6.002
6.736
df
1
1
1
1
Asymp. Sig.
(2-sided)
.009
.017
.014
Exact Sig.
(2-sided)
Exact Sig.
(1-sided)
.017
.011
.009
271
a. Computed only for a 2x2 table
b. 0 cells (.0%) have expected count less than 5. The minimum expected count is 7.
93.
Teste de Qui-quadrado
HHV8 * coluna Crosstabulation
Homossexuais
HHV8
+
-
Total
Count
Expected Count
% within HHV8
% within coluna
Count
Expected Count
% within HHV8
% within coluna
Count
Expected Count
% within HHV8
% within coluna
14
7.9
28.0%
32.6%
29
35.1
13.1%
67.4%
43
43.0
15.9%
100.0%
Heterossexuais
36
42.1
72.0%
15.8%
192
185.9
86.9%
84.2%
228
228.0
84.1%
100.0%
Total
50
50.0
100.0%
18.5%
221
221.0
100.0%
81.5%
271
271.0
100.0%
100.0%
Teste de Qui-quadrado
Assumpções:
Todos os valores esperados são maiores ou iguais a 5.
Se algum valor esperado <5 – Teste exacto de Fisher
Teste de McNemar
Amostras emparelhadas:
Foram avaliados 100 doentes com cefaleias frequentes.
Os mesmos 100 dentes tomaram durante um mês um
determinado medicamento A e no mês seguinte o
medicamento B. Pediu-se aos doentes que registassem se
durante cada mês tiveram ou não dores de cabeça.
A – s/cefaleias
A – c/cefaleias
B - s/cefaleias
45 (w)
4 (x)
B - c/cefaleias
17 (y)
34 (z)
62
38
Total
Teste de McNemar
Definimos a Hipótese
H0: Na população a proporção com uma determinada
característica é igual nos dois grupos
Obtemos a estatística do teste com os dados de uma amostra
2 = (|x-y|-1)2/x+y segue uma distribuição de qui-quadrado com 1 grau de liberdade
Obtemos o valor de p
Definimos o nível se significancia
Interpretamos o valor de p
Teste de McNemar
H0: A percentagem de doentes com cefaleias usando o medicamento A é igual a
percentagem de doentes com cefaleias usando o medicamento B
visual * RX Crosstabulation
A
RX
visual
B
sem
com
Total
Count
Expected Count
% within visual
% within RX
Count
Expected Count
% within visual
% within RX
Count
Expected Count
% within visual
% within RX
sem
com
Total
45
30.4
91.8%
72.6%
17
31.6
33.3%
27.4%
62
62.0
62.0%
100.0%
4
18.6
8.2%
10.5%
34
19.4
66.7%
89.5%
38
38.0
38.0%
100.0%
49
49.0
100.0%
49.0%
51
51.0
100.0%
51.0%
100
100.0
100.0%
100.0%
Qual a % de dentes
com cefaleias com o
medicamento B?
51%
38%
E usando o A?
Chi-Square Tests
Value
McNemar Test
N of Valid Cases
100
a. Binomial distribution used.
Rejeito H0
Exact Sig.
(2-sided)
.007a
Variáveis categóricas: mais
de 2 categorias


Os indivíduos podem ser classificados
por dois factores.
Por exemplo, quanto à severidade da doença
e quanto ao grupo sanguíneo.
Cada factor pode ter mais que duas
categorias.
Por exemplo,
a severidade: baixa, moderada e alta;
o grupo sanguíneo: A, B, O, AB.
Variáveis categóricas: mais
de 2 categorias
Definimos a Hipótese
H0: Não há associação entre as categorias de um factor e
as categorias do outro factor
Obtemos a estatística do teste com os dados de uma amostra
2 = (O-E)2/E segue uma distribuição de qui-quadrado com (r-1)(c-1) grau de liberdade
O – valores observado
E – velores esperados
r e c – nº de categorias de cada uma dos factor respectivamente
Obtemos o valor de p
Definimos o nível se significancia
Interpretamos o valor de p
Variáveis categóricas: mais
de 2 categorias
Assumpções:
Não mais de 20% das células da tabela de contingência
têm valores esperados menores que 5.
Se algum valor esperado <5 – Teste exacto de Fisher
Variáveis categóricas: mais
de 2 categorias
Por vezes investigamos relações entre
variáveis categóricas (factores) em que
uma das variáveis é dicotómica (por
exemplo sim/não) e a outras ordinal.
Podemos testar não só se há uma
associação (teste de qui-quadrado) mas
também se existe uma tendência
(crescente ou decrescente) da proporção
de sins (teste de qui-quadrado para
tendências).
Download

Testes Hipótese: variáveis categóricas