ME623
Planejamento e Pesquisa
Revisão de Experimentos
Comparativos Simples
2
Comparação de Duas Médias
Amostras Independentes


Exemplo: Suplementação
alimentar ajuda
emagrecimento?
Resposta: quilos perdidos
UE
Pessoa
Supl.
Placebo
j
y1j
1
1.85
-1.62
2
2.40
-0.75
3
-1.21
1.70
4
0.35
2.12
5
3.52
3.98
6
4.04
-4.87
7
4.96
-2.34
8
0.15
3.02
9
-.59
-0.08
10
2.57
-1.27
y2j
3
Análise Descritiva: Boxplot
Existe diferença nas
médias dos dois
grupos?

Essa diferença é
estatisticamente
significante?

E a variância, é a
mesma?
0
-4
-2
quilos
2
4

Placebo
supl
Figura: Boxplot da dos quilos perdidos
em cada grupo
4
Comparar médias de 2 grupos

Qual técnica estatística podemos usar?
5
Teste t (amostras independentes)
Suposições:
Hipóteses:
Estatística do Teste:
onde
6
Teste t (amostras independentes)
E se as variâncias forem diferentes?
Estatística do Teste:
Sob Ho:
t0 =
y1. - y2.
S12 S 22
+
n1 n2
» tn
æ s12 s22 ö
ç + ÷
è n1 n2 ø
n=
2
2
2
2
1 æ s1 ö
1 æ s2 ö
ç ÷ +
ç ÷
n1 -1 è n1 ø n2 -1 è n2 ø
2
7
Teste t (amostras independentes)
Exemplo do suplemento
Suplemento
Placebo
y1. =1.80
y2. = -0.01
S = 4.28
S 22. = 7.37
2
1.
Qual é o valor de
t 0?
8
Teste t (amostras independentes)
No R:
> y1 <- c(1.85, 2.40,-1.21, 0.35, 3.52, 4.04, 4.96, 0.15, -0.59, 2.57)
> y2 <- c(-1.62, -0.75, 1.70, 2.12, 3.98, -4.87, -2.34, 3.02, -0.08, 1.27)
> t.test(y1, y2, var.equal=FALSE)
data: y1 and y2
t = 1.6815, df = 16.816, p-value = 0.1111
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.46421 4.09421
sample estimates:
mean of x mean of y
1.804
-0.011
Conclusão?
9
Exemplo
Um pesquisador quer testar se
há diferença entre o tempo que
homens e mulheres assistem TV.


Na pesquisa com 59 homens e 116 mulheres, o
tempo médio dos homens foi de 2.37 horas e o
desvio padrão amostral 1.87, o tempo médio das
mulheres foi de 1.95 horas com desvio padrão
amostral de 1.51.
10
10
t=

x1 - x2 - 0
s s
+
n1 n2
2
1
2
2
=
2.37 -1.95 - 0
2
2
1.87 1.51
+
59
116
= 1.495
p-valor = 0.13
11
Teste para Igualdade das Variâncias
12
Checar suposições do teste t

Quais são as suposições?
13
Checar suposições do teste t

Quais são as suposições?

Normalidade

Independência das populações

Observações são variávies aleatórias
independentes

(Variâncias iguais)
14
Checar suposições do teste t
Gráfico de Probabilidade Normal: o que podemos
ver?
15
Comparação de Duas Médias
Amostras Pareadas


Exemplo: Suponha que
queremos testar se existe
diferença no desempenho
dos alunos entre a P1 e
P2.
Selecionamos 10 alunos
ao acaso
Aluno Nota P1 Nota P2
j
y1j
y2j
1
7.5
6.3
2
3.2
4.5
3
5.4
6.2
4
1.5
2.7
5
6.0
6.9
6
9.2
7.7
7
7.9
8.5
8
3.5
1.2
9
4.7
7.2
10
6.2
6.5
16
Análise Descritiva: Boxplot

Houve uma melhora
nas notas?

Essa diferença é
estatisticamente
significante?
Figura: Boxplot das notas dos alunos
na P1 e P2
17
Teste t (amostras pareadas)
Diferença:
Hipóteses:
Estatística do Teste:
onde
18
Teste t (amostras pareadas)
Para as notas da P1 e P2, calcula-se as diferenças:
Então
Qual é o valor de
?
19
Teste t (amostras pareadas)
No R:
>
>
>
>
y1 <- c(7.5, 3.2, 5.4, 1.5,
y2 <- c(6.3, 4.5, 6.2, 2.7,
prova <- as.factor(rep(1:2,
t.test(y1, y2, paired=TRUE,
6, 9.2, 7.9, 3.5, 4.7, 6.2)
6.9, 7.7, 8.5, 1.2, 7.2, 6.5)
each=10))
equal.var=TRUE)
Paired t-test
data: y1 and y2
t = -0.5574, df = 9, p-value = 0.5909
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-1.3152424 0.7952424
sample estimates:
mean of the differences
-0.26
Conclusão: ?
20
Determinar o tamanho amostral

Qual o tamanho da amostra a ser usada?
Esse é um dos aspectos mais importantes
de um experimento

Duas formas de calcular o tamanho da
amostra:
1. Intervalo de Confiança
2. Curva OC (Operating Characteristic)
21
Poder de um teste
H0
Decisão sobre H0
Rejeitar
Não Rejeitar
Verdadeira
Erro Tipo I (α)
OK
Falsa
OK
Erro Tipo II (β)
• P(Rejeitar H0|H0 é verdadeira)=α: P(Erro Tipo I)
• P(Não Rejeitar H0|H0 é falsa)=β: P(Erro Tipo II)
• Poder do Teste
P(Rejeitar H0|H0 é falsa) = 1 - P(Erro Tipo II) = 1-β
22
Poder de um teste

Exemplo: em R
simulacoes = 1000
rejeicoes = 0
for (i in 1:simulacoes)
{
amostra1 = rnorm(100)
amostra2 = rnorm(100)
if (t.test(amostra1,amostra2)$p.value < 0.05)
rejeicoes = rejeicoes + 1
}
alpha = rejeicoes/simulacoes
23
Determinar o tamanho amostral
pelo Intervalo de Confiança

Voltemos ao caso em que estamos testando
e a diferença entre as médias é
.

Um Intervalo de Confiança (IC) para
é:

Qual a probabilidade de que, sob Ho, este
intervalo contém a diferença populacional?
24
Determinar o tamanho amostral
pelo Intervalo de Confiança

Especificar um limite máximo para a margem de
erro
e resolver a equação para o tamanho de amostra:
25
Determinar o tamanho amostral
pelo Intervalo de Confiança

Exercício:

Para o exemplo do suplemento, calcule o tamanho
da amostra necessário para um intervalo de
confiança de no máximo 1.3
26
Tamanho da Amostra

Exemplo: Se uma população tem variancia s = 9 , o
número de pessoas que posso entrevistar é n = 80, e
queremos um I.C. para a média amostral com margem
de erro m = 0.5, qual a será a confiança deste I.C.?
Adriano Zambom
2
27
Determinar o tamanho amostral
pela curva OC

A escolha do tamanho amostral e a P(Erro Tipo II)
= βestão diretamente ligadas

Quando
é falsa, não queremos
erradamente não rejeitar H0.

β depende da verdadeira diferença entre as médias

Curvas OC (Operating Characteristic Curves):
gráfico de βversus δpara um tamanho amostral
particular
28
Determinar o tamanho amostral
pela curva OC
29
Determinar o tamanho amostral
pela curva OC

A curva anterior é para as hipóteses de
igualdade das médias com mesma
variância (desconhecida),α=0.05 e dados
balanceados

O tamanho amostral para construir as
curvas é na realidade n*=2n-1.
30
Determinar o tamanho amostral
pela curva OC

O parâmetro no eixo horizontal é:
Dividir por 2sigma, permite usar o mesmo
conjunto de curvas, sem se preocupar
com a variância. Assim, a diferença das
médias é expressa por unidades de desvio
padrão!
31
Determinar o tamanho amostral
pela curva OC

Voltando a curva:
32
Determinar o tamanho amostral
pela curva OC

Quanto maior a diferença das médias,
menor é a probabilidade de erro tipo II,
para um tamanho amostral n e um dado
alpha.

O teste detecta diferenças maiores com
mais facilidade!
33
Determinar o tamanho amostral
pela curva OC

Quando o tamanho amostral aumenta, a
probabilidade do erro tipo II diminui.
Conclusão:
 Quando o poder do teste aumenta?

34
Determinar o tamanho amostral
Exemplo: argamassa de cimento
 Suponha que se a diferença é no mínimo
0.5, gostaríamos de detectá-la com
probabilidade 0.80. Assuma que σ=0.25
Poder é 0.80, então β=0.20.
 Pela figura n*=10. Então
10 = 2n-1 => n = 6

35
36
Download

Aula2