Universidade do Estado do Rio de Janeiro
Intervalos de confiança simultâneos
(Método de Bonferroni)
Prof. José Francisco Moreira Pessanha
[email protected]
www.geocities.com/jfmpessa
Intervalos simultâneos
Considere o caso especial em que X~Np(,) onde
 1 
 
 2 
   3 
 
  
 
 p
  11



 22



 33









pp 

As variáveis são
independentes
Para cada média pode ser especificado um intervalo t com 1- de
confiança, por exemplo, 95%:
xi  t n1  2
sii
sii
 i  xi  t n1  2
n
n
n = tamanho da amostra aleatória
xi = média amostral da i-ésima variável
sii = variância amostral da i-ésima variável
i=1,p
Intervalos simultâneos
Considerando cada intervalo individualmente
Pintervaloconteri   Pi - ésimointervaloser verdadeiro 

sii
sii 
P  xi  t n1  2
  i  xi  t n1  2
  1
n
n

i=1,p
Considerando os intervalos simultaneamente
P todosos intervaloscontenham i  
P todosos intervalossejam verdadeiros  
1    1    1     1    p  1   
Neste caso foi assumido que as
variáveis são independentes,
por isso o produto de
probabilidades
No caso de p=6 variáveis, para =0,05
(5%) tem-se que (1- )6 = 0,74 < 0,95, ou
seja, o grau de confiança simultâneo é
menor que 95%
Intervalos simultâneos
A partir de uma região com (1-)x100% de confiança podem ser
obtidos intervalos para as médias 1,2,...,p e suas infinitas
combinações lineares aT = a11+a22+...+app. Estes intervalos
são denominados por intervalos simultâneos ou intervalos T2:
a X
T
pn  1
a T Sa
Fp,n p  
 aT   aT X 
n  p
n
pn  1
a T Sa
Fp,n p  
n  p
n
T2
n = tamanho da amostra aleatória
p = número de variáveis
a = vetor de constantes que definem uma combinação linear de médias
X = vetor de médias amostrais
S = matriz de covariância amostral
Estes intervalos são mais largos que os intervalos t, de tal forma
que quando considerados simultaneamente a probabilidade de
que todos os intervalos contenham as respectivas médias seja
(1-)x100%, igual ao grau da região de confiança.
Intervalos simultâneos
0.62
0.64
Os intervalos simultâneos são projeções da região de confiança.
0.60
Região de
confiança
de 95%
A probabilidade que os dois intervalos
T2 contenham as respectivas médias é
superior a 95%
0.58
V1
Intervalo de
confiança
simultâneo
de 95%
para 2
Note que os intervalos simultâneos para
1 e 2 definem uma região retangular
maior que a região com 95% de
confiança, logo a região retangular,
definida pelos dois intervalos T2, tem um
grau de confiança maior que 95%.
Isso só foi possível pois os intervalos T2
são maiores que o intervalo t
0.52
0.54
0.56
0.58
0.60
Intervalo de confiança simultâneo
de 95% para 1
V1
Método de Bonferroni
Freqüentemente estamos interessados em fazer inferência
sobre um reduzido conjunto de médias ou de combinações
lineares de médias.
Não estamos interessados em todas as infinitas combinações
lineares das médias.
Neste caso podemos desenvolver intervalos simultâneos mais
curtos (mais precisos) que os intervalos T2.
Este método alternativo é conhecido como método de Bonferroni
e baseia-se na desigualdade de mesmo nome.
Método de Bonferroni
Considere que o objetivo seja inferir sobre m combinações
lineares das médias:
a   a111    a1 p  p
T
1
a2T   a211    a2 p  p

amT   am11    amp  p
Seja ICi o intervalo com 1-i de confiança para a i-ésima
combinação (i=1,m)


P ICi conter a vardeiracom binaçãoaiT  
P ICi ser verdadeiro  1   i
Método de Bonferroni
Considerando todos os intervalos simultaneamente:
Ptodosos ICi sejamverdadeiros  1  P pelo menosum ICi ser falso
m
P todosos ICi sejam verdadeiros   1   P ICi ser falso
i 1
m
P todosos ICi sejam verdadeiros   1   1  P ICi ser verdadeiro
i 1
m
P todosos ICi sejam verdadeiros   1   1  1 -  i 
i 1
m
P todosos ICi sejam verdadeiros   1   i
i 1
Estas desigualdade é um caso especial da desigualdade de Bonferroni
Método de Bonferroni
Vamos desenvolver os intervalos simultâneos para o conjunto
restrito de p médias i , i=1,p.
Estes intervalos são construídos com base no intervalo t:
xi  t n1  i 2
sii
sii
 i  xi  t n1  i 2
n
n
i=1,p
Na ausência de algum conhecimento sobre a importância de
cada média, faz-se:
i 

p
Implica no mesmo nível de
confiança para todos os intervalos
Ptodosos ICi sejamverdadeiros   Ptodo ICi conhtenhaa verdadeirai 
p


P todo ICi contenhaa respectiva i   1   i  1        1  
p
i 1
p
p termos
Método de Bonferroni
P todo ICi contenhaa respectivai  1  
Então, os seguinte intervalos de confiança têm um grau de
confiança simultâneo maior ou igual a 1-:
   s11
   s11


x1  t n1 
 1  x1  t n1 
 2p n
 2p n
   s22
   s22


x2  t n1 
 2  x2  t n1 
 2p n
 2p n
...
   s pp
   s pp


x p  t n1 
  p  x p  t n1 
 2p n
 2p n
Método de Bonferroni
Comparando intervalos simultâneos T2 e Bonferroni para as
médias i , i=1,p
Intervalo simultâneo com correção de Bonferroni para as médias
i , i=1,p
   sii
   sii


xi  t n1 
 i  xi  t n1 
 2p n
 2p n
Intervalo simultâneo T2 para as médias i , i=1,p
xi 
sii
pn  1
Fp,n p  
  i  xi 
n  p
n
sii
pn  1
Fp,n p  
n  p
n
Exemplo
O departamento de controle de qualidade de uma fábrica de fornos de
microondas realiza medições do nível de radiação emitida por estes
aparelhos para verificar se os fornos fabricados atendem as
especificações do projeto e as normas de segurança. Desenhe a região
com 95% de confiança para o vetor média.
Para atender esta finalidade, uma amostra de 42 fornos de microondas é
selecionada e ensaios em laboratório são conduzidos para medir o nível
de radiação emitida com a porta fechada e com a porta aberta. A seguir
são apresentados as amostras coletadas.
Forno com a porta fechada (y1) = arquivo T4-1.dat
0.15 0.09 0.18 0.10 0.05 0.12 0.08 0.05 0.08 0.10 0.07 0.02 0.01 0.10
0.10 0.10 0.02 0.10 0.01 0.40 0.10 0.05 0.03 0.05 0.15 0.10 0.15 0.09
0.08 0.18 0.10 0.20 0.11 0.30 0.02 0.20 0.20 0.30 0.30 0.40 0.30 0.05
Forno com a porta aberta (y2) = arquivo T4-5.dat
0.30 0.09 0.30 0.10 0.10 0.12 0.09 0.10 0.09 0.10 0.07 0.05 0.01 0.45
0.12 0.20 0.04 0.10 0.01 0.60 0.12 0.10 0.05 0.05 0.15 0.30 0.15 0.09
0.09 0.28 0.10 0.10 0.10 0.30 0.12 0.25 0.20 0.40 0.33 0.32 0.12 0.12
Construa os intervalos simultâneos T2 e com correção de Bonferroni para
as médias 1 e 2 com 95% de confiança.
Exemplo
0
5
Frequency
y1=read.table("T4-1.dat")
hist(y1[,1])
10
15
Histogram of y1[, 1]
 Distribuições assimétricas.
 Violação da hipótese de normalidade.
 Variáveis devem ser transformadas
0.0
0.1
0.2
0.3
0.4
y1[, 1]
10
5
0
Frequency
y2=read.table("T4-5.dat")
hist(y2[,1])
15
20
Histogram of y2[, 1]
0.0
0.1
0.2
0.3
y2[, 1]
0.4
0.5
0.6
Exemplo
Histogram of x1
6
4
0
2
x1=y1^(1/4)
hist(x1)
Frequency
8
10
Transformação das variáveis
0.3
 Distribuições simétricas.
 Hipótese de normalidade satisfeita.
0.4
0.5
0.6
0.7
0.8
x1
10
5
0
Frequency
x2=y2^(1/4)
hist(x2)
15
20
Histogram of x2
0.3
0.4
0.5
0.6
x2
0.7
0.8
0.9
Exemplo
Matriz de dados X=cbind(x1,x2)
Vetor de médias amostrais
xbarra=apply(X,2,mean)
xbarra
V1
V1
0.5642575 0.6029812
Matriz de covariâncias amostrais
S=var(X)
S
V1
V1
V1 0.01435023 0.01171547
V1 0.01171547 0.01454530
Caso bivariado  p =2
Exemplo
Intervalos simultâneos T2 para 1 e 2
x1 
pn  1
s11


Fp,n p 5%
 1  x1 
n  p
n
pn  1
s11


Fp,n p 5%
n  p
n
241
0,0144
241
0,0144
0,564 
3,23
 1  0,564 
3,23
40
42
40
42
0,516  1  0,612
x2 
pn  1
s22
Fp,n p 5%
 2  x2 
n  p
n
pn  1
s22
Fp,n p 5%
n  p
n
241
0,0146
241
0,0146
0,603 
3,23
 2  0,603 
3,23
40
42
40
42
0,555 2  0,651
Exemplo
Intervalos simultâneos com correção de Bonferroni para 1 e 2
 5%  s11
 5%  s11


x1  t n1 
 1  x1  t n1 
 2p  n
 2p  n
0,0144
0,0144
0,564 2,327
 1  0,564 2,327
42
42
0,521 1  0,607
   s22
   s22


x2  t n1 
 2  x2  t n1 
 2p n
 2p n
0,0146
0,0146
0,603 2,327
 2  0,603 2,327
42
42
0,560  2  0,646
Exemplo
Intervalos simultâneos T2 para 1 e 2
0,516  1  0,612 0,555 2  0,651
Intervalos simultâneos com correção de Bonferroni para 1 e 2
0,521 1  0,607 0,560  2  0,646
Intervalos simultâneos com correção de Bonferroni para 1 e 2 menores
que os intervalos T2
Download

Multivariada Método de Bonferroni