0 Sumário: 6. Intervalos de Confiança .......................................................................................01 6.1. A estimação por intervalos.........................................................................01 6.2. Intervalo de confiança para a média..........................................................02 6.2.1. Intervalo de confiança para a média com variância conhecida.....02 6.2.2. Intervalo de confiança para a média com variância desconhecida .................................................................................06 6.2.3. Intervalo de confiança para a proporção .......................................09 6.3. Intervalo de confiança para a diferença entre duas médias de populações independentes............................................................................................15 6.3.1. Intervalo de confiança para a diferença entre duas médias de populações independentes com variâncias conhecidas ...............16 6.3.2. Intervalo de confiança para a diferença entre duas médias de populações independentes com variâncias iguais e desconhecidas ...............................................................................18 6.3.3. Intervalo de confiança para a diferença entre duas médias de populações independentes com variâncias diferentes e desconhecidas ...............................................................................22 6.3.4. Intervalo de confiança para a diferença entre duas proporções em populações independentes ......................................................25 6.4. Intervalo de confiança para a variância de uma população normal..........27 6.5. Intervalo de confiança para a razão entre as variâncias de duas populações normais...................................................................................30 6.6. Exercícios...................................................................................................34 1 Intervalos de confiança 6.1. A estimação por intervalo Normalmente, no processo de investiga€•o de um par‚metro , necessitamos ir alƒm da sua estimativa pontual ̂. O fato de n•o se conhecer o valor de pode causar uma “inseguran€a” e levar a um questionamento: Qu•o pr†ximo estamos do valor real de quando obtemos sua estimativa? A resposta depende da precis•o (ou vari‚ncia) do estimador e, tambƒm, do valor real do par‚metro. Uma maneira de contornar esse problema consiste em se encontrar um intervalo em torno de ̂ que tenha alta probabilidade de englobar . P( do intervalo [ a, b] englobar ) = O intervalo [ a, b] , na pr‡tica, ser‡ construˆdo com a amostra, ou seja, a partir dos dados e da distribui€•o amostral associada a ̂. Logo, os valores a e b ser•o aleatórios, variando de uma amostra para outra. 2 6.2. Intervalo de confiança para a média 6.2.1. Intervalo de confiança para a média com variância conhecida Seja uma aa X1, X2, . . . , Xn, com média e variância 2 conhecida. Para construir um intervalo de confiança para a média deve-se considerar a distribuição da média amostral X , 2 X N , n X N ( 0 , 1) / n Intervalo de confiança (1 – )100% para Para construir um I.C. para a temos que obter constantes a e b tal que Pa b (1 ) . A probabilidade (1 – ) é chamada de nível de confiança do intervalo e de nível de significância. X Então, da distribuição de , temos: / n X P z / 2 z1 / 2 (1 ) / n 3 P z / 2 X z1 / 2 (1 ) n n P X z1 / 2 X z / 2 (1 ) n n Como z1 / 2 z / 2 , teremos: P X z1 / 2 X z / 2 (1 ) n n a a x z / 2 b e b x z / 2 . n n Nota: observe que, nessa notação, z / 2 0 . Portanto, um intervalo de confiança (1 – )100% para , com 2 conhecido, é dado por: x z ; x z . /2 /2 n n Se = 0.05, / 2 0.025 e z0.025 1.96 , logo, um I.C. 95% para , com 2 conhecido, é dado por: x 1 . 96 ; x 1 . 96 . n n 4 Exemplo 1: Testes de compressão foram aplicados na marca A de cimento para avaliar sua resistência em concretos. Foram produzidos 13 corpos de prova e os testes foram aplicados no Laboratório de testes do Departamento de Engenharia Civil da UFSCar. (O corpo de prova padrão brasileiro, normatizado pela ABNT, é o cilíndrico, com 15 cm de diâmetro, 30 cm de altura e a idade de referência é 28 dias) Foi registrada a resistência à compressão simples (fc), para cada corpo de prova com o intuito de calcular a resistência característica do concreto à compressão (fck). Um concreto concreto classe C30, por exemplo, corresponde a um concreto com fck = 30 Mpa (Mpa = 106Pa). Pascal (unidade) O Pascal (símbolo: Pa) é a unidade padrão de pressão e tensão no SI. Equivale a força de 1N aplicada uniformemente sobre uma superfície de 1m2 (fonte: Wikipédia). Dados (MPa): 31.04 31.11 39.56 24.83 36.97 34.86 29.44 39.15 27.82 34.96 35.19 39.68 34.27 xA = 33.76 sA = 4.665 A empresa afirma que o processo tem variabilidade 2A = 25MPa2. Construir um intervalo de confiança 95% (nível de significância = 0.05) para a resistência à compressão média. Estatística: X A A ~ N 0 ;1 A / nA Encontrar a e b tais que: Pa A b 0.95 5 X A P 1.96 A 1.96 0.95 A / nA P 1.96 A X A A 1.96 A 0.95 nA nA P X A 1.96 A A X A 1.96 A 0.95 nA nA Substituindo os valores da média amostral e tamanho da amostra 5 5 P 33.76 1.96 A 33.76 1.96 0.95 13 13 P 31.04 A 36.48 0.95 Ou seja: a 33.76 1.96 5 31.04 MPa 13 b 33.76 1.96 5 36.48 MPa 13 Logo, ( 31.04, 36.48 ) é um I.C. 95% para A. Interpretação: o intervalo (31.04 ; 36.48) tem probabilidade 0.95 (95%) de englobar o real valor da média A. 6 6.2.2. Intervalo de confiança para a média com variância desconhecida Seja uma aa X1, X2, . . . , Xn, com média e variância 2 desconhecida. No caso da variância ser desconhecida devemos utilizar sua estimativa dada pela variância amostral s2, porém, nesse caso a distribuição associada à média amostral X não será mais a normal. X tem distribuição t – Student com s/ n (n 1) graus de liberdade, ou seja Resultado: a estatística X ~ tn 1 s/ n Notas: 1) A razão X pode ser escrita como: s/ n X X s/ n / n s X / n N (0 ,1) (n 1) s 2 / 2 2n 1 n 1 n 1 Ou seja, a distribuição t-Student é dada pela razão de uma N (0 , 1) por 2 uma dividida pelos seus graus de liberdade. 7 2) Assim com a normal padronizada a distribui€•o t – Student tem formato de sino, ou seja, ƒ simƒtrica em torno do zero, porƒm, para graus de liberdade pequenos a moderados suas caudas s•o mais “pesadas”. 3) Se uma va T tem distribui€•o t – Student com k graus de liberdade, ent•o: k e E (T ) 0 Var (T ) k 2 4) Quando os graus de liberdade crescem, a distribui€•o t – Student se aproxima da N ( 0 ,1) . 5) A distribui€•o t – Student com 1 grau de liberdade ƒ conhecida como distribui•‚o de Cauchy. Para construir um I.C. para a quando ƒ desconhecida, devemos proceder como nos casos anteriores, porƒm substituindo a distribui€•o normal padr•o pela t-Student, ou seja: 8 X P t( n 1); / 2 t( n 1);1 / 2 (1 ) s/ n s s P t( n 1); / 2 X t( n1);1 / 2 (1 ) n n s s P X t( n 1);1 / 2 X t( n 1); / 2 (1 ) n n Como t( n 1);1 / 2 t( n 1); / 2 , temos: s s P X t( n 1); / 2 X t( n 1); / 2 (1 ) n n Logo, um intervalo de confiança (1 – )100% para , com 2 desconhecido, é dado por s s x t ; x t ( n 1); / 2 ( n 1); / 2 n n Exemplo 2: No caso dos testes de compressão em amostras de concreto, o gerente da companhia, desconfiando de que a informação a respeito da variância não seja verdadeira, refez os cálculos estimando a variância do processo por s2. Como o procedimento de cálculo é o mesmo, basta substituir o valor do quantil da normal (Z0.025 = 1.96) pelo quantil das distribuição t – Student com (n – 1) = 12 graus de liberdade. Como nA 13 , então t( n 1); / 2 t12; 0.025 2.1788 Com xA = 33.76 e sA = 4.665 refazendo os cálculos temos que 9 xA t( nA 1); 0.025 sA 4.665 33.76 2.1788 30.94 MPa nA 13 xA t( nA 1);0.025 sA 4.665 33.76 2.1788 36.58 MPa nA 13 Portanto, ( 30.94 , 36.58 ) é um IC 95% para A para o caso em que a variância é desconhecida Interpretação: é mesma do caso anterior, porém, agora a variância é desconhecida. 6.2.3. Intervalo de confiança para a proporção Como a proporção p é de fato a média amostral de uma aa cuja va tem distribuição de Bernoulli(p), para se construir intervalos de confiança para p devemos seguir os mesmos procedimentos anteriores. Considerando que o estimador da proporção p̂ tem valor esperado p (1 p) p e variância , dada a distribuição n pˆ p N ( 0 , 1) , p (1 p ) n um I.C. (1 – )100% para a proporção é dado por: p (1 p ) p (1 p ) ˆ ; ˆ . p z p z / 2 / 2 n n 10 Exemplo 3: Nos testes de compressão em amostras de concreto, se a empresa afirma que 90% da produção atende ao valor do fck = 30Mpa, construir um I.C. de 95% ( = 0.05) para a proporção de corpos de provas com fc abaixo de fck. Dos 13 corpos de prova os valores 24.83, 29.44 e 27.82 são 3 menores do que o fck de 30Mpa. Então, pˆ 0.231 13 Considerando que p = 0.10: pˆ z / 2 p (1 p) 0.10 0.90 0.231 1.96 0.0679 n 13 pˆ z / 2 p (1 p) 0.10 0.90 0.231 1.96 0.3941 n 13 Ou seja: P 0.0679 p 0.3941 0.95 Portanto, ( 0.0679 ; 0.3941 ) é um I.C. 95% para p. Interpretação: o intervalo (0.0679 ; 0.3941) tem probabilidade 0.95 (95%) de englobar o real valor do parâmetro p. Nota: Como normalmente não conhecemos p, podemos construir intervalos de confiança para a proporção substituindo p e (1 – p) por p̂ e (1 pˆ ) , respectivamente. Neste caso o intervalo fica: pˆ (1 pˆ ) pˆ (1 pˆ ) ˆ ; ˆ p z p z /2 /2 . n n 11 Outra possibilidade seria considerar o fato de p (1 p) 1 / 4 e construir um intervalo conservador para p assumindo p = ½. Neste caso: p (1 p ) 1 n 4n Logo, o intervalo de confiança conservador para p será z / 2 z / 2 p ˆ ; p ˆ . 4 n 4 n Considerando = 0.05, então, I.C.’s 95% para p, nos casos acima serão dados por: i) utilizando p̂: pˆ (1 pˆ ) pˆ (1 pˆ ) ˆ ; ˆ p 1 . 96 p 1 . 96 n n ii) conservador p ½: 1.96 1.96 ˆ ; ˆ p p 4n 4n O procedimento em (ii) fornece intervalos de confiança excessivamente grandes quando p se distancia de ½ ( p 0 ou p 1) (Bussab & Moretin, 2002). Para a utilização do intervalo conservador, portanto, devemos ter algum conhecimento do valor p, garantindo que seu valor esteja próximo de ½. Exemplo: No exemplo do teste de compressão em concretos temos 3 pˆ 0.231, logo 13 12 i) utilizando p̂ : pˆ z / 2 pˆ (1 pˆ ) 0.231 0.769 0.231 1.96 0.0019 n 13 pˆ z / 2 pˆ (1 pˆ ) 0.231 0.769 0.231 1.96 0.4601 n 13 Portanto, ( 0.0019 ; 0.4601 ) é um I.C. 95% para p. ii) conservador p ½: pˆ z / 2 1.96 0.231 0.0408 (< 0 !!) 4n 52 pˆ z / 2 1.96 0.231 0.5028 4n 52 Portanto, ( – 0.0408 ; 0.5028 ) é um I.C. 95% conservador para p. Note que no intervalo acima o limite inferior é negativo, consequência da utilização da máxima variância de p e do fato de que a proporção a ser estimada está longe do valor ½. Nota: usualmente, nestes casos, arredondamos o limite inferior para 0 (zero), porém, o mais indicado é a utilização da estimativa p̂ . 13 Forma simplificada de representação: n i) Média com variância conhecida: x z / 2 ii) Média com variância desconhecida: x t( n 1); / 2 iii) Proporção: pˆ z / 2 s n pˆ (1 pˆ ) n Exemplos: 1) Um provedor de acesso ƒ internet deseja implantar um plano sem limite de horas. Para isso, verificou numa amostra de n = 25 usu„rios os tempos de utiliza…†o mensal, obtendo: m‡dia amostral x 26.8 horas. Sabendo que 2 = 6.25 horas2: a) Encontre um intervalo de confian…a 90% para a m‡dia. b) De quanto deve ser aumentado o tamanho da amostra para que, mantidas as demais medidas, o comprimento do intervalo caia pela metade? 2) Observou-se a estatura de 20 rec‡m-nascidos num hospital conforme dados abaixo. Pesquisas anteriores indicam que a estatura m‡dia das crian…as nascidas neste hospital ‡ de ˆ = 51 cm. Dados: x = 987 e x2 = 48845.25 a) Qual a probabilidade de que a estatura m‡dia da amostra n†o ultrapasse 50.20 cm? b) Construa um I.C. 99% para a m‡dia. 3) 10 corpos de provas foram submetidos a um teste de corros†o onde foram submersos em „gua salgada durante 60 segundos/dia. A corros†o foi medida pela perda de peso em miligramas/dec‰metro quadrado/dia (MDD). Os dados obtidos foram: 130.1 124.2 122.0 110.8 113.1 103.9 101.5 92.3 91.4 83.7 14 a) Encontre estimativas para a média e variância para a perda de peso em MDD. b) Construa um intervalo de 95% de confiança para a média. c) Supondo que a verdadeira média seja = 110, calcule a probabilidade de que X seja superior ao máximo valor da amostra considerando: i) desvio padrão conhecido = 16; ii) desvio padrão desconhecido. 15 6.3. Intervalo de confiança para a diferença entre as médias de duas populações independentes Sejam duas populações A e B cujas médias são A e B e variâncias 2A e 2B , respectivamente. Um estimador não viciado para ( A B ) é dado pela estatística X A X B e sua distribuição amostral é obtida conforme três diferentes situações: i) Populações independentes com variâncias conhecidas; ii) Populações independentes com variâncias desconhecidas, porém, iguais; iii) Populações independentes com variâncias diferentes e desconhecidas. Figura: Populações normais. 16 6.3.1. Intervalo de confiança para a diferença entre as médias de duas populações independentes com variâncias conhecidas Seja uma aa de tamanho nA , retirada da população A e uma aa de tamanho nB retirada da população B, independentes. Considerando que as variâncias 2A e 2B sejam ambas conhecidas, temos que: X A A A / nA e X B B B / nB são N ( 0 , 1) Da teoria da probabilidade temos que E X A X B A B 2A B2 e Var X A X B nA nB Logo, para o caso em que as variâncias 2A e 2B são conhecidas, a distribuição amostral associada à estatística X A X B é dada por: X A X B A B 2A B2 nA nB N ( 0 , 1) Observe que a variável padronizada tem expressão similar aos casos anteriores, ou seja, a diferença entre a va e sua média, dividida pelo seu desvio padrão. 17 Podemos, assim, construir um I.C. para ( A B ) a partir de X X B A B P z / 2 A z1 / 2 (1 ) . 2 2 A B n n A B Ou seja, um I.C. (1 ) 100% para ( A B ) considerando amostras independentes e variâncias conhecidas é dado por: 2A B2 xA xB z / 2 nA nB ; xA xB z / 2 2A B2 . nA nB Exemplo 4: Considere que no exemplo com os testes de compressão em amostras de concretos, além da A uma segunda marca B tenha sido avaliada com o intuito de que fossem comparadas. Dados (MPa): A B 31.04 31.11 39.56 24.83 36.97 34.86 29.44 39.15 xA = 33.76 27.82 34.96 35.19 39.68 34.27 sA = 4.665 27.91 40.94 39.25 37.42 32.16 34.29 38.69 21.21 xB = 33.08 29.30 29.21 33.76 32.71 31.91 34.10 33.34 sB = 5.017 a) Sabendo que as empresas afirmam que ambos os processos têm variabilidade 2 = 25MPa2, construir um I.C. para a diferença entre as médias das duas marcas. 18 Solução: a) Como 2A B2 25 então: X A X B A B 2 A 2 B nA nB Logo, um I.C. 95% para ( A B ) é dado por: 2A B2 xA xB z / 2 nA nB ; xA xB z / 2 2A B2 . nA nB Ou seja: xA xB z / 2 2A 2B nA nB 33.76 33.08 1.96 25 25 13 15 Portanto ( –3.034 , 4.394 ) é um I.C. 95% para ( A B ) . 6.3.2. Intervalo de confiança para a diferença entre as médias de duas populações independentes com variâncias iguais e desconhecidas Sejam duas populações A e B cujas médias são A e B e variâncias desconhecidas, porém iguais, ou seja, 2A 2B 2 19 Nesse caso, contudo, tanto sA2 como sB2 estimam a variância comum, logo, podemos utilizar as informações de ambas as amostras para estimar a variância populacional. O que se faz, na prática, é combinar as somas de quadrados das duas variâncias amostrais e dividir pelos graus de liberdade total, ou seja nA 2 2 ( xAi xA ) (nA 1) sA (nA 1) = g.l. de sA2 (nB 1) = g.l. de sB2 i 1 nB 2 2 ( xBi xB ) (nB 1) sB i 1 que combinadas, resultam em nA s 2p s 2 p nB ( xAi xA ) ( xBi xB ) 2 2 i 1 i 1 (nA 1) ( nB 1) (nA 1) sA2 (nB 1) sB2 nA nB 2 A variância combinada s 2p (ou pooled), nada mais é do que uma variância ponderada pelos graus de liberdade das duas amostras: (nA 1) sA2 (nB 1) sB2 . s nA nB 2 2 p Assim como sA2 e sB2 , s 2p é um estimador não viesado para 2 . 20 Prova: (nA 1) E sA2 (nB 1) E sB2 E s nA nB 2 2 p (nA 1) 2 (nB 1) 2 nA nB 2 (nA 1 nB 1) 2 nA nB 2 2 Pelo fato de 2 ser desconhecida, temos que X A A s A / nA tnA 1 e X B B sB / nB tnB 1 . Como temos um estimador comum para a variância populacional, podemos derivar uma distribuição de probabilidade para X A X B . Padronizando a diferença entre as médias amostrais teremos: X A X B A B s 2p s 2p nA nB X A X B A B sp 1 1 nA nB 21 X A X B A B Resultado: sp 1 1 nA nB tnA nB 2 Um I.C. (1 – )100% para ( A B ) , quando as variâncias são iguais e desconhecidas, é dado por: xA xB t( n A nB 2 ); / 2 sp 1 1 nA nB Exemplo 5: Construir um I.C. 95% para a diferença entre as resistências médias à compressão em concretos feitos com cimentos das marcas A e B, considerando variâncias iguais e desconhecidas. (você acha válida a suposição de variâncias iguais?) xA = 33.76 sA = 4.665 nA = 13 xB = 33.08 sB = 5.017 nB = 15 12 ( 4.665) 2 14 (5.017) 2 613.5307 s 26.597 13 15 2 26 2 p s p 4.8577 t( nA nB 2 ); / 2 t 26; 0.025 2.0555 22 Logo, um I.C. 95% para ( A B ) é dado por: xA xB t26;0.025 s p 1 1 nA nB 33.76 33.08 2.0555 4.8577 1 1 13 15 Portanto ( –3.105 , 4.465 ) é um I.C. 95% para ( A B ) considerando variâncias iguais e desconhecidas. 6.3.3. Intervalo de confiança para a diferença entre as médias de duas populações independentes com variâncias diferentes e desconhecidas Sejam duas populações A e B cujas médias são A e B e variâncias diferentes e desconhecidas, 2A e 2B . Com 2A e 2B diferentes e desconhecidas, devemos utilizar suas estimativas sA2 e sB2 individualmente e, nesse caso, a distribuição da estatística utilizada, apesar de continuar sendo a t-Student, não tem mais os graus de liberdade obtidos diretamente, como nos casos anteriores, isto é X A X B A B sA2 sB2 nA nB ~ t , 23 em que os graus de liberdade são dados por: 2 sA2 sB2 n n 2 A2 B 2 sA / nA sB / nB 2 nA 1 nB 1 Logo, um I.C. (1 ) 100% para ( A B ) , quando as variâncias são diferentes e desconhecidas, é dado por: xA xB t; / 2 sA2 sB2 . nA nB Exemplo 6: Com os dados de resistências à compressão em concretos com cimentos das marcas A e B, considerando variâncias iguais e desconhecidas. xA = 33.76 xB = 33.08 sA = 4.665 sB = 5.017 sA2 = 21.759 nA = 13 sB2 = 25.174 nB = 15 2 21.759 25.174 11.23614 13 15 2 2 21.759 / 13 25.174 / 15 0.43464 13 1 15 1 25.86 26 24 Nota: Os graus de liberdade não precisam ser valores inteiros. De fato, t25.86; 0.025 2.056071 (pelo R). Enfim, um I.C. 95% para ( A B ) é dado por: sA2 sB2 nA nB xA xB t26;0.025 33.76 33.08 2.0555 21.759 25.174 13 15 Portanto ( –3.084 , 4.444 ) é um I.C. 95% para ( A B ) considerando variâncias diferentes e desconhecidas. Resumindo: Variâncias VariŠncias conhecidas VariŠncias desconhecidas e iguais VariŠncias desconhecidas e diferentes I.C. 95% p/ Estatística X A X B A B 2 A 2 B nA nB X A X B A B sp 1 1 nA nB ( A B ) N ( 0 , 1) (–3.034 , 4.394) tnA nB 2 (–3.105 , 4.465) X A X B A B 2 A 2 B s s nA nB ~ t (–3.084 , 4.444) 25 6.3.4. Intervalo de confiança para a diferença entre duas proporções em populações independentes Considere que se queira estimar a diferença entre duas proporções p1 e p2 , associadas a duas populações independentes. Então, um estimador não viesado para a diferença ( p1 p2 ) é dado por ( pˆ 1 pˆ 2 ) . Sabendo que p (1 p1 ) p̂1 N p1 , 1 n1 e p (1 p2 ) p̂2 N p2 , 2 n2 Então: p (1 p1 ) p2 (1 p2 ) ( pˆ1 pˆ 2 ) N ( p1 p2 ) , 1 n n2 1 Desta forma, um I.C. (1 – )100% para ( p1 p2 ) é dado por ( pˆ1 pˆ 2 ) z / 2 pˆ 1 (1 pˆ 1 ) pˆ 2 (1 pˆ 2 ) n1 n2 Exemplo 7: Um grupo de biólogos interessados em estudar populações de animais em regiões isoladas por longas distâncias estão avaliando o desenvolvimento de peixes de uma determinada espécie em duas lagoas separadas por uma grande distância geográfica. Numa amostra de 116 peixes da primeira lagoa, 84 são da espécie em questão, enquanto que, de uma amostra de 80 peixes da outra lagoa, 45 são da espécie estudada. 26 Estimar a diferença entre as proporções de peixes das duas lagoas e construir um I.C. 90% para a diferença. As estimativas individuais para p1 e p2 são: pˆ 1 84 0.724 116 pˆ 2 46 0.575 80 Então, uma estimativa para a diferença entre p1 e p2 é dada por pˆ 1 pˆ 2 0.724 0.575 0.149 e, a estimativa do desvio padrão da diferença 0.724 0.276 0.575 0.425 0.04777 . 116 80 Logo, um I.C. 90% para a diferença entre as proporções é dado por 0.149 1.645 0.04777 , ou seja, ( 0.0353 , 0.2627 ) é o I.C. 90% para ( p1 p2 ) . O que se pode concluir? 27 6.4. Intervalo de confiança para a variância de uma população normal Considere uma população normal com média e variância 2 , ambas desconhecidas. Em muitas aplicações práticas temos o interesse em avaliar a variabilidade dos fenômenos em estudo. Nessa situação, devemos estimar e, também, construir intervalos de confiança para a variância populacional. Considerando que a população seja normal, temos que (n 1) s 2 2n 1 2 Desta forma, a partir da distribuição 2n 1 podemos construir I.C.’s para 2 a partir de seus quantis: 2 (n 1) s 2 2 P ( n 1); / 2 (1 ) ( n 1 ); 1 / 2 2 28 2 (2n 1); / 2 1 ( n 1);1 / 2 (1 ) P 2 2 2 ( n 1 ) s ( n 1 ) s 2 (n 1) s 2 ( n 1 ) s 2 (1 ) P 2 2 ( n1);1 / 2 ( n 1); / 2 a b (n 1) s 2 ( n 1) s 2 e b 2 . a 2 ( n 1);1 / 2 ( n1); / 2 Desta forma, um I.C. (1 – )100% para 2 é dado por: ( n 1) s 2 (n 1) s 2 ; 2 2 . ( n 1); / 2 ( n 1);1 / 2 Exemplo 8: O peso de um componente mecânico é uma va com distribuição normal com média e variância 2 , desconhecidos. Pretendese estudar a variabilidade do processo de produção e, para isso, uma amostra com n = 11 componentes foi avaliada. Os pesos (g) são dados 98 97 102 100 98 101 102 105 95 102 100 x 1100 e x 2 110080. Portanto: 1100 x 100 g 11 110080 11(100) 2 s 8 g2. 10 2 29 Construir um I.C. 95% para a variância populacional ( = 0.05). 2 10 ; 0.025 3.25 e 2 10 ; 0.975 20.48 ( n 1) s 2 10 8 a 2 3.906 ( n 1);1 / 2 20.48 ( n 1) s 2 10 8 b 2 24.615 ( n 1); / 2 3.25 Um I.C. 95% para 2 é dado por ( 3.906 , 24.615 ). 30 6.5. Intervalo de confiança para a razão entre as variâncias de duas populações normais É muito comum, em aplicações estatísticas, precisarmos comparar as variâncias de duas populações, como, por exemplo, quando comparamos a média dessas populações. A comparação de duas variâncias não é feita pela diferença entre elas, mas sim pela razão das mesmas. Resultado: Seja W1 2k1 e W2 2k2 , prova-se facilmente que a razão W1 F W2 k1 Fk1 ;k2 k2 A razão de duas va independentes, com distribuição quiquadrado, divididas pelos seus respectivos graus de liberdade (k1 e k2), tem distribuição F de Snedecor, em que k1 são os graus de liberdade do numerados e k2 os graus de liberdade do denominador. Notas: i) Se X tk , então X 2 F1,k . Prova: Sai direto do resultado (1) da distribuição t-Student. ii) Existe uma relação entre os quantis das distribuições F, de forma que Fk1 ;k2 ; 1 Fk2 ;k1 ;1 31 Sejam duas populações normais com variâncias 12 e 22 e sejam s12 e s22 seus estimadores a partir de amostras de tamanho n1 e n2 , então (n1 1) s12 / 12 (n1 1) F (n2 1) s22 / 22 (n2 1) Fn1 1 ; n2 1 Mas a razão F acima pode ser simplificada por: s12 F s22 12 22 22 s12 2 2 Fn1 1 ; n2 1 1 s2 Logo, um I.C. para razão entre duas variâncias é construído a partir de: 22 s12 P f1 2 2 f 2 (1 ) 1 s2 em que: f1 F( n1 1);( n2 1); / 2 e f 2 F( n1 1);( n2 1);1 / 2 . s22 22 s22 P f1 2 2 f 2 2 (1 ) 1 s1 s1 32 12 Portanto, escrevendo o resultado para 2 , um I.C. (1 – )100% 2 para a razão de variâncias é dado por: s12 12 s12 (1 ) P 2 2 2 2 f1 s2 f 2 s2 Ou seja, o intervalo para a razão entre duas variâncias de populações normais é definido por: s12 s12 ; 2 . 2 s F s F 2 ( n1 1);( n2 1); / 2 2 ( n1 1);( n2 1);1 / 2 s12 Nota: O intervalo é construído de forma que 2 seja maior do que 1. s2 Exemplo 9: Construir um I.C. 95% para a razão entre as variâncias da resistência à compressão em concretos dos cimentos das marcas A e B. sA2 = 21.759 nA = 13 sB2 = 25.174 nB = 15 sB2 Com 2 1 , F14;12; 0.025 0.3279 e F14;12; 0.975 3.2062 . sA sB2 sA2 F14;12; 0.975 25.174 0.3608 21.759 3.2062 33 sB2 sA2 F14;12; 0.025 25.174 3.5284 21.759 0.3279 2B Assim, um I.C. 95% para 2 é dado por ( 0.3608 , 3.5284 ). A 34 6.6. Exercícios 1. Deseja-se comparar a qualidade de um produto produzido por duas indústrias. Essa qualidade será definida pela uniformidade com que o produto é produzido. Tomaram-se duas amostras, uma de cada indústria, medindo-se o tamanho dos produtos (cm). a) A qualidade das duas fábricas é a mesma? Caso a sua resposta seja negativa, dê um intervalo de confiança para indicar a intensidade dessa desigualdade. b) Construir um I.C. 99% para a diferença entre as médias, ( A B ) Estatísticas Indústria A Indústria B Tamanho da Amostra 21 17 Médias 21.15 21.12 Variâncias 0.0412 0.1734 2. Num estudo comparativo do tempo médio de adaptação dos empregados de um grande complexo bancário, uma amostra aleatória, de 50 homens e 50 mulheres, produziu os seguintes resultados: Estatísticas Homens Mulheres Tamanho da Amostra 50 50 Médias 3.2 anos 3.7 anos Desvios-padrões 0.8 anos 0.9 anos Que conclusões você pode tirar para a população de homens e mulheres desse banco? (Indique quais as suposições feitas) 3. Suponha que uma associação de defesa de consumidores deseja estimar o consumo médio um novo modelo de automóvel que será lançado no mercado. Para fazer esta verificação, a associação observa uma amostra de 10 veículos, conduzidos por motoristas treinados, num percurso de 100 milhas. O consumo, em galões, foi registrado com os seguintes resultados: x 43.28 e x 2 188.4886 Assumindo que estes valores representam uma amostra aleatória de uma variável normalmente distribuída com média e variância 2 . a) Calcule estimativas pontuais para e 2 . b) Calcule um intervalo de 75 % de confiança para 2 . 35 4. Os dados abaixo s†o uma amostra aleat‹ria para estimar a propor…†o estudantes de uma universidade que possuem autom‹vel. Foi constru‰do o intervalo conservador de 90% de confian…a para p : ( 0.5555 ; 0.8845 ) Um segundo intervalo foi constru‰do considerando a normalidade de p̂ : ( 0.4887 ; 0.9513 ) a) Qual ‡ a estimativa pontual para p̂ ? b) Qual ‡ o tamanho da amostra? c) Qual o n‰vel de confian…a do segundo intervalo 5. Da popula…†o X Normal(50; 100) retirou-se uma aa de n = 10 elementos e da popula…†o Y Normal(60; 100) retirou-se uma aa de m = 6 elementos, independente da primeira, obtendo-se as variŠncias amostrais s12 e s22 , respectivamente. a) Encontre o valor de a, tal que Ps12 s22 a 0.95 b) Encontre o valor de b, tal que Ps12 s22 b 0.95 6. Uma das maneiras de medir o grau de satisfa…†o dos empregados de uma mesma categoria quanto ƒ pol‰tica salarial ‡ por meio do desvio padr†o de seus sal„rios. A F„brica A diz ser mais coerente na pol‰tica salarial do que a F„brica B. Para verificar essa afirma…†o, sorteou-se uma amostra de 10 funcion„rios n†o especializados de A, e 15 de B, obtendo-se os desvios padrŒes s A 1000 reais e sB 1600 reais. Qual seria a sua conclus†o? 36 Resolução: 1. Deseja-se comparar a qualidade de um produto produzido por duas indústrias. Essa qualidade será definida pela uniformidade com que o produto é produzido. Tomaram-se duas amostras, uma de cada indústria, medindo-se o tamanho dos produtos (cm). a) A qualidade das duas fábricas é a mesma? Caso a sua resposta seja negativa, dê um intervalo de confiança para indicar a intensidade dessa desigualdade. n A 21 x A 21.15 s A2 0.0412 nB 17 xB 21.12 s B2 0.1734 2B I.C. 95% para 2 : A Limite inferior: 0.1734 0.1734 1.652 0.0412 F16; 20; 0.975 0.0412 2.547 Como F16; 20; 0.025 Limite superior: 1 F20;16;0.975 1 0.3731 2.68 0.1734 0.1734 11.280 0.0412 F16; 20; 0.025 0.0412 0.3731 2B O intervalo ( 1.652 ; 11.283 ) é um intervalo de confiança 95% para 2 . A Como o intervalo não engloba o valor 1, então, há evidência suficiente para afirmar que 2A 2B . Logo, a qualidade das duas indústrias não é a mesma. A indústria A, com menor variabilidade, tem melhor qualidade. 37 b) I.C. 99% para ( A B ) considerando variâncias diferentes. 2 s A2 sB2 n n 2 A2 B 2 sA / nA sB / nB 2 nA 1 nB 1 2 0.0412 0.1734 21 17 22.1 22 gl 2 2 0.0412 / 21 0.1734 / 17 20 16 / 2 0.005 t 22; 0.005 2.8188 ( x A xB ) t 22 ;0.005 0.03 2.8188 s 2A s B2 n A nB 0.0412 0.1734 21 17 ( –0.281 ; 0.341 ) é o I.C. 99% para a diferença entre as médias de tamanhos dos produtos das indústrias A e B. 2. Num estudo comparativo do tempo médio de adaptação dos empregados de um grande complexo bancário, uma amostra aleatória de 50 homens e 50 mulheres produziu os seguintes resultados: A qualidade das duas fábricas é a mesma? (comparar as variâncias) nH 50 nM 50 xH 3.2 anos xM 3.7 anos s H 0.8 anos sM 0.9 anos 38 Que conclusões você pode tirar com relação ao tempo de adaptação de homens e mulheres desse banco? (Indique quais suposições foram feitas) 2M I.C. 95% para 2 : H (0.9) 2 0.81 0.7182 Limite inferior: (0.8) 2 F49 ; 49;0.975 0.64 1.7622 (0.9) 2 0.81 Limite superior: 2.2302 2 (0.8) F49 ; 49;0.025 0.64 0.5675 2M O intervalo ( 0.7182 ; 2.2302 ) é um intervalo 95% para 2 . H Como o intervalo engloba o valor 1, então, não há evidência suficiente para afirmar que as variâncias são diferentes. I.C. 90% para a diferença entre os tempos médios de adaptação entre homens e mulheres, com variâncias iguais. (nM 1) sM2 ( nH 1) s H2 49 0.64 49 0.81 s 0.725 nM n H 2 98 2 p / 2 0.05 t98; 0.05 1.6606 ( x M xH ) t98; 0.05 (3.7 3.2) 1.6606 s 2p nM s 2p nH 0.725 0.725 50 50 ( 0.2172 ; 0.7828 ) é o I.C. 90% para a diferença entre os tempos médios de adaptação de entre mulheres e homens. 39 O intervalo n†o engloba o zero, portanto, há evidências suficientes para afirmar que os homens t•m um tempo de adapta…†o menor do que as mulheres. Suposições: Normalidade dos tempos de adapta…†o de homens e mulheres 3. Uma associa…†o de defesa de consumidores deseja estimar o consumo m‡dio um novo modelo de autom‹vel que ser„ lan…ado no mercado. Para fazer esta verifica…†o, a associa…†o observa uma amostra de 10 ve‰culos, conduzidos por motoristas treinados, num percurso de 100 milhas. O consumo, em galŒes, foi registrado com os seguintes resultados: x 43.28 e x 2 188.4886 Assumindo que estes valores representam uma amostra aleat‹ria de uma vari„vel normalmente distribu‰da com m‡dia e variŠncia 2 . a) Calcule estimativas pontuais para e 2 . ˆ x 43.28 4.328 10 188.4886 10(4.328) 2 1.17276 ˆ s 0.13031 (10 1) 9 2 2 b) Calcule um intervalo de 75% de confian…a para 2 . ( 0.25 ) 9; 0.125 4.507 e 9; 0.875 13.926 (n 1) s 2 1.17276 0.0842 Limite inferior: 9 ;0.875 13.926 (n 1) s 2 1.17276 Limite superior: 0.2602 9 ; 0.125 4.507 I.C. 75% para a variŠncia 2 ‡ dado por: ( 0.0842 ; 0.2602 ) 40 4. Os dados abaixo s†o uma amostra aleat‹ria para estimar a propor…†o estudantes de uma universidade que possuem autom‹vel. Intervalo conservador de 90% de confian…a para p : ( 0.5555 ; 0.8845 ) Intervalo considerando a normalidade de p̂ : ( 0.4887 ; 0.9513 ) a) E pontual para p̂ ? (ponto médio dos intervalos) pˆ 0.5555 0.8845 0.4887 0.9513 0.72 2 2 b) Qual ‡ o tamanho da amostra? Sabe-se que o tamanho do I.C. 90% conservador ‡ dado por: Z 0.05 1 0.5555 0.72 4n 1.645 0.1645 4n 4n 10a n 25 c) Qual o n‰vel de confian…a do segundo intervalo 0.72 Z / 2 Z / 2 pˆ (1 pˆ ) 0.9513 25 5 (0.9513 0.72) 2.576 0.72 0.28 O n‰vel de confian…a do I.C. ‡ (1 ) 0.99 ou 99%. 41 5. Da popula…†o X Normal(50;100) retirou-se uma aa de n = 10 elementos e da popula…†o Y Normal(60;100) retirou-se uma aa de m = 6 elementos, independente da primeira, obtendo-se as variŠncias amostrais s12 e s22 , respectivamente. a) Encontre o valor de a, tal que Ps12 s22 a 0.95 Obs: 12 22 100 s12 Fn 1; m 1 s12 s22 Ps12 s22 a 0.95 a F9;5; 0.95 4.772 s22 12 22 F9 ;5 b) Encontre o valor de b, tal que Ps12 s22 b 0.95 Da rela…†o entre as distribui…Œes F’s F9 ;5; 0.05 1 F5;9; 0.95 1 0.2872 3.482 Ps12 s22 b 0.95 b F9;5; 0.05 0.2872 6. Uma das maneiras de medir o grau de satisfa…†o dos empregados de uma mesma categoria quanto ƒ pol‰tica salarial ‡ por meio do desvio padr†o de seus sal„rios. A F„brica A diz ser mais coerente na pol‰tica salarial do que a F„brica B. Para verificar essa afirma…†o, sorteou-se uma amostra de 10 funcion„rios n†o especializados de A, e 15 de B, obtendo-se os desvios padrŒes s A 1000 reais e sB 1600 reais. Qual seria a sua conclus†o? O grau de satisfa…†o com o sal„rio ‡ o mesmo nas duas f„bricas? (comparar as variâncias) 42 n A 10 s A 1000 s A2 1 106 nB 15 s B 1600 s B2 2.56 106 2B Construir um I.C. 95% para 2 e verificar se engloba o valor 1: A s B2 2.56 106 Limite inferior: 2 0.6740 s A F14;9 ;0.975 1 106 3.7980 Como F14;9; 0.025 1 F9 ;14; 0.975 1 0.3116 3.209 s B2 2.56 106 Limite superior: 2 8.2157 s A F14;9 ; 0.025 1 106 0.3116 2B I.C. 95% para 2 : ( 0.6740 ; 8.2157 ) A O I.C. engloba o valor 1, portanto, não há evidência para sustentar a afirmação da Fábrica A.