Intervalos de Confiança Gueibi Peres Souza [email protected] Introdução • Mais comum: estimativas pontuais do verdadeiro parâmetro; • A medida real nunca será determinada com absoluta confiança; • Estimativa do parâmetro pode ser feita através de intervalo de confiança; • A probabilidade do intervalo conter o parâmetro é especificada; 2 Introdução • O intervalo é definido por dois limites que possuem um grau de confiança; • Este grau de confiança é escolhido (depende do grau de precisão que desejamos obter na estimativa); • Mais comum: P(90%, 95% e 99%); • Vantagem: expressar o erro que aceitamos ao calculá-la (ideia da precisão); • Intervalo pequeno = alta precisão (do valor pontual); • Quanto maior o grau de confiança exigido maior a amplitude do intervalo (menor precisão do valor pontual); 3 Tipos de Intervalo de Confiança 1. Intervalo de confiança para a média populacional (μ) quando a variância populacional (σ2) é conhecida; 2. Intervalo de confiança para a média populacional (μ), utilizando a distribuição “t” (σ2 desconhecida) ; 3. Intervalo de confiança para a média utilizando a desigualdade de Chebyshev; 4 Tipos de Intervalo de Confiança 4. Intervalo de confiança para proporção, utilizando a distribuição normal; 5. Intervalo de confiança para o desvio padrão e variância; 6. Intervalo de confiança para diferença entre duas médias populacionais; 7. Intervalo de confiança para a diferença entre duas proporções; 5 Intervalo de Confiança para μ utilizando distribuição normal • Quando a variância populacional (σ2) é conhecida: • O uso da distribuição normal na estimação da média é garantida nos seguintes casos: • Para qualquer grande amostra (n ≥ 30); • Para uma pequena amostra (n < 30) somente se a população for normalmente distribuída e “σ” for conhecido; – Obs.: se n ≥ 30 e σ for desconhecido, para se obter os limites de confiança emprega-se a estimativa da amostra (s); 6 Intervalo de Confiança para μ utilizando distribuição normal • Os limites de confiança para a média populacional são dados por X ± z c × σ X ou vvcvvcv X ± zc × sX ; • Onde: – X média aritmética da amostra ; – zc valor do grau de confiança do intervalo ; σ σ σX = ou σ X = n n z 90% 1,64 95% 1,96 99% 2,58 Só para distribuição amostral N-n N-1 Obs.: Grau de confiança = 1 – nível de significância (α) s s sX = ou s X = n n N-n N-1 7 Intervalo de Confiança para μ utilizando distribuição normal • Ex.1: Seja “X” a duração da vida de uma lâmpada. Cem lâmpadas foram testadas obtendo-se uma duração de vida média de 1000 horas com desvio padrão de 100 horas. Determine o intervalo de confiança de 95% para a média de população. n = 100 X ± zc × σX σX = σ σ ou σ X = n n N-n N-1 X ± zc × sX sX = s s ou s X = n n N-n N-1 X = 1000 h s = 100 h GC = 95% 8 Intervalo de Confiança para μ utilizando distribuição normal n = 100 n > 30 X = 1000 h X ± zc × sX s = 100 h IC = 95% 1000 1,96 0,475 - 1,96 0,475 0 X ± zc × 100 100 1000 1,96 10 = +1,96 P 980,4 h < < 1019,6 h = 95% s n 980,4 h + 1019,6 h • Conclusão: podemos dizer com 95% de confiança que a vida média de duração da lâmpada está entre 980,4h e 1019,6h. 9 Intervalo de Confiança para μ utilizando distribuição normal • Ex.2: O diâmetro das arruelas produzidas por uma determinada indústria formam uma população normalmente distribuída onde o desvio padrão é 2 milímetros. Foi extraída uma amostra de 15 arruelas obtendo-se uma média de 12 mm. Construa um intervalo de confiança de 99% para estimar o diâmetro das arruelas. X ± zc × σX σX = σ σ ou σ X = n n X ± zc × sX N-n N-1 sX = s s ou s X = n n N-n N-1 10 Intervalo de Confiança para μ utilizando distribuição normal σ = 2 mm n = 15 X = 12 mm X ± zc × σX σX = σ n 2 2 σX = = 0,52 3,87 15 13,34 12 2,57 0,52 = 10,66 P 10,66 < μ < 13,34 = 99% 0,495 - 2,57 0,495 0 +2,57 11 Intervalo de Confiança para μ utilizando a distribuição “t” • Utiliza-se a distribuição “t” de Gosset para estimar a média populacional quando: – n < 30; – População normalmente distribuída; – σ desconhecido. • Então: X ± t c × s X Graus de de liberdade (gl) de t c = n - 1 s s sX = ou s X = n n N-n N-1 12 Intervalo de Confiança para μ utilizando a distribuição “t” • Ex.3: Em uma amostra realizada em 20 pilhas para máquina de calcular a média de duração observada foi de 120 horas com desvio padrão de 30 horas. Determinar os limites de confiança de 95% para média de horas real. X ± t c × sX n = 20 gl = n - 1 X = 120 h s = 30 h sX = s s ou s X = n n N-n N-1 13 Intervalo de Confiança para μ utilizando a distribuição “t” • Ex.3: 120 t c 30 20 gl = n - 1 120 2,093 0,025 0,025 0,95 - 2,09 0 gl = 20 - 1 = 19 30 = 20 134,02 105,98 P 105,98 h < μ < 134,02 = 0,95 2,09 • Conclusão: Pode-se afirmar com 95% de confiança que os limites das médias de horas de duração das pilhas são de 105,98 h e 134,02 h. 14 Intervalo de Confiança para μ utilizando a desigualdade de Chebyshev • A desigualdade de Chebyshev é utilizada para o cálculo do intervalo da média populacional quando a amostra é pequena (n < 30) e a população não é normalmente distribuída; X ± k c × σX X ± k c × sX • Onde: sX = s s ou s X = n n 1 1 - 2 = Grau de confiança kc N-n N-1 1 = 1 - GC 2 kc α σX = σ σ ou σ X = n n 1 k = kc = α 2 c N-n N-1 1 α 15 Intervalo de Confiança para μ utilizando a desigualdade de Chebyshev • Ex.4: Foi testada uma amostra de 10 garrafas de uma certa marca de bebida com relação ao seu teor de álcool. Foi encontrada uma média de 40% Vol. e 2% Vol. de desvio padrão. Sabendo que são produzidas diariamente apenas 100 garrafas dessa marca, as quais não se distribuem normalmente, determine os limites de confiança diários de 99% para a média real de teor alcoólico desta marca de bebida. X ± k c × σX X ± k c × sX σX = σ σ ou σ X = n n N-n N-1 sX = s s N1- n ou s X = kc2 = kc = Nα- 1 n n 1 α 16 Intervalo de Confiança para μ utilizando a desigualdade de Chebyshev • Ex.4: X ± k c × sX n > 5% N 1 1 - 0,99 kc = k c = 10 n = 10 X = 40% Vol. s = 2% Vol. s sX = n N-n N-1 0,02 sX = 10 100 - 10 100 - 1 N = 100 GC = 99% sX = 0,02 10 X ± k c × sX 0, 4 10 0,0063 0,9535 = 90 99 0,4 ±10 0,02 10 90 99 46% Vol. 34% Vol. 17 Intervalo de Confiança para a proporção utilizando distribuição normal • O uso da distribuição normal como aproximação da binomial, para construção de intervalo de confiança, é garantida quando: • n ≥ 30; • np ≥ 5; • Neste caso: p z c s p – Onde: ou sp = p q n N-n N-1 18 Intervalo de Confiança para a proporção utilizando distribuição normal • Ex.5: Em 65 lotes testados de um determinado processo produtivo, foram rejeitados 26 por não estarem dentro dos padrões de qualidade aceitáveis. Determinar os limites de confiança de 90% para a proporção de rejeições que seria obtido em um grande número de lotes gerados neste processo. n = 65 26 p= = 0,4 65 q = 0,6 GC = 90% p zc sp sp = p q n N-n N-1 19 Intervalo de Confiança para a proporção utilizando distribuição normal n = 65 26 p= = 0,4 65 q = 0,6 GC = 90% p zc sp = 0,24 65 p q n sp = 0,45 0,45 0 0,24 65 0,300 0,4996 0,05 0,9 - 1,64 sp = 0,24 = 0,4 0,0996 = 65 0,4 1,64 0,05 0,4 0,6 65 1,64 • Conclusão: podemos afirmar com 90% de confiança que este processo produzirá entre 30 e 50% de lotes defeituosos. E se elevássemos o GC? O que significaria em termos de precisão? 20 Intervalo de Confiança para o desvio padrão e a variância • Desvio padrão: 2 n 1 s 2 superior σ 2 n 1 s 2 inferior • Variância: n - 1 s 2 superior 2 σ Onde: gl = n – 1 para ambos os casos. 2 n - 1 s 2 2 inferior 21 Intervalo de Confiança para o desvio padrão e a variância • Ex.6: O desvio padrão dos diâmetros de 16 esferas produzidas por uma determinada fábrica é de 240 mm. Determine os limites de confiança de 95% para o desvio padrão de todos os diâmetros de esferas que serão produzidas por esta fábrica. n - 1 s 2 n = 16 s = 240 GC = 95% 2 superior n - 1 s 2 superior σ 2 σ 2 n - 1 s 2 2 inferior n - 1 s 2 inferior gl = n - 1 2 22 Intervalo de Confiança para o desvio padrão e a variância n - 1 s 2 2 superior σ n - 1 s 2 gl = n - 1 gl = 16 - 1 = 15 2 inferior 16 - 1 2402 0,025 27,5 σ 16 - 1 2402 6, 26 0,025 0,95 177,25 σ 371,51 2 2 0,025; gl = 0,025; 15 = 27,5 2 2 0,975; gl = 0,975; 15 = 6,26 2 superior 2 inferior • Conclusão: podemos afirmar com 95% de confiança que o desvio padrão do diâmetro de todas as esferas produzidas por esta fábrica estarão entre 177,25 e 371,51 mm. 23 Intervalo de Confiança para o desvio padrão e a variância • Ex.7: Usando agora 20 esferas produzidas pela mesma fábrica obteve-se um desvio padrão igual a 100 mm. Determine o intervalo de confiança de 90% para a variância. n = 20 s = 100 mm GC = 90% n - 1 s 2 2 superior n - 1 s2 2 superior σ σ 2 n - 1 s 2 2 inferior n - 1 s2 gl = n - 1 2 inferior 24 Intervalo de Confiança para o desvio padrão e a variância n - 1 s2 2 superior σ 2 n - 1 s2 20 - 1 1002 2 inferior σ2 2 superior 20 - 1 1002 0,05 2 inferior gl = 19 0,05 0,9 2 0,95; 19 20 - 1 1002 30,1 2 0,05; 19 = 30,1 = 10,1 2 inferior 2 superior σ2 20 - 1 1002 10,1 6312,30 σ 2 18811,88 • Conclusão: podemos afirmar com 90% de confiança que a variância do diâmetro de todas as esferas produzidas pela fábrica estará entre 6.312,30 e 18.811,88 mm2. 25 Intervalo de Confiança para a diferença entre duas médias populacionais • Utilizando a distribuição normal: X 1 X2 zc σX1 X2 • Onde: σ X1 -X2 = • Ou X 1 σ12 σ 22 + n1 n2 X2 zc sX1 X2 s X1 -X2 = 2 1 2 2 s s + n1 n2 26 Intervalo de Confiança para a diferença entre duas médias populacionais • Utilizando a distribuição normal: • Ex.8: A média de “dureza” para uma amostra de 30 blocos de motores produzidos por um determinado fornecedor é de 180 Mg Pascal, com desvio padrão amostral de 14 Mg Pascal. Em outro fornecedor uma amostra aleatória de 40 blocos apresentou uma “dureza” média de 170 Mg Pascal com desvio amostral de 10 Mg Pascal. Determine o intervalo de confiança de 99% para diferença entre as “durezas” médias das duas fundições fornecedoras. 27 Intervalo de Confiança para a diferença entre duas médias populacionais • Utilizando a distribuição normal: s X1 -X2 = X 1 s12 s 22 + n1 n2 sX1 -X2 142 102 = + 30 40 196 100 + 30 40 6,533 + 2,5 = s X1 -X2 = 3 X2 zc sX1 X2 180 170 zc 3 180 170 2,58 3 10 7,74 = 17,74 2,26 0,99 0,005 0,495 - 2,58 0,005 0,495 0 2,58 • Conclusão: podemos afirmar com 99% de confiança que a diferença entre as durezas médias das duas empresas fornecedoras está entre 2,26 e 17,74 Mg Pascal. 28 Intervalo de Confiança para a diferença entre duas médias populacionais • Utilizando a distribuição “t”: X 1 X 2 t c s X1 X2 1 1 + n1 n2 • Onde: gl = n1 + n 2 - 2 s X1 - X2 = 2 2 n 1 s + n 1 s 1 1 2 2 n1 + n 2 - 2 29 Intervalo de Confiança para a diferença entre duas médias populacionais • Utilizando a distribuição “t”: • Ex.9: Para uma amostra aleatória de 10 lâmpadas a vida média é de 4000 horas com desvio padrão de 200 horas. Suponha-se que a duração das lâmpadas tenha uma distribuição normal. Para uma outra marca de lâmpada cuja duração também se supõe normalmente distribuída uma amostra de 8 lâmpadas apresenta média de 4600 horas e desvio padrão de 250 horas. Estime o intervalo de confiança de 90% para a diferença entre a vida média de operação das duas marcas de lâmpada. 30 Intervalo de Confiança para a diferença entre duas médias populacionais • Utilizando a distribuição “t”: n1 = 10 X1 = 4000 s1 = 200 n2 = 8 X 2 = 4600 gl = 10 + 8 - 2 = 16 gl = n1 + n 2 - 2 sX1 -X2 = 10 - 1 2002 4000 4600 8 - 1 2502 10 + 8 - 2 1,75 223,6 s 2 = 250 GC = 90% 600 183,63 = -416,37 223,26 1 1 + 10 8 0,9 0,05 0,45 -783,63 0,05 0,45 0 • Conclusão: podemos afirmar com 95% de confiança que a diferença da vida média de operação da marca B em relação a marca A está entre 416,37 e 783,63 horas. 31 Intervalo de Confiança para a diferença entre duas proporções p1 p2 zc σp1 p2 • Onde: σp = p1 q1 p2 q 2 n1 n2 32 Intervalo de Confiança para a diferença entre duas proporções • Ex.10: Uma pesquisa de mercado revelou que a proporção de 0,4 crianças de uma amostra aleatória de 100 em uma grande comunidade preferem brinquedos de uma Companhia X. Em uma outra grande comunidade 60 crianças de uma amostra aleatória de 200 preferem os brinquedos da mesma companhia. Determine o intervalo de confiança de 90% para a diferença na proporção de crianças das duas comunidades que preferem o brinquedos da companhia X. p1 p2 zc σp1 p2 σp = p1 q1 p q2 2 n1 n2 33 Intervalo de Confiança para a diferença entre duas proporções A n A = 100 B n B = 200 p A = 0,4 60 = 0,3 200 q B = 0,7 q A = 0,6 0,4 pB = 0,9 0,05 0,45 - 1,64 σp = 0,45 0 0,05 1,64 0,4 0,6 0,3 0,7 = 0,059 100 200 0,3 1,64 0,059 0,1 0,097 = 0,197 0,003 • Conclusão: podemos afirmar com 90% de confiança que a diferença na proporção de crianças das duas comunidades que preferem os brinquedos da Cia X está entre 0,3% e 19,7%. 34