Escola Politécnica de Pernambuco Departamento de Ensino Básico Capítulo 07 Teoria da Estimação Prof. Sérgio Mário Lins Galdino http://epoli.pbworks.com/ Agenda Estimativas não-tendenciosos e Estimativas Eficientes Estimativas pontuais e Estimativas Intervalares Estimativas do Intervalo de Confiança dos Parâmetros da População Intervalos de Confiança para Médias Intervalos de Confiança para Proporções Intervalos de Confiança para Diferenças e Somas Estimativas não-tendenciosos e Estimativas Eficientes Uma estimativa é não tendenciosa quando a média ou esperança da estatística é igual ao parâmetro da população. Quando duas estatísticas da distribuição amostral tem mesma média, a estatística coma menor variância é a mais eficiente. Estatística eficiente e não tendenciosa nem sempre é possível Estimativas pontuais e Estimativas Intervalares Um estimador pontual de um parâmetro populacional é dado por um único valor. Um estimador intervalar de um parâmetro populacional é dado por dois números (limites inferior e superior) no qual o parâmetro é considerado pertencer. Exemplo: Temperatura: 28ºC (pontual) Temperatura: 28±2 (intervalar) Estimativas do Intervalo de Confiança dos Parâmetros da População Sejam s e s a média e o desvio padrão (erro padrão) da distribuição amostral de uma estatística amostral S. Assumindo S normalmente distribuída ( n ≥ 30, lei dos grandes números). Espera-se encontrar S nos intervalos s ± s , s ±2 s e s ± 3s em cerca de 68,27%, 98,45% e 99,83% das vezes. Estimativas do Intervalo de Confiança dos Parâmetros da População Os números extremos dos intervalos S1.96s e S2.58s, são chamados limites de confiança 1- 95% e 99% (ou 0.95 e 0.99). Os números 1.96, 2.98, etc. são os valores críticos (zc). Limite de 99 98 confiança zc 2.58 2.33 Exemplo: 96 95 90 2.05 1.96 1.645 1.28 > LC= 0.95 > ZC = qnorm(1 - (1-LC)/2) > ZC [1] 1.959964 80 50 0.6745 Estimativas do Intervalo de Confiança dos Parâmetros da População O limite de confiança (1-).100% onde [0, 1] (LC = 1- ) pode-se determinar um z∗ como P (−z∗ < z < z∗) = 1 − α z∗ é chamado de z1−α/2 . Em R ele é calculado pela função qnorm > alpha = c(0.01,0.02,0.04,0.05,0.10,0.20,0.5) > zasterisco = qnorm(1 - alpha/2) > zasterisco [1] 2.5758293 2.3263479 2.0537489 1.9599640 1.6448536 1.2815516 0.6744898 > Intervalos de Confiança para Médias Amostras grandes ( n ≥ 30). Os limites de confiança para a média da população são X ZC n no caso de uma população infinita, ou por X ZC n N n N 1 no caso de amostragem com reposição de uma população finita, Intervalos de Confiança para Médias Exemplo: Encontre os limites de confiança de 95% e 99% de uma amostra de tamanho 30 com média 1.82 e desvio padrão amostral 0.17. Resposta: Os limites de confiança de 95% são 1.82 1.96 0.17 1.82 0.06 30 > qnorm(1-(1-0.95)/2)*0.17/sqrt(30) [1] 0.0608326 > Intervalos de Confiança para Médias Os limites de confiança de 99% são 1.82 2.58 0.17 1.82 0.08 30 > qnorm(1-(1-0.99)/2)*0.17/sqrt(30) [1] 0.07994759 > Intervalos de Confiança para Médias Amostras pequenas (n < 30) e População Normal. Usa-se a distribuição T (t de Student) para obtenção dos limites de confiança. Por exemplo -t0.95 e t0.95 são os valores de T para os quais 5% da área pertence a cada lado da distribuição T X t0.95 n t0.95 ˆ S Intervalos de Confiança para Médias Amostras pequenas (n < 30) e População Normal. pode ser estimado pertencer ao intervalo X t0.975 Sˆ Sˆ X t0.975 n n com 95% de confiança. Os limites de confiança são Sˆ X tc n com tc obtido por tabela ou calculado Intervalos de Confiança para Médias Amostras pequenas (n < 30) e População Normal. Exemplo: Os valores de tc em R são calculado pela função qt. > qt(.975, df = c(1:10,20,50,100,1000)) [1] 12.706205 4.302653 3.182446 2.776445 2.570582 2.446912 2.364624 2.306004 2.262157 2.228139 2.085963 [12] 2.008559 1.983972 1.962339 > Intervalos de Confiança para Médias Amostras pequenas (n < 30) e População Normal. Exemplo: x=c(175, 176, 173, 175, 174, 173, 173, 176, 173, 179) n=length(x) xm=mean(x) df=n-1 tc=qt(0.975,df) delta.x=tc*sd(x)/sqrt(n) x.inf=xm-delta.x x.sup=xm+delta.x Intervalos de Confiança para Médias Amostras pequenas (n < 30) e População Normal. Exemplo(continuação) ># Intervalo de confiança de 95% > x.inf [1] 173.3076 > x.sup [1] 176.0924 > # Média de x > xm [1] 174.7 > xm/sd(x)*sqrt(10) [1] 283.8161 > Intervalos de Confiança para Médias Amostras pequenas (n < 30) e População Normal. Exemplo(continuação) > t.test(x) One Sample t-test data: x t = 283.8161, df = 9, p-value < 2.2e-16 alternative hypothesis: true mean is not equal to 0 95 percent confidence interval: 173.3076 176.0924 sample estimates: mean of x 174.7 > Intervalos de Confiança para Proporções Suponha que a estatística S é a proporção de “sucesso” em uma amostra de tamanho n≥30 extraída de uma população binomial em que p é a proporção de sucessos (i. é., probabilidade de sucesso). Os limites de confiança para a proporção da população são dadas por P zc pq P zc n p(1 p) n para uma amostra de população infinita, ou uma amostra com reposição de uma população finita. Intervalos de Confiança para Proporções (continuação) Os limites de confiança para a proporção da população são dadas por P zc pq N n P zc n N 1 se a amostragem é sem reposição , de uma população finita de tamanho N. Intervalos de Confiança para Proporções (continuação) Exemplo: Uma amostra aleatória de 600 eleitores de certo distrito eleitoral dá 55% como favoráveis a determinado candidato A. Determine limites de confiança para a proporção global de eleitores favoráveis ao candidato na base de 99%. Os limites de confiança de 99% para população são P 2.58 P P P p(1 p) 0.55 0.45 0.55 2.58 n 1000 0.55 0.04 Conclusão: O candidato A está com 99% de chance para vencer as eleições Intervalos de Confiança para Diferenças e Somas Se S1 e S2 são duas estatísticas amostrais com distribuições amostrais aproximadamente normais, a expressão S1 S 2 zc S1 S2 S1 S 2 zc S21 S22 dá limites de confiança para as diferenças dos parâmetros populacionais, e S1 S 2 zc S1 S2 S1 S 2 zc S21 S22 dá os limites de confiança para a soma dos parâmetros populacionais, desde que as amostras sejam independentes. Intervalos de Confiança para Diferenças e Somas No caso de populações infinitas X 1 X 2 zc X 1 X 2 X 1 X 2 zc X2 1 X2 2 dá limites de confiança para as diferenças dos parâmetros populacionais onde X 1,1, n1 e X , 2 , n2 são as respectivas médias, desvios padrões e tamanhos das duas amostras populacionais. 2 Analogamente, P1 P2 zc P1 P2 P1 P2 zc p1 (1 p1 ) p2 (1 p2 ) n1 n2 dá os limites de confiança para a soma dos parâmetros populacionais, desde que as amostras sejam independentes.