Capítulo 8 Estimativa do Intervalo de Confiança Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 8-1 Objetivos: Neste capítulo, você aprenderá: Construir e interpretar estimativas de intervalos de confiança para a média aritmética e para a proporção Determinar o tamanho da amostra necessário para desenvolver um intervalo de confiança para a média aritmética ou para a proporção Utilizar estimativas de intervalos de confiança em auditoria Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 8-2 Tópicos Intervalos de confiança para a média populacional, μ Quando o desvio-padrão da população σ é conhecido Quando o desvio-padrão da população σ é desconhecido 2. Intervalos de confiança para a proporção populacional, π 3. Determinação do tamanho da amostra necessário 1. Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 8-3 Estimativa Pontual Uma estimativa pontual é um número único. Para a média populacional (e desvio-padrão populacional), a estimativa pontual é a média amostral (e o desvio-padrão amostral). O intervalo de confiança traz informações adicionais sobre a variabilidade da estimativa. Limite Inferior do Intervalo Estimativa Pontual Limite Superior do Intervalo Largura (amplitude) do Intervalo de Confiança Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 8-4 Estimativas do Intervalo de Confiança Um intervalo de confiança dá um intervalo de valores possíveis: Leva em consideração a variação na estatística amostral que ocorre de amostra para amostra Baseada em todas as observações de 1 amostra Dá informações sobre a proximidade do parâmetro populacional desconhecido Estabelecido em termos do nível de confiança Ex. 95% de confiança, 99% de confiança Não pode ser nunca 100% de confiança Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 8-5 Estimativas do Intervalo de Confiança A fórmula geral de todos os intervalos de confiança é: Estimativa Pontual ± (Valor Crítico) (Desvio Padrão) Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 8-6 Nível de Confiança Nível de Confiança Confiança de que o intervalo conterá o parâmetro populacional desconhecido Um percentual (menor que 100%) Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 8-7 Nível de Confiança Suponha nível de confiança = 95% Também escrito (1 - ) = .95 Uma interpretação da frequência relativa: No longo prazo, 95% de todos os intervalos de confiança que poderão ser construídos conterão o parâmetro desconhecido Um intervalo específico pode conter ou não o parâmetro verdadeiro Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 8-8 Intervalo de Confiança para μ (σ conhecido) Premissas Desvio-Padrão da população σ é conhecido População é normalmente distribuída Se a população não é normal, use amostras grandes Estimativa do Intervalo de Confiança: σ XZ n (onde Z é o valor crítico em uma distribuição normal padronizada para uma probabilidade α/2 em cada cauda) Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 8-9 Encontrando o Valor Crítico, Z Considere um intervalo de confiança de 95%: 1 .95 α .025 2 Z unidades: X unidades: α .025 2 Z= -1.96 Limite Inferior do Intervalo 0 Estimativa Pontual Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Z= 1.96 Limite Superior do Intervalo Chap 8-10 Encontrando o Valor Crítico, Z Intervalos de Confiança mais comuns: 90%, 95%, e 99% Nível de Confiança Coeficiente de Confiança Valor Z 80% 90% 95% 98% 99% 99.8% 99.9% .80 .90 .95 .98 .99 .998 .999 1.28 1.645 1.96 2.33 2.58 3.08 3.27 Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 8-11 Intervalos e Nível de Confiança Distribuição Amostral da Média /2 Intervalos se extendem de: σ X Z n 1 x μx μ x1 x2 a σ X Z n /2 (1-)x100% dos intervalos construídos contém μ; ()x100% não. Intervalos de Confiança Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 8-12 Intervalo de Confiança para μ (σ conhecido) Exemplo Uma amostra de 11 circuitos extraída de uma população normal tem resistência média de 2.20 ohms. Sabemos de testes anteriores que a população tem desvio-padrão igual a .35 ohms. Determine o intervalo de confiança a 95% para a verdadeira resistência média da população. Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 8-13 Intervalo de Confiança para μ (σ conhecido) Exemplo σ X Z n 2.20 1.96 (.35/ 11) 2.20 .2068 (1.9932 , 2.4068) Nós estamos 95% confiantes de que o intervalo entre 1.9932 e 2.4068 ohms contém a verdadeira média da população. Apesar da verdadeira média poder ou não estar no intervalo, 95% dos intervalos formados desta maneira conterão a verdadeira média da população Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 8-14 Intervalo de Confiança para μ (σ desconhecido) Se o desvio-padrão da população σ é desconhecido, nós podemos adotar como aproximação o desvio-padrão da amostra, S Isso introduz uma incerteza adicional, já que S varia de amostra para amostra Então, usamos a distribuição t de Student ao invés da distribuição normal Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 8-15 Intervalo de Confiança para μ (σ desconhecido) Premissas: Desvio-padrão da população é desconhecido População é normalmente distribuída Se a população não for normal, use amostras grandes Use Distribuição t de Student Estime o intervalo de confiança: S X t n-1 n (onde t é o valor crítico da distribuição t com n-1 g.l. e uma área de α/2 em cada cauda) Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 8-16 Distribuição t de Student O valor t depende dos graus de liberdade (g.l.) Número de observações que estão livres para variar após a média da amostra ter sido calculada d.f. = n - 1 Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 8-17 Graus de Liberdade Ideia: Número de observações que estão livres para variar após a média da amostra ter sido calculada Exemplo: Suponha que a média de 3 números seja 8.0 Sea média dos valores é 8.0, então X3 deve ser 9 Seja X2 = 8 Qual o valor de X3? (i.e., X3 não é livre para variar) Seja X1 = 7 Aqui, n = 3, então os graus de liberdade são = n – 1 = 3 – 1 = 2 (2 valores podem ser qualquer número, mas o terceiro não é livre para variar uma vez que a média está dada) Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 8-18 Distribuição t de Student Observe: t Z à medida que n aumenta Normal Padrão (t com gl = ∞) t (gl = 13) Distribuições t são em forma de sino e simétricas, mas têm caudas mais “gordas” que a normal t (gl = 5) 0 Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. t Chap 8-19 Tabela da t de Student Áreas da Cauda Superior gl .25 .10 .05 1 1.000 3.078 6.314 Seja: n = 3 gl = n - 1 = 2 = .10 /2 =.05 2 0.817 1.886 2.920 /2 = .05 3 0.765 1.638 2.353 O corpo da tabela contém os valores t, não as probabilidades Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. 0 2.920 t Chap 8-20 Intervalo de Confiança para μ (σ desconhecido) Exemplo Uma amostra aleatória com n = 25 tem X = 50 e S = 8. Construa um intervalo de confiança a 95% para μ g.l. = n – 1 = 24, então O intervalo de confiança é: X t/2, n -1 S 8 50 (2,0639) n 25 (46,698 ; 53,302) Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 8-21 Intervalos de Confiança para a Proporção Populacional, π Uma estimativa intervalar para a proporção populacional ( π ) pode ser calculada acrescentando uma incerteza à proporção amostral ( p ) Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 8-22 Intervalos de Confiança para a Proporção Populacional, π Lembre-se que a distribuição da proporção amostral é aproximadamente normal se o tamanho da amostra é grande, com desvio-padrão σp (1 ) n Nós estimaremos este valor a partir dos dados amostrais: p(1 p) n Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 8-23 Intervalos de Confiança para a Proporção Populacional, π Os limites inferior e superior do intervalo de confiança da proporção populacional são calculados com a fórmula: p(1 p) pZ n Onde: Z é o valor crítico na distribuição normal padronizada para o nível de confiança desejado p é proporção na amostra n é o tamanho da amostra Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 8-24 Intervalos de Confiança para a Proporção Populacional, Exemplo Em uma amostra aleatória de 100 pessoas, 25 são canhotas. Construa um intervalo de confiança para a verdadeira proporção de canhotos na população com 95% de confiança. p Z p(1 p)/n 25/100 1,96 .25(.75)/100 .25 1,96 (.0433) (0,1651 ; 0,3349) Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 8-25 Intervalos de Confiança para a Proporção Populacional, Exemplo Nós estamos 95% confiantes de que a proporção de canhotos da população esteja entre 16,51% e 33,49%. Apesar de o intervalo de .1651 a .3349 poder ou não conter a proporção populacional verdadeira, 95% dos intervalos construídos a partir de amostras de tamanho 100 conterão a verdadeira proporção de canhotos na população. Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 8-26 Determinando o tamanho da amostra O tamanho de amostra desejado pode ser definido de forma a obter uma determinada margem de erro (e) com um nível de confiança especificado (1 - ) A margem de erro é também chamada de erro amostral O quão imprecisa é a estimativa do parâmetro populacional O montante somado e subtraído da estimativa pontual para formar o intervalo de confiança Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 8-27 Determinando o tamanho da amostra Para definir o tamanho da amostra para a estimativa da média, você precisa conhecer: O nível de confiança desejado (1 - ), que determina o valor crítico Z O erro amostral desejado (margem de erro), e O desvio-padrão, σ σ eZ n Agora, resolva para n Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Z σ n 2 e 2 2 Chap 8-28 Determinando o tamanho da amostra Se = 45, que tamanho de amostra é necessário para estimar a média com uma margem de erro de ± 5 com 90% de confiança? Z 2 σ 2 (1,645) 2 (45) 2 n 219,19 2 2 e 5 Então, o tamanho de amostra necessário é n = 220 Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 8-29 Determinando o tamanho da amostra Se desconhecido, σ pode ser estimado quando necessário na fórmula do tamanho da amostra Use um valor para σ a partir da análise da amplitude (se distribuição normal esta é aproximadamente igual a 6σ) Selecione uma amostra piloto e estime σ a partir do desvio-padrão da amostra, S Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 8-30 Determinando o tamanho da amostra Para determinar o tamanho da amostra necessário para a proporção, você precisa saber: O nível desejado de confiança (1 - ), que determina o valor crítico Z O erro amostral aceitável (margem de erro), e A verdadeira proporção de “sucessos”, π π pode ser estimado a partir de uma amostra piloto, se necessário (ou conservadoramente use π = .50) eZ (1 ) n Resolvendo para n Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Z (1 ) n e2 2 Chap 8-31 Determinando o tamanho da amostra Qual o tamanho da amostra necessário à estimativa da proporção de defeituosos em uma grande população, com uma margem de erro de ±3%, e 95% de confiança? (Assuma que em uma amostra piloto foi obtida a proporção p = .12 de defeituosos) Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 8-32 Determinando o tamanho da amostra Solução: Para 95% confiança, use Z = 1.96 e = .03 p = .12, então use este para estimar π Z 2 (1 ) (1,96) 2 (.12)(1 .12) n 450,74 2 2 e (.03) Então use n = 451 Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 8-33 Aplicações em Auditoria Seis vantagens da amostragem estatística em auditoria Resultados amostrais são objetivos e defensáveis Desde que baseados em princípios estatísticos demonstráveis Permite a estimativa do tamanho da amostra previamente e com bases objetivas Permite uma estimativa do erro amostral Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 8-34 Aplicações em Auditoria Permite conclusões mais precisas sobre a população A análise de toda a população pode demandar muito tempo e estar sujeitas a outros erros que não o da amostragem Amostras podem ser combinadas e avaliadas por diferentes auditores Amostras são baseadas em abordagem científica Amostras podem ser tratadas como se tivessem sido feitas por um único auditor Uma avaliação objetiva dos resultados é possível Baseado no conhecimento do erro amostral Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 8-35 Estimando o Valor Total da População Estimativa Pontual: Population total NX Estimativa do Intervalo de Confiança: S NX N( t n1 ) n Nn N 1 (Esta amostragem é sem reposição, então use o fator de correção para populações finitas na fórmula do intervalo de confiança) Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 8-36 Estimando o Valor Total da População Uma firma tem uma população de 1000 faturas e deseja estimar o valor total da população. Uma amostra de 80 faturas é selecionada com valor médio de $87.6 e desvio-padrão de $22.3. Encontre a estimativa do valor total para um nível de confiança de 95%. Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 8-37 Estimando o Valor Total da População N 1000, n 80, X 87,6, S 22,3 S N X N (t n 1 ) n Nn N 1 22.3 1000 80 (1000)(87.6) (1000)(1,9905) 80 1000 1 87.600 4.762,48 O intervalo de confiança a 95% para o valor total da população de faturas é de $82.837,52 a $92.362,48 Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 8-38 Intervalo de Confiança para a Diferença Total Estimativa Pontual: Diferença Total ND Onde a diferença média D ,é: n D D i 1 i n onde Di valor auditado - valor original Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 8-39 Intervalo de Confiança para a Diferença Total Estimativa do Intervalo de Confiança: SD ND N( t n1 ) n onde: Nn N 1 n SD 2 ( D D ) i i1 Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. n 1 Chap 8-40 Intervalos de Confiança Unilaterais Aplicações: encontre o limite superior para a proporção de itens que não estão em conformidade com os controles internos p(1 p) N n Limite Superior p Z n N 1 Onde: Z é o valor crítico na normal padrão para o nível de confiança desejado p é a proporção amostral de itens em não conformidade n é o tamanho da amostra N é o tamanho da população Statistics for Managers Using Microsoft Excel, 5e © 2008 Pearson Prentice-Hall, Inc. Chap 8-41 Estimativas e Questões Éticas Problemas Fornecer somente estimativas pontuais sem o intervalo de confiança e o tamanho da amostra Não informar o nível de confiança da estimativa Não explicar, para o público leigo, o significado do intervalo de confiança Então, ao trabalhar com estimativas a partir de amostras informe sempre: A estimativa pontual O intervalo de confiança com o respectivo nível de confiança O tamanho da amostra Uma explicação do conceito do intervalo de confiança “Há 95% de chances de que o intervalo xxxxxx contenha a verdadeira (xxxxx=média/desvio/proporção) da população”