ERRO PADRÃO E INTERVALO DE CONFIANÇA ) P POPULAÇÃO R O (Censo) B A B Erro Inferência I L I D AMOSTRA A D (Amostragem) E Quando utilizamos dados amostrais para estimar uma média populacional μ, a margem de erro (E) é a diferença máxima provável (com probabilidade 1-α) entre a média amostral observada e a verdadeira média da população (μ) EP= δ/√n, no IC= Z x EP Como geralmente não conhecemos o real valor de σ, podemos aplicar as seguintes considerações: –n>30 pode-se adotar para σ o desviopadrão amostral ‘s’; –n≤30 a população deve ter distribuição normal e devemos ter σ para aplicar a fórmula Intervalo de Confiança para a média da população No processo de inferência, qual o erro da pesquisa? Para responder a pergunta acima vamos aprender a 1º) a.calcular a margem de erro associada a uma média da amostra; b.calcular a margem de erro associada a uma proporção da amostra; ESTIMATIVA POR INTERVALO DE UMA MÉDIA DE POPULAÇÃO – O CASO DA Grande AMOSTRA ( n ≥ 30 ) x margem de erro ou x ± x Distribuição Normal ou Gaussiana É a mais familiar das distribuições de probabilidade e também uma É a mais familiar das distribuições de probabilidade e também uma das mais importantes em estatística. Representam com boa aproximação, as distribuições de frequência observadas de muitos fenômenos. É especificada por dois parâmetros: sua média e seu desvio padrão. Como a curva é simétrica em relação à sua média, a probabilidade de se observar um valor inferior ou superior à média é de 50%. • A média refere-se ao centro da distribuição • O desvio padrão ao espalhamento de curva. • A distribuição normal é simétrica em torno da média o que implica que e média, a mediana e a moda são coincidentes. • A área sob a curva totaliza 1 ou 100% Aproximadamente 68% (2/3) dos valores de x situam-se entre os pontos (µ-) e (µ+) Aproximadamente 95% dos valores de x estão entre (µ-2) e (µ+2) Aproximadamente 99,7% dos valores de x estão entre (µ-3) e (µ+3) Distribuição Normal Exemplo: Suponha que os comprimentos de uma população com uma distribuição normal, com média 1,60 m e desvio padrão 5 cm. Podemos afirmar que cerca de 70 % da minha amostra ira se situar no intervalo compreendido entre alturas 1,55 e 1,65m, por exemplo, como a proporção da área sob a curva entre 1,55 e 1,65m. Então em nosso exemplo, cerca de 95% dos habitantes tem ??? entre 1,50 m e 1,70 m. Exemplo 2: Considere que a glicemia tenha distribuição normal, com média igual a 90 mg e desvio-padrão 5 mg na população de pessoas sadias. Pode-se concluir que: Aproximadamente 2/3 (68%) da população de indivíduos sadios possuem valores de glicemia entre (µ-) = 90-5 = 85 mg e (µ+) = 90+5 = 95 mg Grande parte (95%) das pessoas sadias tem glicemia entre (µ-2) = 90-2(5) = 80 e (µ+2) = 90+2(5) = 100 mg Praticamente todos (99,7%) os indivíduos da população tem valores entre (µ-3) = 75 e (µ+3) = 105 mg A probabilidade de que uma pessoa saudável tenha um valor de glicemia em jejum entre 90 (µ) e 95 (µ+) é de aproximadamente 0,34 Parâmetros Média Proporção Desvio Padrão etc p Estatísticas Média Proporção Desvio Padrão etc X p s Erro Padrão Se for retirado um certo número de amostras aleatórias de mesmo tamanho de uma população, não se deve esperar que todas as médias e desvios padrões amostrais sejam iguais. É uma medida que fornece uma ideia de precisão com que a média foi estimada Existe uma relação inversa entre o tamanho da amostra e o erro padrão, ou seja, quando o tamanho da amostra aumenta o erro padrão diminui. Erro Padrão= Desvio padrão das Médias das amostras de uma população EP= desvio padrão da variável √n Utiliza-se para calcular o Intervalo de confiança Estimativa Pontual Quando fazemos uma única estimativa para um determinado parâmetro populacional. Ex: - média amostral – estimar a media populacional - Proporção Amostral – estimar a proporção populacional Estimativa Intervalar É quando fazemos uma estimativa de um intervalo de valores possíveis, no qual se admite que esteja o parâmetro populacional. Ex: - Média Amostral = 50 Estimar média populacional no intervalo 40 a 60, com risco conhecido de erro. Intervalo de Confiança Frequentemente necessitamos, por meio de amostras, conhecer informações gerais de uma população. O Intervalo de Confiança é um instrumento de grande utilidade para se fazer inferências sobre o parâmetro populacional em que se está interessado. A estatística indutiva vai nos permitir tirar conclusões probabilísticas sobre aspectos da população, com base na observação de amostras extraídas dessa população. Para amostras razoavelmente grandes os intervalos de confiança a 95% podem ser expressos como: - Medida estatística ± 1,96 Erros Padrões I.C.= z. δ √n Quanto maior for n; menor o intervalo de confiança Quanto maior o desvio padrão; maior o intervalo de confiança. Observações: 6ª) Valores de Z/2 para os níveis de confiança mais usados na prática: Nível de confiança /2 Z/2 90% 0,10 0,05 1,65 95% 0,05 0,025 1,96 99% 0,01 0,005 2,58 Estimativas por Intervalo O conceito de intervalo de confiança pode ser visualizada pela figura abaixo: Exemplo: Valor do parâmetro = estimativa pontual uma função da confiança, dispersão e tamanho da amostra Níveis de Confiança Para (1 ) 99% , z = 2,58. Para (1 ) 95% , z = 1,96. Para (1 ) 90% , z = 1,65. Intervalo de Confiança para Proporções O estimador pontual para p, também denominado proporção amostral, é definido como: sendo que X denota o número de elementos na amostra que apresentam a característica; n denota o tamanho da amostra coletada. Intervalo de Confiança para Proporções A estimativa intervalar corresponde a um intervalo determinado da seguinte maneira: Intervalo de Confiança para Proporções Exemplo 01: Dos 500 alunos de medicina da UFC, 100 relatam que já trabalham. Estimativa Pontual Ou seja, 20% dos entrevistados já trabalham. Note que, outra amostra de mesmo tamanho pode levar a uma outra estimativa pontual para p. Numa pesquisa, foram coletadas 106 amostras de temperatura, obtendo-se uma média de 98,20 F e desvio padrão s=0,62 F. Para um nível de confiança de 95%, determine:–(a) A margem de erro da estimativa–(b) O Intervalo de confiança