Distribuições normais Aproximações normais para distribuições binomiais Intervalo de confiança TAD0022 Estatística Aplicada Distribuições de probabilidades normais Rafael Beserra Gomes Universidade Federal do Rio Grande do Norte Material compilado em 14 de outubro de 2014. Licença desta apresentação: http://creativecommons.org/licenses/ Rafael Beserra Gomes TAD0022 Estatística Aplicada Distribuições normais Aproximações normais para distribuições binomiais Intervalo de confiança Definição Distribuição amostral Distribuições normais Rafael Beserra Gomes TAD0022 Estatística Aplicada Distribuições normais Aproximações normais para distribuições binomiais Intervalo de confiança Definição Distribuição amostral Distribuições normais Definição Rafael Beserra Gomes TAD0022 Estatística Aplicada Distribuições normais Aproximações normais para distribuições binomiais Intervalo de confiança Rafael Beserra Gomes Definição Distribuição amostral TAD0022 Estatística Aplicada Distribuições normais Aproximações normais para distribuições binomiais Intervalo de confiança Rafael Beserra Gomes Definição Distribuição amostral TAD0022 Estatística Aplicada Distribuições normais Aproximações normais para distribuições binomiais Intervalo de confiança Definição Distribuição amostral Distribuição normal Distribuição de probabilidade contínua para uma variável aleatória x com as seguintes propriedades: I A média, mediana e moda são iguais I A curva normal (gráfico da distribuição normal) tem forma de sino e é simétrica em torno da média I A curva normal é descrita pela função densidade de probabilidade normal: −(x−µ)2 1 √ e 2σ2 σ 2π I A integral é igual a 1 I Os dois pontos de inflexão estão localizados a 1 desvio padrão da média Rafael Beserra Gomes TAD0022 Estatística Aplicada Distribuições normais Aproximações normais para distribuições binomiais Intervalo de confiança Definição Distribuição amostral Exemplo Desenhe a curva normal para uma distribuição com média 2 e desvio padrão 1. Rafael Beserra Gomes TAD0022 Estatística Aplicada Distribuições normais Aproximações normais para distribuições binomiais Intervalo de confiança Definição Distribuição amostral Distribuição normal padrão I Média: 0 I Desvio padrão: 1 I A área sob a curva normal até determinado z-escore é igual para todas as distribuições normais, independentemente da média e do desvio padrão x −µ I z = σ I Utilize a tabela normal padrão para consultar valores da CDF (cumulative density function) Rafael Beserra Gomes TAD0022 Estatística Aplicada Distribuições normais Aproximações normais para distribuições binomiais Intervalo de confiança Definição Distribuição amostral Exemplo I encontre a área acumulada que corresponde a z-escore de 1,15 I encontre a área acumulada à direita da z-escore de -0,24 I encontre a área acumulada entre as z-escore -1,5 e 1,25 Rafael Beserra Gomes TAD0022 Estatística Aplicada Distribuições normais Aproximações normais para distribuições binomiais Intervalo de confiança Definição Distribuição amostral Valores incomuns e muito incomuns: Valores incomuns: z-escore maior que 2 ou menor que -2 Valores muito incomuns: z-escore maior que 3 ou menor que -3 Rafael Beserra Gomes TAD0022 Estatística Aplicada Distribuições normais Aproximações normais para distribuições binomiais Intervalo de confiança Definição Distribuição amostral Código em python para cálculo da distribuição normal acumulada 1 2 def p h i ( x ) : r e t u r n ( 1 . 0 + math . e r f ( x / math . s q r t ( 2 . 0 ) ) ) / 2 . 0 Rafael Beserra Gomes TAD0022 Estatística Aplicada Distribuições normais Aproximações normais para distribuições binomiais Intervalo de confiança Definição Distribuição amostral Exemplo Uma pesquisa indica que para cada ida ao supermercado, uma pessoa gasta uma média de 45 minutos com um desvio padrão de 12 minutos naquela loja. Esse tempo gasto na loja é normalmente distribuído. Uma pessoa entra na loja. (a) Encontre a probabilidade de essa pessoa ficar (a) entre 24 e 54 minutos e (b) mais que 39 minutos. Rafael Beserra Gomes TAD0022 Estatística Aplicada Distribuições normais Aproximações normais para distribuições binomiais Intervalo de confiança Definição Distribuição amostral Exemplo As pontuações para um teste de serviço civil são normalmente distribuídas, com uma média de 75 e um desvio padrão de 6,5. Para ser adequado ao emprego de serviço civil, você deve ter pontuação dentro dos 5% primeiros. Qual é a menor pontuação que você pode conseguir e ainda assim ser adequado ao emprego? Rafael Beserra Gomes TAD0022 Estatística Aplicada Distribuições normais Aproximações normais para distribuições binomiais Intervalo de confiança Definição Distribuição amostral Distribuições normais Distribuição amostral Rafael Beserra Gomes TAD0022 Estatística Aplicada Distribuições normais Aproximações normais para distribuições binomiais Intervalo de confiança Definição Distribuição amostral Distribuição amostral Distribuição de probabilidade de uma estatística da amostra que é formada quando amostras de tamanho n são repetidamente retiradas (com reposição) de uma população. Distribuição amostral das médias Distribuição de probabilidade da média das amostras de tamanho n. µx = µ σ σx = √ n Rafael Beserra Gomes TAD0022 Estatística Aplicada Distribuições normais Aproximações normais para distribuições binomiais Intervalo de confiança Definição Distribuição amostral Exemplo Seja uma população com os seguintes elementos: 1, 3, 5, 7. Liste todas as amostras possíveis de tamanho n = 2 e calcule a média de cada. Escreva a distribuição amostral de médias. Encontre a média e o desvio padrão das amostras e compare com os da população. Rafael Beserra Gomes TAD0022 Estatística Aplicada Distribuições normais Aproximações normais para distribuições binomiais Intervalo de confiança Definição Distribuição amostral Teorema do limite central I I Se amostras de tamanho n (n ≥ 30) são tiradas de qualquer população com uma média µ e um desvio padrão σ, então a distribuição amostral de médias se aproxima da distribuição normal. Quanto maior o tamanho da amostra, maior a aproximação. Se uma população é normalmente distribuída, a distribuição amostral de médias das amostras é normalmente distribuída para qualquer amostra de tamanho n. O desvio padrão da distribuição amostral de médias também é chamada de erro padrão da média. Rafael Beserra Gomes TAD0022 Estatística Aplicada Distribuições normais Aproximações normais para distribuições binomiais Intervalo de confiança Definição Distribuição amostral Exemplo O tempo médio para uma viagem entre o campus central e a EAJ é de 25 minutos com desvio padrão de 2 minutos. Você seleciona aleatoriamente 40 pessoas que irão realizar esse percurso. Qual a probabilidade de que a média de tempo do percurso para essas pessoas seja maior que 27 minutos? Rafael Beserra Gomes TAD0022 Estatística Aplicada Distribuições normais Aproximações normais para distribuições binomiais Intervalo de confiança Aproximações normais para distribuições binomiais Rafael Beserra Gomes TAD0022 Estatística Aplicada Distribuições normais Aproximações normais para distribuições binomiais Intervalo de confiança Podemos aproximar uma distribuição binomial com uma distribuição normal caso: np ≥ 5 nq ≥ 5 Para a qual teremos: µ = np √ σ = npq Rafael Beserra Gomes TAD0022 Estatística Aplicada Distribuições normais Aproximações normais para distribuições binomiais Intervalo de confiança Exemplo Um questionário é aplicada para 160 alunos. A probabilidade de um aluno atingir a pontuação mínima é 60%. Qual a probabilidade de pelo menos 100 alunos atingirem a pontuação mínima? Rafael Beserra Gomes TAD0022 Estatística Aplicada Distribuições normais Aproximações normais para distribuições binomiais Intervalo de confiança Intervalo de confiança Rafael Beserra Gomes TAD0022 Estatística Aplicada Distribuições normais Aproximações normais para distribuições binomiais Intervalo de confiança É possível inferir parâmetros populacionais a partir de estatísticas amostrais. Analisaremos como estimar a média populacional µ nas seguintes situações: quando o tamanho da amostra for pelo menos 30 quando a população for normalmente distribuída e seu desvio conhecido Importante: a validade de um método de estimativa aumenta se uma amostra estatística não for tendenciosa e tiver baixa variabilidade. Rafael Beserra Gomes TAD0022 Estatística Aplicada Distribuições normais Aproximações normais para distribuições binomiais Intervalo de confiança Estimativa pontual Valor único estimado para um parâmetro populacional. A estimativa pontual menos tendenciosa de uma média populacional µ é a média amostral x. Rafael Beserra Gomes TAD0022 Estatística Aplicada Distribuições normais Aproximações normais para distribuições binomiais Intervalo de confiança Exemplo As notas de 5 alunos de uma turma de 20 alunos foram: 2, 6, 8, 4, 10. Encontre uma estimativa pontual da média populacional µ. Rafael Beserra Gomes TAD0022 Estatística Aplicada Distribuições normais Aproximações normais para distribuições binomiais Intervalo de confiança Estimativa intervalar Intervalo utilizando para estimar um parâmetro populacional para o qual temos uma estimativa pontual e uma margem de erro. Exemplo A estimativa pontual das notas é 6. Uma estimativa intervalar pode ser dada por 5.5 < µ < 6.5, onde a margem de erro é 0.5. Rafael Beserra Gomes TAD0022 Estatística Aplicada Distribuições normais Aproximações normais para distribuições binomiais Intervalo de confiança Nível de confiança O nível de confiança c é a probabilidade de que o intervalo estimado contenha o parâmetro populacional. Erro de amostragem Diferença entre a estimativa pontual e o valor real do parâmetro: x −µ Cálculo da margem de erro σ E = zc σx = zc √ n onde zc é o z-escore para o nível de confiança c. Podemos aproximar o desvio padrão das médias σx com o desvio padrão da amostra s se n ≥ 30. Rafael Beserra Gomes TAD0022 Estatística Aplicada Distribuições normais Aproximações normais para distribuições binomiais Intervalo de confiança Exercício Seja uma turma de alunos, o professor selecionou 30 provas, cujas notas foram: 2, 1, 1, 3, 1, 1, 7, 1, 7, 7, 3, 9, 9, 1, 1, 6, 5, 3, 1, 7, 7, 7, 2, 4, 9, 0, 3, 8, 3 e 7. Calcule a média amostral x e a margem de erro E para um nível de confiança de 95%. O que esses resultados significam? Rafael Beserra Gomes TAD0022 Estatística Aplicada Distribuições normais Aproximações normais para distribuições binomiais Intervalo de confiança Definindo o tamanho da amostra Dado o nível de confiança c e uma margem de erro E, o tamanho mínimo da amostra n necessário para estimar a média populacional é: zc σ 2 n=( ) E o que pode ser obtido a partir da equação anterior. Se σ for desconhecido, podemos utilizar o desvio padrão de uma amostra preliminar com pelo menos 30 elementos. Rafael Beserra Gomes TAD0022 Estatística Aplicada Distribuições normais Aproximações normais para distribuições binomiais Intervalo de confiança Exercício Considerando o exemplo anterior, quantas notas de alunos o professor deve selecionar para que ele esteja 95% confiante de que a média amostral esteja dentro de 1 ponto da média de todas as notas da turma? Rafael Beserra Gomes TAD0022 Estatística Aplicada