Inferência Estatística Curva Normal Prof. Salvatore B. Virgillito Distribuição de Probabilidades (Características) • A definição matemática de distribuição discreta de probabilidades é o resultado de uma função P(X) que satisfaz às seguintes propriedades: – A probabilidade P(X) que a variável aleatória X assuma um valor real positivo. Não se define probabilidade negativa. – A soma de todas as probabilidades de P(X) dados todos os possíveis valores de X deve ser igual a 1, . Como conseqüência podemos deduzir que para qualquer valor de X, sua probabilidade P(X) estará sempre entre 0 e 1. Exemplo de fixação • Tomando-se por base os conceitos citados na transparência anterior, explique o porquê cada uma das distribuições abaixo pode ou não ser uma distribuição de probabilidades. Respostas • 1) Esta distribuição não pode ser uma distribuição de probabilidades pois a somatória das probabilidades da variável aleatória X assumir o valor de cada x= 0,1,2,3,4 é maior que 100% ou 1. Lembra-se que a soma de todas as probabilidades de P(X) dados todos os possíveis valores de X deve ser igual a 1. • 2) Esta distribuição não pode ser uma distribuição de probabilidades pois a somatória das probabilidades da variável aleatória X assumir o valor de cada x= 0,1,2,3,4 é menor que 100% ou 1. Lembra-se novamente que a soma de todas as probabilidades de P(X) dados todos os possíveis valores de X deve ser igual a 1. • 3) Esta distribuição não pode ser uma distribuição de probabilidades, pois uma das probabilidades da variável aleatória X assumir o valor igual a 2 é negativa (- 0,20), ou seja, uma função discreta que resulte em valores negativos ou maiores que 1, não pode ser dita função de probabilidades. • 4) Esta distribuição, ao contrário de todas as demais é uma distribuição de probabilidades, pois a somatória das probabilidades é exatamente igual a 1 (nem mais nem menos que 100%) e não existem probabilidades negativas de ocorrência. Distribuição Normal (Características) • A curva é suave e unimodal; • Simétrica em relação à média; • A distribuição normal fica completamente • • definida pela média e desvio padrão; A área sob a curva normal corresponde a 100% da probabilidade associada à variável; A probabilidade de observar um valor específico é zero pois não caracteriza uma área sob a curva. Forma da distribuição normal f ( x) = 1 e 2πσ 1 x−µ 2 − 2 σ Distribuição normal Função Distribuição de Probabilidade e Função Repartição. • Distribuição de probabilidades é definida então como sendo o • conjunto de todas as possibilidades de resultados (função probabilidade) da variável aleatória discreta X (evento de interesse). O acúmulo da probabilidade de ocorrência de um evento dá origem à função repartição. Freqüência Soma simples 2 1 3 2 4 3 5 4 6 5 7 6 8 5 9 4 10 3 11 2 12 1 Total 36 1/36 = 2/36 = 3/36 = 4/36 = 5/36 = 6/36 = 5/36 = 4/36 = 3/36 = 2/36 = 1/36 = Função Função Probabilidade Repartição 0,0278 0,0278 0,0556 0,0833 0,0833 0,1667 0,1111 0,2778 0,1389 0,4167 0,1667 0,5833 0,1389 0,7222 0,1111 0,8333 0,0833 0,9167 0,0556 0,9722 0,0278 1,0000 1,0000 Representação gráfica A freqüência simples de cada valor da variável aleatória X corresponde um valor de freqüência relativa (Função Probabilidade). O acúmulo dessa freqüência relativa definirá a função Repartição (densidade acumulada) A distribuição Normal padronizada Variável padronizada z= x−µ σ Representando de outra forma 0,2500 0,2000 0,1500 0,1000 0,0500 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 -3 ,5 -3 -2 ,5 -2 -1 ,5 -1 -0 ,5 0 0, 5 1 1, 5 2 2, 5 3 3, 5 4 20 0,0000 0,2500 0,2000 0,1500 0,1000 0,0500 -4 0,0000 Distribuição Normal e Probabilidades • Para cada valor da variável aleatória X corresponde um • • • afastamento em relação à média, que pode ser medido em número de desvios-padrão. A isto se chama de PADRONIZAÇÃO. Pode-se portanto expressar a posição da variável em número de desvios-padrão. Por sua vez a cada valor desse afastamento medido em número de desvios-padrão corresponde uma área debaixo da curva normal. Essa área equivale à probabilidade de ocorrência da variável aleatória X (variável em estudo). Área sob o gráfico da normal (probabilidade) Distribuição Normal e Probabilidades • A probabilidade de uma variável aleatória assumir valores entre dois pontos quaisquer é igual à área sob a curva normal entre aqueles pontos. Consulta à Tabela de Escore Reduzido •Qual a área equivalente à um afastamento de + 0,46 desvios-padrão? R. 17,72% acima da média (ponto 0). •Qual a área equivalente à um afastamento de – 1,12 desvios-padrão? R. 36,86% abaixo da média (ponto 0). Exemplo resolvido Área entre dois valores Área entre dois valores Teste gráfico da Normalidade das variáveis Suponhamos o seguinte estudo de caso para determinação se os investimentos em propaganda estão distribuídos normalmente. Freqüências normais esperadas Freqüências Esperadas x Observadas Existe pouquíssima diferença entre as freqüências normais esperadas e as freqüências observadas. Desta forma conclui-se que a distribuição de probabilidades do evento considerado, adere bem ao formato da curva normal e que portanto podem ser considerados como tendo comportamento normal. Teste de Normalidade no SPSS • Abra o arquivo Electric.sav e verifique se a variável Serum Cholesterol tem ou não comportamento normal. Como os pontos vermelhos (freqüências observadas) aderem bem à reta (verde) que representa a probabilidade normal esperada, conclui-se que a variável em questão tem comportamento Normal. Exercícios • Ver Lista de Exercícios no Site do professor.