Faculdade Pitágoras de Uberlândia Curso de Psicologia Disciplina: Estatística aplicada à Psicologia Introdução à Distribuição Normal Unidade 4 Prof. João Paulo Seno [email protected] 1 Vamos considerar as seguintes observações amostrais sobre o peso de determinada população (em kg) • Planilha com os dados: 58,6 56,8 67,0 87,3 68,0 60,0 69,7 74,1 68,1 78,0 61,1 63,3 66,7 68,7 70,9 68,0 61,4 62,1 77,1 44,9 72,6 73,7 61,4 68,6 71,1 82,4 58,7 54,8 61,5 58,4 79,7 72,3 64,2 67,3 63,1 67,2 67,0 71,8 68,0 62,5 64,9 74,4 55,7 75,5 74,2 60,3 82,5 54,4 58,8 67,1 77,0 64,5 66,6 59,2 71,1 63,3 71,4 55,7 52,8 55,3 59,7 65,2 71,5 54,7 81,8 76,9 63,1 64,4 67,5 53,6 59,9 73,6 62,3 64,3 63,5 63,4 67,0 62,6 53,6 60,5 • Medidas calculadas: Peso n= Maior valor = Menor valor = Média = Desvio Padrão = 200 88,2 44,9 65,8 8,3 62,7 59,4 67,9 68,6 49,5 62,2 63,9 53,3 55,6 69,7 72,8 49,7 63,2 63,4 70,5 63,0 77,4 48,3 63,7 53,3 54,9 64,5 47,5 58,5 68,5 63,6 69,0 60,9 57,6 66,5 88,2 76,7 80,8 76,0 56,5 51,6 58,0 71,4 71,3 66,0 79,8 66,1 62,6 63,8 64,0 56,8 72,4 51,5 73,9 78,2 70,5 69,8 78,7 66,4 67,3 78,3 56,8 69,3 63,1 64,5 75,9 70,9 77,2 75,8 54,4 63,9 52,8 48,9 65,2 73,4 57,9 69,7 57,3 68,8 60,3 61,5 50,2 80,7 70,5 78,2 69,7 78,1 66,5 72,3 58,0 67,1 70,7 56,7 58,5 67,8 63,1 73,8 65,9 67,8 57,8 51,1 72,2 51,0 73,9 77,8 73,3 73,3 74,1 65,2 73,3 59,1 64,9 59,6 62,7 73,8 80,4 66,9 66,9 51,3 73,2 60,7 67,9 69,3 69,4 69,5 Histograma do Peso Histograma do Peso com a curva Normal Vamos considerar as seguintes observações amostrais sobre a altura de determinada população (em cm) • Planilha com os dados: 151 178 164 165 188 144 176 148 172 155 160 158 150 151 175 150 161 122 147 135 189 162 187 123 150 151 201 176 149 151 177 161 143 161 194 160 163 139 133 138 170 188 151 145 162 166 165 161 165 170 190 179 152 176 137 177 168 172 161 168 144 162 153 158 153 174 184 159 154 167 154 143 153 138 157 174 168 165 161 155 178 194 169 168 180 150 173 145 164 191 167 186 172 168 139 154 174 167 150 176 139 180 154 191 175 168 166 148 149 196 138 156 156 181 127 145 137 140 124 167 142 151 161 111 139 169 148 161 145 140 166 172 152 155 176 167 143 171 157 176 180 155 166 168 129 151 174 146 146 141 158 144 163 144 164 143 174 150 116 157 • Medidas calculadas: Altura n= Maior valor = Menor valor = Média = Desvio Padrão = 200 203 111 160 17 Histograma da Altura 147 177 168 171 142 203 161 132 178 168 152 138 147 157 179 175 191 154 144 185 177 159 181 163 152 144 184 181 178 147 152 149 159 165 165 133 143 124 173 184 Histograma da Altura com a curva Normal O que é então a distribuição Normal? • É um padrão de comportamento que determinados fenômenos apresentam; • Há muitos fenômenos biológicos, sociais, de engenharia e outros que apresentam este padrão; • O padrão pode ser identificado quando construímos um histograma e obtemos um formato de um sino; • Há também formas matemáticas de se determinar se comportamento do fenômeno se comporta “Normalmente”. Regra Empírica (68-95-99,7%) Dados com distribuição simétrica na forma de sino têm as seguintes características: 13,5% 13,5% 2,35% –4 –3 2,35% –2 –1 0 1 2 3 4 Cerca de 68% dos dados estão a até 1 desvio padrão da média. Cerca de 95% dos dados estão a até 2 desvios padrão da média. Cerca de 99,7% dos dados estão a até 3 desvios padrão da média. Como usar a Regra Empírica O valor médio das casas de determinada rua é de R$ 125 mil,com um desvio padrão de R$5 mil. O conjunto de dados tem uma distribuição na forma de sino. Estime o porcentual de casas que custam entre R$ 120 e R$ 135 mil. 105 110 115 120 125 130 R$ 120 mil fica 1 desvio padrão abaixo da média e R$ 135 mil fica 2 desvios padrão acima da média. 135 140 145 68% + 13,5% = 81,5% Logo, 81,5% das casas custam entre R$ 120 e R$ 135 mil. Propriedades da Distribuição Normal • É uma distribuição contínua de probabilidade, ou seja, refere-se a fenômenos cuja medida é numérica e pode assumir um número infinito de valores; • Apenas para vocês saberem que existe, a equação abaixo é a que dá origem ao gráfico da curva normal; • Onde e = 2,718281828 e π = 3,14159254 Propriedades da Distribuição Normal (continuação) • A média, a mediana e a moda são iguais e estão no centro da curva; • A curva tem o formado de sino e é simétrica em relação à média; • A área total sob a curva é igual a 1; • A área sob a curva está relacionada com a probabilidade; • A curva se aproxima do eixo x a medida que se afasta da média, para ambos os lados. Exercício • Qual das curvas abaixo apresenta média maior? • Qual das curvas abaixo tem desvio padrão maior? Figura 1 Figura 2 Estimando uma probabilidade para uma curva Normal • As pontuações de um teste de QI em adultos são normalmente distribuídas com µ = 100 e σ = 15. Calcule a probabilidade de um adulto escolhido aleatoriamente ter QI entre 70 e 115. Resposta: Utilizando os slides anteriores, e aplicando a regra prática, verificamos que a área sob a curva é: Área = 0,135 + 0,68 = 0,815 Portanto, a probabilidade de que um adulto escolhido ao acaso tenha QI entre 85 e 115 é de 0,815 ou 81,5%. Normalização • Cálculo do escore padrão para que possamos utilizar a Tabela da Distribuição Normal Padronizada: • Depois de calcular o valor de z, podemos usar uma tabela padronizada para calcular as áreas debaixo da curva Normal. Isto é válido para qualquer distribuição Normal. • Precisamos, no entanto, conhecer a média µ e o desvio padrão σ. Curva Normal Padronizada • A Distribuição Normal Padronizada é uma distribuição Normal com média 0 e desvio padrão igual a 1. Exemplos • Calcular a área para cada uma das situações abaixo: Mais exemplos • Suponha que os níveis de colesterol em homens da região estejam normalmente distribuídos, com média 215 mg/dl e com desvio padrão 25 mg/dl. Se selecionarmos um homem ao acaso nesta região, qual será a probabilidade de que seu nível de colesterol seja inferior a 175? • E qual a probabilidade de que esteja entre 190 e 225? Exercícios • Os gastos mensais com serviços públicos em uma determinada cidade estão normalmente distribuídos, com média R$ 100,00 e desvio padrão de R$ 12,00. Uma despesa mensal é selecionada ao acaso. • A) Qual a probabilidade de a despesa ser inferior a R$ 80,00? • B) Qual a probabilidade de a despesa estar entre R$ 80,00 e R$ 115,00? • C) Qual a probabilidade de a despesa ser superior a R$ 115,00