UNIVERSIDADE COMUNITÁRIA DA REGÃO DE CHAPECÓ CURSO DE MATEMÁTICA DISCIPLINA: ESTATÍSTICA DISTRIBUIÇÃO DE PROBABILIDADE CONTÍNUA: DISTRIBUIÇÃO NORMAL Prof: Francisco Machado Jr. Chapecó, dezembro de 2014 DISTRIBUIÇÃO DE PROBABILIDADE CONTÍNUA Distribuição Contínua As distribuições de probabilidades são ditas contínuas quando a variável aleatória é contínua. A variável associada ao evento pode assumir qualquer valor dentro de um certo intervalo. Características mensuráveis que assumem valores em uma escala contínua (na reta real) Altura, peso, comprimento Aplicações: Distribuição Contínua Representação gráfica Forma peculiar; Área abaixo da curva 100%. P(a x b) área sob a curva entre a e b 1 ou 100% P(a x b) f ( x ).dx b a DISTRIBUIÇÃO DE PROBABILIDADE NORMAL GAUSS Distribuição normal A distribuição normal é a distribuição contínua de probabilidades mais importante em estatística. 1809 A lei de Gauss da distribuição normal Matemático alemão Karl Friedrich Gauss para descrever a distribuição dos erros de medidas. Pode ser usada para modelar muitos conjuntos de medidas na natureza, na indústria e no comércio, na saúde, etc. É uma distribuição contínua de uma variável aleatória X e seu gráfico é chamado de curva normal. Propriedades da distribuição normal Sua representação gráfica se assemelha a um sino; Simétrica 50 % dos valores são à média e 50 % são ; O ponto de máximo da função Os pontos de inflexão localizados a uma distância de 1 da ; A probabilidade aumenta à medida que, na linha da base, nos afastamos da média em ambos os sentidos. Logo: Se X for uma variável aleatória contínua com função densidade de probabilidade, pode-se fazer o gráfico de uma curva normal usando a equação a seguir: f (x) 1 2 e 1 x 2 2 - Desvio população; X - Variável aleatória; µ - Média população. Como e e π são constantes, a curva normal depende de: µ (média) e (desvio padrão). -∞<µ<∞e>0 Médias e desvios padrão – Formato da curva Uma distribuição pode ter qualquer média e qualquer desvio padrão positivo •e= •=e •e Cada par de parâmetros (μ, σ) define uma distribuição normal distinta? E Médias e desvios padrão – Formato da curva Exemplo: Massas de homens e mulheres adultos. 1 – Qual das curvas normais tem média maior? 2 – Qual das curvas normais tem desvio padrão maior? Cada par de parâmetros (μ, σ) define uma distribuição normal distinta! A curva normal – Determinação da probabilidade A probabilidade de a variável estar contida em um intervalo, é igual a área sob a curva normal entre estes 2 pontos. A função que representa a curva normal é: f (x) 1 2 e 1 x 2 2 Para a determinação da área, ou seja, da referida probabilidade, utiliza-se uma tabela padronizada. Construída considerando uma distribuição normal =0 =1 A distribuição normal padrão e o escore Z Distribuição normal padrão A distribuição normal padronizada tem média e desvio padrão iguais a: =0 =1 Escala horizontal: corresponde aos escores Z Com a tabela padronizada, pode-se obter as seguintes probabilidades para os correspondentes intervalos Cerca de 68% da área está a 1 desvio padrão da média Cerca de 95% da área está a 2 desvios padrão da média Cerca de 99,7% da área está a 3 desvios padrão da média E Exemplo: Segundo o manual de instruções de certo produto, o tempo de montagem é normalmente especificado com uma média de 4,2 horas e um desvio padrão de 0,3 horas. Determine o intervalo no qual estão inclusos 95% dos tempos de montagem. Cerca de 95% da área está a µ = 4,2 horas 2 desvios padrão da média = 0,3 hora 95% dos dados estão a até 2 desvios padrão da média 4,2 – 2(0,3) = 3,6 horas. 95% 4,2 + 2(0,3) = 4,8 horas. 95% dos tempos de montagem estão entre 3,6 e 4,8 horas. Por quê?? A distribuição normal padronizada facilita os cálculos de probabilidade, evitando o uso da fórmula e projetando qualquer análise mediante utilização de ESCORES (Z). ESCORE Z Representa o número de desvios padrão que separa uma variável aleatória X da média Para transformar um valor X em Z, utilizamos a seguinte expressão: x z E Exemplo: As pontuações de um concurso estão normalmente distribuídas com média de 152 e desvio padrão de 7 pontos. Determine o escore Z para um candidato com pontuação de: (a) 161 µ = 152 pontos = 7 pontos (b) 148 x z (a) (b) 161 152 z 7 148 152 z 7 Z = 1,29 Z = - 0,57 Entendendo o Escore Z Se cada valor de dados de uma variável X normalmente distribuída for transformado em escore Z, o resultado será uma curva normal padrão. Podemos utilizar a curva normal padrão e o escore Z para obter áreas (e portanto probabilidades) sob qualquer curva normal. Probabilidades percentuais da distribuição normal A estimativa de probabilidades associadas a variáveis aleatórias contínuas envolve o cálculo de áreas sob a curva. O uso da distribuição normal padronizada nos permite calcular áreas sob a curva de uma distribuição normal qualquer, “pois as áreas associadas com a normal padronizadas são tabeladas”. A Tabela A será usada para os cálculos de probabilidade envolvendo distribuições normais. Tabela A – Probabilidades percentuais da distribuição Normal E Exemplo: Determine as probabilidades para os escores abaixo. Utilize a tabela das probabilidades percentuais da distribuição Normal. (a) Z = 0,44 (b) Z = -1,17 (a) Z = 0,44 Percorra a coluna Z (parte inteira e a primeira decimal) até Z = 0,4; Siga na transversal até a coluna de número 0,04. O valor da célula, corresponde à probabilidade desejada. Exemplo: Determine as probabilidades para os escores abaixo. Utilize a tabela das probabilidades percentuais da distribuição Normal. (a) Z = 0,44 (b) Z = -1,17 (a) Z = 0,44 Percorra a coluna Z (parte inteira e a primeira decimal) até Z = 0,4; Siga na transversal até a coluna de número 0,04. O valor da célula, corresponde à probabilidade desejada. Exemplo: Determine as probabilidades para os escores abaixo. Utilize a tabela das probabilidades percentuais da distribuição Normal. (a) Z = 0,44 (b) Z = -1,17 (a) Z = 0,44 Percorra a coluna Z (parte inteira e a primeira decimal) até Z = 0,4; Siga na transversal até a coluna de número 0,04. O valor da célula, corresponde à probabilidade desejada. Da tabela → 17,00 % (b) Z = -1,17 Percorra a coluna Z (parte inteira e a primeira decimal) até Z = 1,1; Siga na transversal até a coluna de número 0,07. O valor da célula, corresponde à probabilidade desejada. (b) Z = -1,17 Percorra a coluna Z (parte inteira e a primeira decimal) até Z = 1,1; Siga na transversal até a coluna de número 0,07. O valor da célula, corresponde à probabilidade desejada. (b) Z = -1,17 Percorra a coluna Z (parte inteira e a primeira decimal) até Z = 1,1; Siga na transversal até a coluna de número 0,07. O valor da célula, corresponde à probabilidade desejada. Da tabela → 37,90 % Exercícios: 1 – Considerando que o consumo diário de água é distribuído normalmente com média de 200 litros/habitante e desvio-padrão igual a 45 litros habitante, calcular as probabilidades do consumo diário de água: (a) Estar entre 220 e 270 litros/habitante; R=26,94%. (b) Ser menor que 260 litros/habitante; R=90,82%. (c) Ser maior que 280 litros/habitante. R=3,75%. Tabela A – Probabilidades percentuais da distribuição Normal 2 – Após 28 dias de cura, um concreto apresenta uma resistência compressiva média de 28,4 MPa. Suponha que essa resistência tenha distribuição normal com desvio-padrão de 1,2 MPa, determine a probabilidade resistência: (a) Menor que 26 MPa; R=2,28%. (b) Maior que 27,8 MPa; R=69,15%. (c) Entre 29 e 30,7 MPa. R=28,11%. de obter um concreto com 3 – Se a vida útil média de um componente eletrônico for de 3680 horas, com desvio-padrão de 190 horas, qual a probabilidade de ficar danificado: (a) Antes de 3600 horas; R=33,72%. (b) Após 3500 horas; R=82,89%. (c) Entre 3400 e 3600 horas. R=26,64% 4 – Considerando que os depósitos realizados em um banco durante determinado período de tempo, são efetuados normalmente, com média de R$ 10.500,00 e desvio-padrão de R$ 1.000,00. Se um depósito é selecionado ao acaso, qual a probabilidade de que este seja: (a) Menor que R$ 8.000,00; R=0,62%. (b) Entre R$ 11.000,00 e R$ 13.100,00. R=30,38%. 5 – Você é o engenheiro responsável pela unidade de uma empresa, a qual possui um processo industrial automatizado, onde todas as peças produzidas são pesadas. Ao final do turno recebe em mãos uma planilha contendo o peso de todas as peças produzidas no lote 020, cuja média µ é 100 gramas e o desvio padrão é 8 gramas. O gerente geral da unidade lhe faz as seguintes perguntas: (a) Qual é a chance de encontrarmos valores maiores que 110 g? R=10,56% (b) Qual é a chance de encontrarmos valores menores que 94 g? R=22,66%