Distribuição Normal e Normal padrão Ivan Bezerra Allaman Cronograma 1. 2. 3. 4. 5. Introdução Principais características Entendo a distribuição O surgimento da normal padrão Aplicações Introdução • Foi introduzida pela primeira vez por Abraham de Moivre em 1733. • Seu resultado foi estendido por Laplace, em seu livro Analytical Theory of Probabilities em 1812. • É uma das mais importantes distribuições de probabilidade, sendo aplicada em inúmeros fenômenos. • A forma gráfica da distribuição normal lembra um sino. De fato, imaginem se em uma população coletássemos a informação sobre a altura de cada indivíduo, e então, fizéssemos uma tabela de distribuição de frequência. Se distribuirmos os indivíduos em cada intervalo de classe, teríamos o seguinte histograma: 1 Principais características A função densidade de probabilidade é expressa pela seguinte função: f (X = x) = 1 x−µ 2 1 √ e− 2 ( σ ) σ 2π em que: • • • • µ é a média da população σ é o desvio padrão da população π é uma constante igual a 3, 1415 · · · e é o número neperiano igual a 2, 718 · · · • √1 σ 2π é um fator de escalonamento que faz com que a área sob a curva seja igual a 1 Com relação a curva tem-se que: • é simétrica em relação a média (µ) • a média (µ), mediana (md) e moda (mo) coincidem 0,5 0,5 µ=md=mo Entendendo a distruição • Alterações no valor da média – implicam no deslocamento do ponto de máximo ao longo do eixo y, sem alterações na forma básica • Alterações no valor do desvio padrão – implicam em uma maior ou menor afastamento dos dados em torno da média O surgimento da normal padrão Para calcularmos probabilidades utilizando a função densidade é necessário integramos a função no intervalo requerido. No caso da normal, tal integração apresenta um grau relativo de dificuldade. Esses problemas foram solucionados por meio de uma mudança de variável, obtendo-se, assim, a distribuição normal padronizada ou reduzida, cujo a média é igual a zero e o desvio igual a um. 2 Z= X−µ σ Logo, a função densidade reduziu-se a: 2 1 1 f (Z = z) = √ e− 2 (z) 2π Deste modo, temos a seguinte equivalência para cálculo de probabilidades: P (X1 ≤ X ≤ X2 ) = P (Z1 ≤ Z ≤ Z2 ) Uma vez as distribuições normal e normal padrão são equivalentes, a proporção de valores caindo dentro de um, dois, três ou quatro desvios padrão da média são: Utilizando o R Para calcularmos probabilidades utilizando a normal padrão, veremos como funciona a função pnorm do R. Por padrão, a função pnorm funciona da seguinte forma: Aplicações 1. Seja Y ∼ N (100, 25), determine as seguintes probabilidades: P (100 ≤ Y ≤ 106) mu = 100 sigma2 = 25 sigma = sqrt(sigma2) # Desenhando o que se pede curve(dnorm(x,100,5), from = 80, to = 120, axes = FALSE, ylab = '', xlab = '') axis(1, at=c(80,100,106,120)) polygon(x = c(100, seq(100, 106, length = 1e3), 106), y = c(0, dnorm(seq(100, 106, length = 1e3), 100, 5), 0), col='bisque') text(103,0.03,'?',cex = 1.5, col = 'darkred') 3 ? 80 100 106 # Transformando Y1 = 100 Y1a = 100 Z1a = (Y1a - mu)/sigma Z1a ## [1] 0 # Transformando Y2 = 106 Y2a = 106 Z2a = (Y2a - mu)/sigma Z2a ## [1] 1.2 # Calculando a probabilidade p1a = pnorm(Z1a) p1a ## [1] 0.5 p2a = pnorm(Z2a) p2a ## [1] 0.8849 pdesejadaa = p2a - p1a pdesejadaa ## [1] 0.3849 P (89 ≤ Y ≤ 107) 4 120 # Desenhando o que se pede curve(dnorm(x,100,5), from = 80, to = 120, axes = FALSE, ylab = '', xlab = '') axis(1, at=c(80,89,107,120)) polygon(x = c(89, seq(89, 107, length = 1e3), 107), y = c(0, dnorm(seq(89, 107, length = 1e3), 100, 5), 0), col='bisque') text(100,0.03,'?',cex = 1.5, col = 'darkred') ? 80 89 107 # Transformando Y1 = 89 Y1b = 89 Z1b = (Y1b - mu)/sigma Z1b ## [1] -2.2 # Transformando Y2 = 106 Y2b = 106 5 120 Z2b = (Y2b - mu)/sigma Z2b ## [1] 1.2 # Calculando a probabilidade p1b = pnorm(Z1b) p1b ## [1] 0.0139 p2b = pnorm(Z2b) p2b ## [1] 0.8849 pdesejadab = p2b - p1b pdesejadab ## [1] 0.871 P (112 ≤ Y ≤ 116) # Desenhando o que se pede curve(dnorm(x,100,5), from = 80, to = 120, axes = FALSE, ylab = '', xlab = '') axis(1, at=c(80,112,116,120)) polygon(x = c(112, seq(112, 116, length = 1e3), 116), y = c(0, dnorm(seq(112, 116, length = 1e3), 100, 5), 0), col='bisque') text(114,0.005,'?',cex = 1.5, col = 'darkred') 6 ? 80 112 # Transformando Y1 = 112 Y1c = 112 Z1c = (Y1c - mu)/sigma Z1c ## [1] 2.4 # Transformando Y2 = 116 Y2c = 116 Z2c = (Y2c - mu)/sigma Z2c ## [1] 3.2 # Calculando a probabilidade p1c = pnorm(Z1c) p1c ## [1] 0.9918 p2c = pnorm(Z2c) p2c ## [1] 0.9993 pdesejadac = p2c - p1c pdesejadac ## [1] 0.00751 P (Y ≥ 108) 7 116 120 # Desenhando o que se pede curve(dnorm(x,100,5), from = 80, to = 120, axes = FALSE, ylab = '', xlab = '') axis(1, at=c(80,108,120)) polygon(x = c(108, seq(108, 120, length = 1e3), 120), y = c(0, dnorm(seq(108, 120, length = 1e3), 100, 5), 0), col='bisque') text(109,0.01,'?',cex = 1.5, col = 'darkred') ? 80 108 # Transformando Y1 = 108 Y1d = 108 Z1d = (Y1d - mu)/sigma Z1d ## [1] 1.6 # Calculando a probabilidade p1d = pnorm(Z1d) p1d 8 120 ## [1] 0.9452 pdesejadad = 1 - p1d pdesejadad ## [1] 0.0548 P (Y ≤ 90) # Desenhando o que se pede curve(dnorm(x,100,5), from = 80, to = 120, axes = FALSE, ylab = '', xlab = '') axis(1, at=c(80,90,120)) polygon(x = c(80, seq(80, 90, length = 1e3), 90), y = c(0, dnorm(seq(80, 90, length = 1e3), 100, 5), 0), col='bisque') text(89,0.005,'?',cex = 1.5, col = 'darkred') ? 80 90 120 9 # Transformando Y1 = 108 Y1e = 90 Z1e = (Y1e - mu)/sigma Z1e ## [1] -2 # Calculando a probabilidade p1e = pnorm(Z1e) p1e ## [1] 0.02275 pdesejadae = p1e pdesejadae ## [1] 0.02275 10