Distribuição Normal e Normal padrão
Ivan Bezerra Allaman
Cronograma
1.
2.
3.
4.
5.
Introdução
Principais características
Entendo a distribuição
O surgimento da normal padrão
Aplicações
Introdução
• Foi introduzida pela primeira vez por Abraham de Moivre em 1733.
• Seu resultado foi estendido por Laplace, em seu livro Analytical Theory of Probabilities em 1812.
• É uma das mais importantes distribuições de probabilidade, sendo aplicada em inúmeros fenômenos.
• A forma gráfica da distribuição normal lembra um sino.
De fato, imaginem se em uma população coletássemos a informação sobre a altura de cada indivíduo, e então,
fizéssemos uma tabela de distribuição de frequência. Se distribuirmos os indivíduos em cada intervalo de
classe, teríamos o seguinte histograma:
1
Principais características
A função densidade de probabilidade é expressa pela seguinte função:
f (X = x) =
1 x−µ 2
1
√ e− 2 ( σ )
σ 2π
em que:
•
•
•
•
µ é a média da população
σ é o desvio padrão da população
π é uma constante igual a 3, 1415 · · ·
e é o número neperiano igual a 2, 718 · · ·
•
√1
σ 2π
é um fator de escalonamento que faz com que a área sob a curva seja igual a 1
Com relação a curva tem-se que:
• é simétrica em relação a média (µ)
• a média (µ), mediana (md) e moda (mo) coincidem
0,5
0,5
µ=md=mo
Entendendo a distruição
• Alterações no valor da média
– implicam no deslocamento do ponto de máximo ao longo do eixo y, sem alterações na forma básica
• Alterações no valor do desvio padrão
– implicam em uma maior ou menor afastamento dos dados em torno da média
O surgimento da normal padrão
Para calcularmos probabilidades utilizando a função densidade é necessário integramos a função no intervalo
requerido. No caso da normal, tal integração apresenta um grau relativo de dificuldade.
Esses problemas foram solucionados por meio de uma mudança de variável, obtendo-se, assim, a distribuição
normal padronizada ou reduzida, cujo a média é igual a zero e o desvio igual a um.
2
Z=
X−µ
σ
Logo, a função densidade reduziu-se a:
2
1
1
f (Z = z) = √ e− 2 (z)
2π
Deste modo, temos a seguinte equivalência para cálculo de probabilidades:
P (X1 ≤ X ≤ X2 ) = P (Z1 ≤ Z ≤ Z2 )
Uma vez as distribuições normal e normal padrão são equivalentes, a proporção de valores caindo dentro de
um, dois, três ou quatro desvios padrão da média são:
Utilizando o R
Para calcularmos probabilidades utilizando a normal padrão, veremos como funciona a função pnorm do R.
Por padrão, a função pnorm funciona da seguinte forma:
Aplicações
1. Seja Y ∼ N (100, 25), determine as seguintes probabilidades:
P (100 ≤ Y ≤ 106)
mu = 100
sigma2 = 25
sigma = sqrt(sigma2)
# Desenhando o que se pede
curve(dnorm(x,100,5),
from = 80,
to = 120,
axes = FALSE,
ylab = '',
xlab = '')
axis(1, at=c(80,100,106,120))
polygon(x = c(100,
seq(100,
106,
length = 1e3),
106),
y = c(0,
dnorm(seq(100,
106,
length = 1e3),
100,
5),
0),
col='bisque')
text(103,0.03,'?',cex = 1.5, col = 'darkred')
3
?
80
100
106
# Transformando Y1 = 100
Y1a = 100
Z1a = (Y1a - mu)/sigma
Z1a
## [1] 0
# Transformando Y2 = 106
Y2a = 106
Z2a = (Y2a - mu)/sigma
Z2a
## [1] 1.2
# Calculando a probabilidade
p1a = pnorm(Z1a)
p1a
## [1] 0.5
p2a = pnorm(Z2a)
p2a
## [1] 0.8849
pdesejadaa = p2a - p1a
pdesejadaa
## [1] 0.3849
P (89 ≤ Y ≤ 107)
4
120
# Desenhando o que se pede
curve(dnorm(x,100,5),
from = 80,
to = 120,
axes = FALSE,
ylab = '',
xlab = '')
axis(1, at=c(80,89,107,120))
polygon(x = c(89,
seq(89,
107,
length = 1e3),
107),
y = c(0,
dnorm(seq(89,
107,
length = 1e3),
100,
5),
0),
col='bisque')
text(100,0.03,'?',cex = 1.5, col = 'darkred')
?
80
89
107
# Transformando Y1 = 89
Y1b = 89
Z1b = (Y1b - mu)/sigma
Z1b
## [1] -2.2
# Transformando Y2 = 106
Y2b = 106
5
120
Z2b = (Y2b - mu)/sigma
Z2b
## [1] 1.2
# Calculando a probabilidade
p1b = pnorm(Z1b)
p1b
## [1] 0.0139
p2b = pnorm(Z2b)
p2b
## [1] 0.8849
pdesejadab = p2b - p1b
pdesejadab
## [1] 0.871
P (112 ≤ Y ≤ 116)
# Desenhando o que se pede
curve(dnorm(x,100,5),
from = 80,
to = 120,
axes = FALSE,
ylab = '',
xlab = '')
axis(1, at=c(80,112,116,120))
polygon(x = c(112,
seq(112,
116,
length = 1e3),
116),
y = c(0,
dnorm(seq(112,
116,
length = 1e3),
100,
5),
0),
col='bisque')
text(114,0.005,'?',cex = 1.5, col = 'darkred')
6
?
80
112
# Transformando Y1 = 112
Y1c = 112
Z1c = (Y1c - mu)/sigma
Z1c
## [1] 2.4
# Transformando Y2 = 116
Y2c = 116
Z2c = (Y2c - mu)/sigma
Z2c
## [1] 3.2
# Calculando a probabilidade
p1c = pnorm(Z1c)
p1c
## [1] 0.9918
p2c = pnorm(Z2c)
p2c
## [1] 0.9993
pdesejadac = p2c - p1c
pdesejadac
## [1] 0.00751
P (Y ≥ 108)
7
116
120
# Desenhando o que se pede
curve(dnorm(x,100,5),
from = 80,
to = 120,
axes = FALSE,
ylab = '',
xlab = '')
axis(1, at=c(80,108,120))
polygon(x = c(108,
seq(108,
120,
length = 1e3),
120),
y = c(0,
dnorm(seq(108,
120,
length = 1e3),
100,
5),
0),
col='bisque')
text(109,0.01,'?',cex = 1.5, col = 'darkred')
?
80
108
# Transformando Y1 = 108
Y1d = 108
Z1d = (Y1d - mu)/sigma
Z1d
## [1] 1.6
# Calculando a probabilidade
p1d = pnorm(Z1d)
p1d
8
120
## [1] 0.9452
pdesejadad = 1 - p1d
pdesejadad
## [1] 0.0548
P (Y ≤ 90)
# Desenhando o que se pede
curve(dnorm(x,100,5),
from = 80,
to = 120,
axes = FALSE,
ylab = '',
xlab = '')
axis(1, at=c(80,90,120))
polygon(x = c(80,
seq(80,
90,
length = 1e3),
90),
y = c(0,
dnorm(seq(80,
90,
length = 1e3),
100,
5),
0),
col='bisque')
text(89,0.005,'?',cex = 1.5, col = 'darkred')
?
80
90
120
9
# Transformando Y1 = 108
Y1e = 90
Z1e = (Y1e - mu)/sigma
Z1e
## [1] -2
# Calculando a probabilidade
p1e = pnorm(Z1e)
p1e
## [1] 0.02275
pdesejadae = p1e
pdesejadae
## [1] 0.02275
10
Download

Distribuição Normal e Normal padrão