Distribuições de
Probabilidade
Distribuição Normal
1
Distribuição Normal ou Gaussiana
A distribuição Normal ou Gaussiana é muito utilizada em
análises estatísticas. É uma distribuição simétrica em torno
da sua média e em forma de sino. Depende de dois
parâmetros que são a média e a variância da distribuição.
X ~ N(µ, σ) significa que X tem distribuição Normal com média µ e
desvio padrão σ.
Nota: alguns autores utilizam a notação N(µ, σ2) sendo o segundo
parâmetro a variância em vez do desvio padrão.
2
Curva de densidade da Normal
3
Densidades Normais
N(0,0.7)
N(0,1)
N(0,1.2)
4
Normal standard ou padrão
Quando µ = 0 e σ = 1 temos a distribuição
Normal standard (também se diz Normal
padrão ou Normal centrada e reduzida). Os
valores da função de distribuição, F(x), e os
valores de certos quantis mais utilizados
encontram-se tabelados.
5
Normal Standard
Habitualmente utiliza-se:
a letra Z para representar uma Normal Standard.
A designação Φ(z) para representar F(z).
A designação zp para representar o quantil de
ordem p.
Atenção que os quantis têm diferentes
representações de autor para autor. Muitos
utilizam zp para representar o quantil de ordem
1-p, ou ainda (1-p)/2.
6
Normal Standard – quantil de ordem 0.95
z0.95
7
Normal Standard – quantis de ordem
0.025 e 0.975
z0.025 e z0.975
8
Cálculo de probabilidades da Normal
Para calcular probabilidades associadas a
uma distribuição Normal qualquer, podemos
recorrer às tabelas ou a software ou a
máquinas de calcular.
No SPSS as funções associadas à
distribuição Normal são:
Cdf.Normal(x,µ,σ) para a função de distribuição
no ponto x, F(x);
Idf.Normal(p,µ,σ) para o quantil de ordem p, xp.
9
Cálculo de probabilidades da Normal:
Normalização
Para recorrer às tabelas é necessário normalizar a
variável antes de calcular uma probabilidade (ou
um quantil).
Se X ~ N(µ,σ) então Z = (X- µ) / σ ~ N(0,1).
10
Cálculo de probabilidades da Normal:
Normalização
Por exemplo, se X tem distribuição N(5,2) e
queremos calcular P(X≤7):
 X −5 7 −5
P ( X ≤ 7) = P 
≤
 = P (Z ≤ 1) = Φ(1) = 0,8413
2 
 2
11
Propriedades da Normal
Se adicionarmos uma constante b a uma
variável Normal X ~ N(µ,σ), obtemos uma
nova variável Normal, Y=X+b ~ N(µ+b, σ).
Se multiplicarmos uma variável Normal por
uma constante a obtemos uma nova variável
Normal, Y=aX ~ N(aµ,aσ).
12
Propriedades da Normal
A soma de variáveis aleatórias Normais é ainda
Normal com média igual à soma das médias. Se as
variáveis forem independentes a variância é igual à
soma das variâncias.
Em particular a média X de n variáveis Normais
independentes e com a mesma distribuição é ainda
Normal
X ~ N (µ , σ /
n
)
13
Resultados Importantes
Lei dos Grandes Números
Teorema do Limite Central
14
Lei dos grandes números
A média de um conjunto de n variáveis
aleatórias independentes e identicamente
distribuídas, com média µ e desvio padrão σ,
converge para µ à medida que n aumenta.
A partir deste resultado podemos dizer que a
frequência relativa de um certo
acontecimento de interesse num conjunto de
n experiências independentes, converge para
a probabilidade do acontecimento à medida
que n aumenta.
15
Estabilização das frequências relativas no
lançamento sucessivo de uma moeda ao ar
16
Teorema do Limite Central
Vimos anteriormente que a média de uma conjunto
de variáveis aleatórias Normais, é ainda Normal:
X ~ N ( µ,σ ) ⇒ X ~ N (µ , σ /
n
)
O Teorema do Limite Central permite dizer que a
média de um conjunto de variáveis aleatórias com
uma qualquer distribuição é aproximadamente
Normal (cada vez mais Normal à medida que o nº
de variáveis aumenta)
X ~ F ( x ) ⇒ X ~ N (µ , σ /
apr .
n
)
17
Teorema do Limite Central
Se tivermos n variáveis aleatórias X1,X2…,Xn
independentes e com a mesma distribuição de
média µ e variância σ2,então quando n cresce para
infinito,
X −µ
dist

→ N (0,1)
σ/ n
ou equivalentemente
∑X
i
− nµ
nσ
dist

→ N (0,1)
18
Ilustrações do TLC e da LGN
Alguns sites para explorar o TLC e a LGN
http://www.stat.sc.edu/~west/javahtml/CLT.html
(dados)
http://www.rand.org/statistics/applets/clt.html
(bolinhas a cair)
http://www.statisticalengineering.com/central_limit_t
heorem_(inverse).htm (texto com pequena
simulação)
http://www.maths.soton.ac.uk/teaching/units/ma1c6/l
inks/samplingapplet/samplingapplet.html
19
Aproximações baseadas no TLC
Podemos efectuar cálculos de
probabilidades aproximadas com base no
TLC. Ilustramos esta situação com dois
exemplos:
Probabilidades associadas a distribuições
Binomiais;
Probabilidades associadas a distribuições de
Poisson.
20
Aproximações baseadas no TLC:
Binomial - Normal
Probabilidades associadas a uma
distribuição Binomial, B(n,p), podem ser
aproximadas utilizando uma distribuição
Normal, N(µ,σ), com µ=np e σ = np(1-p).
Para que a aproximação não seja muito má,
devemos ter np ≥ 5 e n (1-p) ≥ 5.
21
Aproximações baseadas no TLC:
Binomial - Normal
Quando usamos a distribuição Normal (que
é uma distribuição contínua) para aproximar
a distribuição Binomial (que é uma
distribuição discreta), fazemos uma
correção de continuidade ao valor discreto x
na distribuição binomial representando o
valor x pelo intervalo de x – 0.5 a x + 0.5.
22
Aproximações baseadas no TLC:
Binomial - Normal
23
Aproximações baseadas no TLC:
Binomial - Normal
24
Aproximações baseadas no TLC:
Poisson - Normal
Probabilidades associadas a uma
distribuição de Poisson, P(λ), podem ser
aproximadas utilizando uma distribuição
Normal, N(µ,σ), com µ= λ e σ = λ.
A aproximação será tanto melhor quanto
maior for λ.
25
Download

Slides