Inferência Estatística
Curva Normal
Prof. Salvatore B. Virgillito
Distribuição de Probabilidades
(Características)
• A definição matemática de distribuição discreta de
probabilidades é o resultado de uma função P(X) que
satisfaz às seguintes propriedades:
– A probabilidade P(X) que a variável aleatória X assuma um valor
real positivo. Não se define probabilidade negativa.
– A soma de todas as probabilidades de P(X) dados todos os
possíveis valores de X deve ser igual a 1, .
Como conseqüência podemos deduzir que para qualquer valor
de X, sua probabilidade P(X) estará sempre entre 0 e 1.
Exemplo de fixação
• Tomando-se por base os conceitos citados na
transparência anterior, explique o porquê cada uma das
distribuições abaixo pode ou não ser uma distribuição de
probabilidades.
Respostas
• 1) Esta distribuição não pode ser uma distribuição de probabilidades pois a
somatória das probabilidades da variável aleatória X assumir o valor de
cada x= 0,1,2,3,4 é maior que 100% ou 1. Lembra-se que a soma de
todas as probabilidades de P(X) dados todos os possíveis valores de X deve
ser igual a 1.
• 2) Esta distribuição não pode ser uma distribuição de probabilidades pois a
somatória das probabilidades da variável aleatória X assumir o valor de
cada x= 0,1,2,3,4 é menor que 100% ou 1. Lembra-se novamente que a
soma de todas as probabilidades de P(X) dados todos os possíveis valores
de X deve ser igual a 1.
• 3) Esta distribuição não pode ser uma distribuição de probabilidades, pois
uma das probabilidades da variável aleatória X assumir o valor igual a 2 é
negativa (- 0,20), ou seja, uma função discreta que resulte em valores
negativos ou maiores que 1, não pode ser dita função de probabilidades.
• 4) Esta distribuição, ao contrário de todas as demais é uma distribuição de
probabilidades, pois a somatória das probabilidades é exatamente igual a 1
(nem mais nem menos que 100%) e não existem probabilidades negativas
de ocorrência.
Distribuição Normal
(Características)
• A curva é suave e unimodal;
• Simétrica em relação à média;
• A distribuição normal fica completamente
•
•
definida pela média e desvio padrão;
A área sob a curva normal corresponde a 100%
da probabilidade associada à variável;
A probabilidade de observar um valor específico
é zero pois não caracteriza uma área sob a
curva.
Forma da distribuição normal
f ( x) =
1
e
2πσ
1  x−µ  2
− 

2 σ 
Distribuição normal
Função Distribuição de Probabilidade e
Função Repartição.
• Distribuição de probabilidades é definida então como sendo o
•
conjunto de todas as possibilidades de resultados (função
probabilidade) da variável aleatória discreta X (evento de interesse).
O acúmulo da probabilidade de ocorrência de um evento dá origem à
função repartição.
Freqüência
Soma simples
2
1
3
2
4
3
5
4
6
5
7
6
8
5
9
4
10
3
11
2
12
1
Total
36
1/36 =
2/36 =
3/36 =
4/36 =
5/36 =
6/36 =
5/36 =
4/36 =
3/36 =
2/36 =
1/36 =
Função
Função
Probabilidade Repartição
0,0278
0,0278
0,0556
0,0833
0,0833
0,1667
0,1111
0,2778
0,1389
0,4167
0,1667
0,5833
0,1389
0,7222
0,1111
0,8333
0,0833
0,9167
0,0556
0,9722
0,0278
1,0000
1,0000
Representação gráfica
A freqüência simples de
cada valor da variável
aleatória X corresponde um
valor de freqüência relativa
(Função Probabilidade). O
acúmulo dessa freqüência
relativa definirá a função
Repartição (densidade
acumulada)
A distribuição Normal
padronizada
Variável padronizada
z=
x−µ
σ
Representando de outra forma
0,2500
0,2000
0,1500
0,1000
0,0500
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
-3
,5
-3
-2
,5
-2
-1
,5
-1
-0
,5
0
0,
5
1
1,
5
2
2,
5
3
3,
5
4
20
0,0000
0,2500
0,2000
0,1500
0,1000
0,0500
-4
0,0000
Distribuição Normal
e Probabilidades
• Para cada valor da variável aleatória X corresponde um
•
•
•
afastamento em relação à média, que pode ser medido
em número de desvios-padrão. A isto se chama de
PADRONIZAÇÃO.
Pode-se portanto expressar a posição da variável em
número de desvios-padrão.
Por sua vez a cada valor desse afastamento medido em
número de desvios-padrão corresponde uma área
debaixo da curva normal.
Essa área equivale à probabilidade de ocorrência da
variável aleatória X (variável em estudo).
Área sob o gráfico da normal
(probabilidade)
Distribuição Normal e
Probabilidades
• A probabilidade de uma variável
aleatória assumir valores entre dois
pontos quaisquer é igual à área sob a
curva normal entre aqueles pontos.
Consulta à Tabela de Escore
Reduzido
•Qual a área equivalente à
um afastamento de + 0,46
desvios-padrão?
R. 17,72% acima da média
(ponto 0).
•Qual a área equivalente à
um afastamento de – 1,12
desvios-padrão?
R. 36,86% abaixo da média
(ponto 0).
Exemplo resolvido
Área entre dois valores
Área entre dois valores
Teste gráfico da Normalidade das
variáveis
Suponhamos o seguinte estudo de caso para determinação se os
investimentos em propaganda estão distribuídos normalmente.
Freqüências normais esperadas
Freqüências Esperadas x Observadas
Existe pouquíssima
diferença entre as
freqüências normais
esperadas e as
freqüências observadas.
Desta forma conclui-se
que a distribuição de
probabilidades do evento
considerado, adere bem
ao formato da curva
normal e que portanto
podem ser considerados
como tendo
comportamento normal.
Teste de Normalidade no SPSS
• Abra o arquivo Electric.sav e verifique se a variável Serum Cholesterol tem ou
não comportamento normal.
Como os pontos
vermelhos
(freqüências
observadas)
aderem bem à
reta (verde) que
representa a
probabilidade
normal esperada,
conclui-se que a
variável em
questão tem
comportamento
Normal.
Exercícios
• Ver Lista de Exercícios no Site do professor.
Download

Inferência Estatística