1/144
Modelagem
Estatística
2/144
População
e Amostra
População: Conjunto dos elementos que se
deseja abranger no estudo considerado.
Amostra: Subconjunto
população.
dos
elementos
da
3/144
População
 Finita - Alunos do mestrado, funcionários de
uma empresa, eleitores etc.
 Infinita - Nascimentos em um cidade, produção
de uma máquina etc.
4/144
População
e Amostra
Censo: Estudo através do exame de todos os
elementos da população.
Amostragem: Estudo por meio do exame de
uma amostra.
5/144
Técnicas de
Amostragem
Amostragem
probabilística
(aleatória)
a
probabilidade de um elemento da população ser
escolhido é conhecida.
Amostragem não probabilística (não aleatória) - Não
se conhece a probabilidade de um elemento da
população ser escolhido para participar da amostra.
6/144
Amostragem
Aleatória
Simples
Faz-se uma lista da população e sorteiam-se os
elementos que farão parte da amostra.
Cada subconjunto da população com o mesmo
nº de elementos tem a mesma chance de ser
incluído na amostra.
pr = n/N
7/144
DISTRIBUIÇÕES AMOSTRAIS
8/144
Parâmetro e
Estatística
Parâmetro
população.
-
característica
relacionada
à
Estatística
amostra.
-
característica
relacionada
à
9/144
Parâmetros
Média

Proporção
p
Desvio Padrão

etc
10/144
Estatísticas
Média
X
Proporção
p
Desvio Padrão
s
etc
11/144
Distribuições
Amostrais
Qualquer característica de uma amostra
aleatória (estatística) é uma variável aleatória.
Em outras palavras, se tomarmos várias
amostras de forma parecida, os resultados da
característica (estatística) que nos interessa
variarão por causa da aleatoriedade do sorteio.
12/144
Distribuições
Amostrais
Distribuição Amostral - Distribuição
probabilidades de uma estatística.
de
13/144
Exemplo
A população de um estudo é composta de 4
pessoas (N=4) e a variável de interesse é a
altura.
X1=1,50m
X2=1,60m
X3=1,70m
X4=1,80m
14/144
Parâmetros
N=4
X1=1,50m
X3=1,70m
X2=1,60m
X4=1,80m
Média populacional:
= 1,65m
Desvio Padrão:
 = 0,1118m
15/144
Exemplo
Retira-se uma amostra aleatória simples com 2
elementos (n=2), com reposição.
Qual será a média amostral?
Qual é a distribuição de probabilidades da média
amostral?
16/144
Exemplo
Amostra
X1 X 1
X1 X 2
X1 X 3
X1 X 4
X2 X 1
X2 X 2
X2 X 3
X2 X 4
Amostra
X3 X 1
X3 X 2
X3 X 3
X3 X 4
X4 X 1
X4 X 2
X4 X 3
X4 X 4
17/144
Exemplo
Amostra
X1 X 1
X1 X 2
X1 X 3
X1 X 4
X2 X 1
X2 X 2
X2 X 3
X2 X 4
X
1,50
1,55
1,60
1,65
1,55
1,60
1,65
1,70
Amostra
X3 X 1
X3 X 2
X3 X 3
X3 X 4
X4 X 1
X4 X 2
X4 X 3
X4 X 4
X
1,60
1,65
1,70
1,75
1,65
1,70
1,75
1,80
18/144
Exemplo
Amostra
X1 X 1
X1 X 2
X1 X 3
X1 X 4
X2 X 1
X2 X 2
X2 X 3
X2 X 4
X
1,50
1,55
1,60
1,65
1,55
1,60
1,65
1,70
Prob.
1/16
1/16
1/16
1/16
1/16
1/16
1/16
1/16
Amostra
X3 X 1
X3 X 2
X3 X 3
X3 X 4
X4 X 1
X4 X 2
X4 X 3
X4 X 4
Total
X
1,60
1,65
1,70
1,75
1,65
1,70
1,75
1,80
-
Prob.
1/16
1/16
1/16
1/16
1/16
1/16
1/16
1/16
1
Distribuição
Amostral da
Média
X
1,50
1,55
1,60
1,65
1,70
1,75
1,80
Total
P(X)
1/16
2/16
3/16
4/16
3/16
2/16
1/16
1
P(X)
0,0625
0,1250
0,1875
0,2500
0,1875
0,1250
0,0625
19/144
Distribuição
Amostral da
Média
20/144
4/16
3/16
3/16
2/16
2/16
1/16
1,50
1/16
1,55
1,60
1,65
1,70
1,75
1,80
Distribuição
Amostral da
Média
21/144
Calcular o valor esperado (média) e o desvio
padrão da média amostral.
22/144
Média e
Variância
X
P(X)
x1
x2
...
xn
p1
p2
...
pn
Total
1
E(X) = x =  (xi.pi)
VAR(X) = x =  pi.(xi-x)2
23/144
Distribuição Amostral
da Média
X
1,50
1,55
1,60
1,65
1,70
1,75
1,80
Total
P(X)
1/16
2/16
3/16
4/16
3/16
2/16
1/16
1
P(X)
0,0625
0,1250
0,1875
0,2500
0,1875
0,1250
0,0625
24/144
Distribuição Amostral
da Média
X
= E(X)
= 1,65 m
X = 0,0791 m
30/144
Distribuição Amostral
da Média
Características
a)
x = 
31/144
Distribuição
Amostral da Média
Características
b)
 x=

 x=

n
n
população infinita ou
muito grande ou
amostragem com reposição
N-n
N-1
população
finita
32/144
Distribuição Amostral
da Média
Características
c) A distribuição da média amostral é normal.
33/144
Exercício
Uma fábrica de pneus alega que a vida média
dos pneus é 30.000 Km, com desvio padrão de
2.000 Km. Tomando-se como verdadeiros
estes dados, qual é a probabilidade de uma
amostra com 40 pneus apresentar vida média
menor que 29.500 Km?
34/144
Exercício
 x=
 x=

n
2000
40
x = 316,22777
35/144
Exercício
P(X<29500)
X
29,5 30
36/144
Exercício
 29500 =
29.500 - 30.000
316,23
= -1,58
0,057053
-1,58
0
Z
37/144
Exercício
Um lote com 100 pneus apresenta vida útil
média de 30.000 Km, com desvio padrão de
2.000 Km. Qual é a probabilidade de uma
amostra aleatória simples com 40 pneus
apresentar vida média de menos que 29.500
Km?
38/144
Exercício
 x=
 x=

N-n
N-1
n
2000
40
100 - 40
100 - 1
x = 246,18298
39/144
Exercício
P(X<29500)
X
29,5 30
40/144
Exercício
 29500 =
29.500 - 30.000
246,18
= -2,03
0,021178
-2,03
0
Z
41/144
Exercício 1
 Se a vida útil média de uma peça é 5.000
horas, com desvio padrão de 200 horas, qual é a
probabilidade de que uma amostra com 25
produtos apresente média superior a 5.100
horas?
0,00621
42/144
Exercício 2
Um banco informa que o saldo médio das 2000
contas de pessoas físicas é $ 500, com desvio
padrão de $ 100. Se uma amostra aleatória de
50 correntistas (pessoa física) daquele banco for
retirada, qual é a probabilidade do saldo médio
ser menor que $ 480?
43/144
Exercício
População finita : Resp = 0,076359
População infinita: Resp = 0,079270
44/144
Modelagem
Estatística
Distribuição Amostral
da Proporção
45/144
Distribuição
Amostral da
Proporção
p - prop. populacional
p - prop. amostral
População
Plano de
amostragem
p
Amostra
p
46/144
Exemplo
A população de um estudo é composta de 4
pessoas (N=4) e a variável de interesse é a
proporção de pessoas altas (altura > 1,75m).
N=4
X1=1,50m
X3=1,70m
X2=1,60m
X4=1,80m
47/144
Parâmetro
N=4
X1=1,50m
X3=1,70m
X2=1,60m
X4=1,80m
Proporção populacional: 1/4 = 0,25
48/144
Exemplo
Retira-se uma amostra aleatória simples com 2
elementos (n=2), com reposição.
Qual será a proporção amostral?
Qual é a distribuição de probabilidades da
proporção amostral?
53/144
Distribuição
Amostral da
Proporção
Binomial (n=2 , p=1/4)
número de pessoas altas
proporção =
tamanho da amostra
65/144
Distribuição Amostral
da Proporção
Características
a)
p = p
66/144
Distribuição Amostral
da Proporção
Características
b)
 p=
p.(1-p)
n
população infinita ou
muito grande ou
amostra com reposição
 p=
p.(1-p)
n
N-n
N-1
população
finita
67/144
Distribuição Amostral
da Proporção
Características
c1) A distribuição das proporções amostrais é binomial
no caso de população infinita. Quando o tamanho da
amostra for grande, esta distribuição pode ser
aproximada por uma distribuição normal.
c2) A distribuição das proporções amostrais é
hipergeométrica no caso de população finita.
Quando o tamanho da amostra for grande, esta
distribuição pode ser aproximada por uma
distribuição normal.
68/144
Exercício
Uma fábrica de pneus alega que 99% de seus
produtos possuem vida útil longa (duram mais
que
30.000
Km).
Tomando-se
como
verdadeiros estes dados, qual é a
probabilidade de uma amostra com 400 pneus
apresentar menos que 2% dos pneus com vida
útil menor que 30.000 Km?
69/144
Exercício
 p=
p.(1-p)
n
 p=
0,01.0,99
400
p = 0,004975
70/144
Exercício
P(p<0,02)
0,01 0,02
P
71/144
Exercício
0,02 - 0,01
Z 0,02 = 0,004975
= 2,01
0,977784
0
2,01
Z
76/144
Exercício 3
Um banco informa que apenas 10% dos 5000
clientes possuem saldo médio acima de $500.
Se uma amostra aleatória de 100 correntistas
daquele banco for retirada, qual é a
probabilidade de haver mais de 15 clientes na
amostra com saldo acima de $500?
77/144
Exercício
População finita : Resp = 0,046479
População infinita: Resp = 0,047460
78/144
Modelagem
Estatística
Estimação
79/144
Estimação de
Parâmetros
População
Amostra


X
2
p

S2

P
80/144
Estimação
Conhecidas
as
estatísticas
(amostra), estimar quais são os
parâmetros (população).
Amostra
População

X
S2

P
?
81/144
Estimação
Pontual  Estima-se apenas um valor
para o parâmetro.
Intervalar  Estima-se um intervalo de
valores onde deve-se encontrar o parâmetro
(intervalo de confiança).
82/144
Propriedades
Desejáveis de um
Estimador
Não-tendenciosidade
ou
justeza:
um
estimador é justo (não tendencioso, não
viesado; não viciado) se sua média (ou valor
esperado) for o próprio parâmetro que se
pretende estimar.
83/144
Tendenciosidade
Ex:Média

X=
Xi
n

E( X ) =
 Não-tendencioso
 X = 
84/144
Tendenciosidade
Ex: Proporção
Xi

P=
n

E( P) =
 Não-tendencioso
 P = p
85/144
Tendenciosidade
 
X
^ 2 =  (Xi -
n
 Tendencioso
^ )=
 E(
2
n -1
n

2
86/144
Tendenciosidade
 
X
^ 2 =  (Xi -
n
 Tendencioso
 
X
 (Xi -
2
2
^
 =S =
n-1
 E (^ ) =
2
n -1
n

2
2
2
2
^
 E( ) = E(s ) = 
 Não-tendencioso
87/144
Consistência
Um estimador é consistente se o aumento do
tamanho da amostra leva a uma redução da
variância.
88/144
Eficiência
Um estimador não-tendencioso (E1) é mais
eficiente que outro estimador não-tendencioso
(E2) se a variância de E1 for menor que a
variância de E2.
E
2
1
<
E
2
2
89/144
Eficiência
E1 é mais eficiente que E2
x x xxx x
x xx x
xx
x xxx xxx x x
x x x x x xxxx
x x xx xx
xx x xxxx x xx x
xx x xxx
xxxx
x
x x x xx x
x x xxx x x x x x
x xx x x xx x x
x x x xx x x x xx x
x
xx xx
x
xx
xx
x x xxxx xxx xxxx xxxx
x x
xxx x x
x
x x x xx x x x x x x
x xxxx x x x
xx x x xxxxxx
x x xx x x x
xx xxxx
E1
E2
Não-tendenciosos
x x xxx x
x xx x
xx
x xxx xxx x x
x x x x x xxxx
x x xx xx
xx x xxxx x xx x
xx x xxx
xxxx
E3
Tendencioso
90/144
Métodos de
Estimação
Como selecionar o melhor estimador?
Método da Máxima Verossimilhança
Método dos Mínimos Quadrados
Métodos Bayesianos
...
91/144
Intervalos de
Confiança
Problema: Estimar 2 limites, dentro dos
quais deve se encontrar o valor real, com um
determinado nível de confiança.
92/144
Exemplo: Média
População infinita
(valor real = ) (desconhecido)


93/144
Exemplo: Média

Amostra: média amostral (X )
 X= 
n

E( X ) =

94/144
Exemplo
População infinita
(valor real = ) (desconhecido)
 = 10

95/144
Exemplo
Distribuição Amostral

Amostra: média amostral (X )
 X=

10
25
=2
96/144
Exemplo

Qual a probabilidade de X ser maior que ?
97/144
Exemplo

Qual a probabilidade de X ser maior que ?
0,50

98/144
Exemplo
Qual a probabilidade de X - 
1,96 vezes o desvio padrão?
ser maior que
Qual a probabilidade da distância entre a média
populacional (µ) e a média amostral (X) ser
maior do que 1,96 vezes o desvio padrão da
distribuição amostral da média?
99/144
Exemplo
 X=
10
25
=2
1,96 . 2 = 3,92
Qual a probabilidade da distância entre a média
populacional (µ) e a média amostral (X) ser
maior do que 3,92?
100/144
Exemplo
Qual a probabilidade de X -  ser maior que
1,96 vezes o desvio padrão?
Resp: 5%
0,025
0,025
-1,96 0 1,96
101/144
Exemplo: Média
Se alguém afirmar que X estará a menos de
1,96 vezes o desvio padrão da média (para
mais ou para menos), terá 95% de
probabilidade de estar certo e 5% de
probabilidade de estar errado.
102/144
Simbologia
 Probabilidade de erro admitida
(probabilidade do parâmetro encontrarse fora do intervalo a ser criado).
 No exemplo, 
103/144
Simbologia
 Grau de confiança (probabilidade
do parâmetro encontrar-se no
intervalo)
No exemplo, 
104/144
Simbologia
 Limite do I.C. na distribuição
padronizada.
No exemplo, 
105/144
Limites
O intervalo é construído somando-se e
diminuindo-se Z vezes o desvio padrão da média
amostral obtida.
106/144
Limites
A média da amostra não se diferenciará da
média populacional em mais que Z vezes o
desvio padrão (da distribuição amostral)
Int. Conf.:
_
X +- 
 x
107/144
Limites
Int. Conf.:
 x = 
n


x=

n
_
X +- 
 x
População infinita
N -n
N -1
População finita
108/144
Exemplo
Foi retirada uma amostra com 64
elementos de uma população com desvio
padrão igual a 100. A média encontrada foi
300. Construir um intervalo para a média
com:
a) 90% de confiança
109/144
Exemplo

5%
Z0,05

0
110/144
Exemplo


X

Lim= 300 +-1,645
100
64
20,5625
n
Linf = 279,4
Lsup = 320,6
111/144
Exemplo
 b)
99% de confiança


Lim= 300 +-2,575
100
64
32,1875
Linf = 267,8
Lsup = 332,2
112/144
Exemplo
Encontrar, na tabela da normal reduzida, os
valores de Z para:
 
 
 
 
113/144
Exemplo
Encontrar, na tabela da normal reduzida, os
valores de Z para:
 

 

 

 

114/144
Intervalo de Confiança
Média ( conhecido)
Int. Conf.:
 x = 
n


x=

n
_
X +- 
 x
População infinita
N -n
N -1
População finita
115/144
Intervalo de Confiança
Média
( desconhecido)
Normalmente, não se conhece o desvio
padrão da população cuja média se deseja
estimar.
Então, utiliza-se um estimador pontual
para o desvio padrão populacional.
116/144
Intervalo de Confiança
Média
( desconhecido)
s = Desvio padrão da amostra
s
Xi - X)2
n-1
117/144
Intervalo de Confiança
Média
( desconhecido)
Nesta situação, a distribuição correta a ser utilizada é a
distribuição “t” de Student, com (n-1) graus de
liberdade. (supondo que a população seja normal).
Obs: se a amostra for grande, pode utilizar-se a
distribuição normal como aproximação.
118/144
Intervalo de Confiança
Média
( desconhecido)
normal
t

0
t
119/144
Interv.Conf. Média (
desconhecido)
Int. Conf.:
^
x =
s
x =
s
^
n
n
_
^
+
X - t  x
População infinita
N -n
N -1
População finita
120/144
Limites do
Intervalo
t - valor limite da distribuição t, para a
probabilidade de erro , com (n-1) graus de
liberdade.
tabela t.
121/144
Exemplo
Encontrar o valor limite de t/2 para:
a)  = 1%, com 19 graus de liberdade (amostra
com 20 elementos)
2,861
122/144
Exemplo
Encontrar o valor limite de t/2 para:
a)  = 10%, com 19 graus de liberdade (amostra
com 20 elementos)
1,729
123/144
Exemplo
Encontrar o valor limite de t/2 para:
a)  = 5%, com 19 graus de liberdade (amostra
com 20 elementos)
2,093
124/144
Exemplo
Encontrar o valor limite de t/2 para:
a)  = 5%, com 29 graus de liberdade (amostra
com 30 elementos)
2,045
125/144
Exemplo
Encontrar o valor limite de t/2 para:
a)  = 5%, com
graus de liberdade
1,960
Comparar este resultado com Z0,025.
126/144
Exemplo
Na construção de um motor, o diâmetro dos cilindros é
de grande importância. Em uma pesquisa feita com 5
blocos com 4 cilindros cada (20 furos), o diâmetro
médio encontrado foi 82 mm e o desvio padrão 0,1 mm.
Construir um intervalo com 95% de confiança para este
parâmetro.
127/144
Exemplo
n = 20 (19 graus de liberdade)
s = 0,1 mm
X = 82 mm
= 5% - da tabela: t19 = 2,093
128/144
Exemplo
IC :
_
X +- tc
s
n
LS = 82,05 mm
 LI = 81,95 mm
82 +- 2,093
0,1
20
0,05
81,95 <  < 82,05 com 95% de confiança
129/144
Intervalo de
confiança para
a proporção
População com proporção p (desconhecida).
Amostra com n elementos e proporção p
conhecidos.
130/144
Distribuição
Amostral da
Proporção
 p
LI
(1-)
P
LS
131/144
Intervalo de
Confiança
Limites:
_
P +- 
P(1-P)
n
(População infinita)
132/144
Exemplo
Foi retirada uma amostra com 100 itens de
um grande lote de peças, sendo
encontrados 10 defeituosos. Construa um
intervalo de confiança com 3% de erro para
a percentagem de defeituosos no lote.
133/144
Exemplo

1,5%
Z0,05

0
134/144
Exemplo


p
Lim= 0,10 +-2,17
n
0,10.0,90
100
0,0651
Linf = 0,035
Lsup = 0,165
135/144
Tamanho de Amostras
136/144
Intervalo de Confiança
Média
_
X +- Z/2

n
erro máximo (e)
(população infinita)
137/144
Tamanho de
Amostras
Média

(erro máximo ou margem de erro)
n
e = Z/2
n=
Z/2 x 
e
2
(População infinita)
138/144
Tamanho de
Amostras
Média
n=
Z/2 x 
(População infinita)
e
2
n=
2
Z/2 x 
2
Z/2 x
2
x
N
2
2
 + e (N-1)
(População finita)
139/144
Tamanho de
Amostras
Estimação “a priori” do desvio padrão:
Estudos passados
Amostra piloto
Fixando-se um valor teórico
140/144
Intervalo de
Confiança
Proporção
_
P +- 
p(1-p)
n
erro máximo (e)
(População infinita)
141/144
Tamanho de
Amostras
Proporção
e = Z/2
p (1-p)
n
2
Z/2
p
(1-p)
n=
(População
infinita)
e2
142/144
Tamanho de
Amostras
Proporção
2
Z/2
p (1-p) (População infinita)
n=
2
e
2
Z/2 x p (1-p) x N
n= 2
(População finita)
2
Z/2 x p (1-p) + e (N-1)
143/144
Tamanho de
Amostras
Estimação “a priori” da proporção:
Estudos passados
Amostra piloto
Fixando-se um valor teórico (0,5)
144/144
Tamanho de
Amostras
Se p = 0,5  máximo tamanho de amostra.
2
Z
n= 2
e
x
0,25
2
0,25 x Z
n=
0,25 x Z 2+ e
(população infinita)
N
2
x (N-1)
x
(população finita)
Download

E(X)