CAPÍTULO 5 - INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA
5.1 INTRODUÇÃO
É freqüente encontrarmos problemas estatísticos do seguinte tipo : temos um
grande número de objetos (população) tais que se fossem tomadas as medidas X de
todos os objetos teríamos a distribuição exata desta variável. Entretanto, de modo
geral ocorre que a obtenção das observações de todos os elementos é inviável por
algum motivo (custos, tempo, dados inacessíveis, populações infinitas, etc.) e o
estudo é realizado, então, através de uma amostra retirada da população. Por
exemplo, suponha que se queira conhecer a altura média dos estudantes de
Engenharia do CEFET. Poderíamos obter as medidas das alturas de todos os alunos
citados e calcular a sua média exata. Entretanto, podemos obter uma estimativa
desta média através de uma amostra retirada do conjunto de todos os alunos
considerados e tirar conclusões a respeito do comportamento da variável altura em
toda a população. Este procedimento de fazer afirmações (generalizações) sobre
características de uma população baseando-se em resultados de uma amostra, é
objeto de estudo da INFERÊNCIA ESTATÍSTICA . Esquematicamente temos :
População
Amostra
X
θ
θ=?
X1 , X2 , ... , Xn
Inferência
Estatística
A Inferência Estatística é dividida em duas partes : Estimação e Testes de
Hipóteses. Testes de Hipóteses é um processo de aceitar ou rejeitar afirmações
feitas sobre características de uma população, enquanto que Estimação trata de
estimar valores para características populacionais.
A fim de podermos estudar os procedimentos da Inferência Estatística,
precisamos conhecer, além dos conceitos de probabilidade e distribuições de
probabilidade vistos, alguns elementos básicos dessa teoria, os quais apresentamos a
seguir.
90
ESTATÍSTICA
Notas de Aula
_____________________________________________________________________________________
5.2 POPULAÇÃO E AMOSTRA
População é o conjunto de indivíduos (ou objetos), tendo pelo menos uma
variável comum observável. Amostra é qualquer subconjunto da população.
Por exemplo, imagine que um industrial está interessado em conhecer a
duração de vida de um determinado componente eletrônico do seu processo
produtivo. A população é formada por todos os componentes deste tipo que tenham
sido fabricados ou que ainda venham a ser fabricados nessa indústria. Uma amostra
poderia ser formada por 100 destes componentes escolhidos ao acaso segundo
algum plano de retirada da amostra.
Se a variável de interesse neste estudo for X = duração de vida dos
componentes, então a sua caracterização na população poderá ser feita através da
distribuição de probabilidade de X. (O modelo exponencial pode ser adequado neste
caso).
5.3 PESQUISA POR AMOSTRAGEM
Uma vez que constatamos a necessidade de um estudo de interesse ser feito
através de uma amostra, temos alguns problemas a resolver. Um deles é definir
claramente os elementos da população a ser estudada, chamada de população-alvo ,
e a indicação das características desta população que serão medidas, ou seja, quais
as variáveis que serão avaliadas na pesquisa. Outro problema é definir como a
amostra será obtida, qual o seu tamanho e quais os elementos da população irão
compor a amostra.
Os problemas de amostragem podem ser mais ou menos complexos,
dependendo da população e das variáveis do estudo. Entretanto, uma preocupação
básica em relação a uma amostra é que ela seja representativa da população-alvo,
pois somente assim podemos fazer inferências válidas. Para conseguir
representatividade é necessário que o processo de escolha da amostra seja aleatório.
Assim, em Inferência Estatística, são utilizadas amostras probabilísticas que são
aquelas obtidas quando todos os elementos da população tem probabilidade
conhecida, e diferente de zero, de pertencer à amostra. Os métodos mais comuns de
extração de amostras probabilísticas são : Amostragem Aleatória Simples,
Amostragem por Conglomerado, Amostragem Estratificada e Amostragem
Sistemática.
_____________________________________________________________________________________
Marcia Olandoski Erbano
Depto. de Informática
CEFET-PR
ESTATÍSTICA
91
Notas de Aula
______________________________________________________________________________________
5.4 PARÂMETROS E ESTATÍSTICAS
Um parâmetro é uma medida usada para descrever uma característica da
população. Por exemplo, se estamos interessados em estudar a v.a. X = altura dos
elementos de uma população e esta variável tem Distribuição Normal N(µ,σ2),
então a média µ e a variância σ2 são os parâmetros deste modelo. São valores fixos
e muitas vezes desconhecidos.
Uma estatística é uma característica da amostra. Assim, se X1, X2, ... , Xn é
uma amostra aleatória de uma variável X, então θ$ = f (X1, X2, ... , Xn ) é uma
estatística.
População
Amostra
X
Estatística
(X1, X2, ... , Xn)
θ$
Parâmetro
θ
A notação mais comum para alguns parâmetros e estatísticas é :
Estatística
Parâmetro
Média
X
µ
Variância
s2
σ2
No de Elementos
n
N
Proporção
p$
p
_____________________________________________________________________________________
Marcia Olandoski Erbano
Depto. de Informática
CEFET-PR
92
ESTATÍSTICA
Notas de Aula
_____________________________________________________________________________________
5.5 DESCRIÇÃO DE UMA AMOSTRA DE MEDIDAS
Dados estatísticos (amostras) obtidos de pesquisas, experimentos, ou
qualquer série de medidas, são geralmente tão numerosos que se não forem
condensados ou reduzidos de forma adequada, poderão ser inúteis. Portanto, existe
a necessidade de se resumir estas medidas estatisticamente para que possam ser
utilizadas em análises posteriores. Veremos, a seguir, alguns métodos de descrição
de dados amostrais.
5.5.1 DESCRIÇÃO GRÁFICA DE UMA AMOSTRA DE MEDIDAS
Considere os dados abaixo como sendo os pesos de coberturas de zinco de 80
lâminas de ferro galvanizado de um dado tamanho, tomados de um manual da
Sociedade Americana de Testes de Materiais. Os 80 números podem ser vistos
como valores de uma variável aleatória X. Para investigar a distribuição de X, uma
representação gráfica simples é dada pelo “diagrama de freqüência de pontos”, no
qual cada um dos 80 números é indicado por um ponto do eixo x correspondente a
tal número.
TABELA 1 :
Pesos (em ounces) de coberturas de zinco de 80 lâminas de ferro galvanizado.
1,47
1,60
1,58
1,56
1,44
1,62
1,60
1,58
1,39
1,35
1,52
1,38
1,32
1,65
1,53
1,77
1,73
1,62
1,62
1,38
1,55
1,70
1,47
1,53
1,46
1,53
1,60
1,42
1,47
1,44
1,38
1,60
1,45
1,34
1,47
1,37
1,48
1,34
1,58
1,43
1,64
1,51
1,44
1,49
1,64
1,46
1,53
1,56
1,56
1,50
1,63
1,59
1,48
1,54
1,61
1,54
1,50
1,48
1,57
1,42
1,53
1,60
1,55
1,67
1,57
1,34
1,54
1,64
1,47
1,75
1,60
1,57
1,58
1,63
1,47
1,64
1,51
1,44
1,49
1,64
_____________________________________________________________________________________
Marcia Olandoski Erbano
Depto. de Informática
CEFET-PR
ESTATÍSTICA
93
Notas de Aula
______________________________________________________________________________________
GRÁFICO 1 :
f
30
20
10
1,20
1,30
1,40
1,50
1,60
1,70
1,80
Peso da Cobertura
( ounces )
5.5.2 DISTRIBUIÇÃO DE FREQÜÊNCIAS
É uma tabela que agrupa os dados em um número relativamente pequeno de classes
( intervalos ), listando o número de observações pertencentes a cada classe . Embora
se perca alguma informação a respeito dos dados, a distribuição é útil na
investigação das características da variável em estudo.
Vamos construir uma distribuição de freqüências para os dados da tabela 1,
seguindo uma seqüência de procedimentos.
1. Determinar a amplitude total dos dados, isto é, a diferença entre o maior e o
menor dado :
1,77 - 1,32 = 0,45
2. Dividir a amplitude total pelo número escolhido de classes ( ou intervalos ) de
mesmo tamanho. Geralmente usamos de 10 a 25 classes e um comprimento
conveniente de classes é um número “simples”. Neste exemplo, usaremos 10
classes de comprimento 0,05. Poderíamos utilizar 0,04 , 0,03 ou 0,02 , mas
evitamos comprimentos tais como 0,033 , 0,035 , etc.
3. Os intervalos de classes devem ser tais que acomodem todos os dados da
amostra, isto é, cada valor da amostra deve pertencer a alguma classe. Uma vez
definidos tais intervalos, contar o número de dados pertencentes a cada intervalo.
Aparecerão, então, as “freqüências de classe”.
_____________________________________________________________________________________
Marcia Olandoski Erbano
Depto. de Informática
CEFET-PR
94
ESTATÍSTICA
Notas de Aula
_____________________________________________________________________________________
TABELA 2 :
A
B
C
D
E
F
Classes
Freqs.
Ponto
Médio
Freqs.
Relativas
Freqs.
Acumls.
Freqs. Relat.
Acumuls.
1,30 - 1,35
5
1,33
0,0625
5
0,0625
1,35 - 1,40
5
1,38
0,0625
10
0,1250
1,40 - 1,45
8
1,43
0,1000
18
0,2250
1,45 - 1,50
15
1,48
0,1875
33
0,4125
1,50 - 1,55
13
1,53
0,1625
46
0,5750
1,55 - 1,60
17
1,58
0,2125
63
0,7875
1,60 - 1,65
12
1,63
0,1500
75
0,9375
1,65 - 1,70
2
1,68
0,0250
77
0,9625
1,70 - 1,75
2
1,73
0,0250
79
0,9875
1,75 - 1,80
1
1,78
0,0125
80
1,0000
• Na coluna A aparecem os limites de classe : limites inferiores e superiores.
• Na coluna C estão os pontos médios de classe, isto é, as médias dos limites de
classe. Estes pontos estão representando cada um dos dados pertencentes à
classe. Por exemplo, o valor 1,47 , da quarta classe fica aproximado pelo ponto
médio 1,48 , que o representa.
• As freqüências relativas de classe, na coluna D são as freqüências de classe da
coluna B divididas pela freqüência total 80.
• As freqüências acumuladas da coluna E são as somas das freqüências de classe.
• As freqüências relativas acumuladas da coluna F são as somas das freqüências
relativas da coluna D.
5.5.3 HISTOGRAMA E POLÍGONO DE FREQÜÊNCIAS
Algumas propriedades importantes das distribuições da freqüências, tais
como a sua simetria, achatamento, o número de modas ( freqüências máximas ), etc.
podem ser vistas num gráfico.
Para representar graficamente dados agrupados em uma distribuição de
freqüências, podemos utilizar um “histograma”, um “polígono de freqüências” ou
um “polígono de freqüências acumuladas”. Estas freqüências podem ser absolutas
ou relativas.
Os gráficos abaixo se referem à distribuição de freqüências dos dados da tabela 1 :
_____________________________________________________________________________________
Marcia Olandoski Erbano
Depto. de Informática
CEFET-PR
ESTATÍSTICA
95
Notas de Aula
______________________________________________________________________________________
GRÁFICO 2 :
HISTOGRAMA
18
15
12
Freq.
9
6
3
1.3
1.4
1.5
1.6
1.7
1.8
Pesos
GRÁFICO 3 :
POLÍGONO DE FREQÜÊNCIAS
18
15
12
Freq.
9
6
3
1.2
1.4
1.6
1.8
2.0
Pesos
GRÁFICO 4 :
POLÍGONO DE
FREQÜÊNCIAS ACUMULADAS
80
60
Freq.
Acumul. 40
20
0
1.3
1.4
1.5
1.6
1.7
1.8
Pesos
_____________________________________________________________________________________
Marcia Olandoski Erbano
Depto. de Informática
CEFET-PR
96
ESTATÍSTICA
Notas de Aula
_____________________________________________________________________________________
5.5.4 MÉDIA DE UMA AMOSTRA DE MEDIDAS
A média é uma medida que posiciona o centro da distribuição de uma
variável X. Quando temos uma amostra aleatória de tamanho n, a média é
simplesmente a média aritmética dos dados observados.
Se X1 , X2 , . . . , Xn é uma amostra de n medidas, a média amostral
denotada por X é definida por :
1
n
X=
n
∑X
i
i=1
Suponha que se tome a diferença entre X e X , ou seja :
X1 - X , X2 - X , . . . , X n - X .
Se somarmos estas diferenças, teremos :
( X1 - X ) + ( X2 - X ) +... + ( Xn - X ) = (X1 + X2 + ... + Xn) - n X = 0
Portanto, a soma das diferenças entre cada medida numa amostra e a
média de todas as medidas é igual a zero.
n
Em forma de somatório, temos : ∑ ( X i - X ) = 0
i=1
5.5.5 MEDIANA DE UMA AMOSTRA DE MEDIDAS
A mediana é também uma medida que posiciona o centro da distribuição de
uma variável X. Para uma amostra aleatória de tamanho n , a mediana será definida
como sendo o valor tal que 50 % dos dados estão acima dele e 50 % dos dados
estão abaixo dele. Para determinar o valor da mediana, Me, primeiro ordenamos os
dados ( ordem crescente ou decrescente ). Em seguida, se n for ímpar, então a
mediana será o valor central. Se n for par, a mediana será a média aritmética dos
dois valores centrais.
_____________________________________________________________________________________
Marcia Olandoski Erbano
Depto. de Informática
CEFET-PR
ESTATÍSTICA
97
Notas de Aula
______________________________________________________________________________________
5.5.6 MODA DE UMA AMOSTRA DE MEDIDAS
A moda de uma amostra de tamanho n será igual ao valor que apresenta
maior freqüência. Podemos ter uma amostra com mais de uma moda ou mesmo sem
moda.
EXEMPLO
As medidas da duração de vida ( em horas ) de 5 componentes eletrônicos
tomados aleatoriamente de sua produção são :
141 , 136 , 157 , 143 e 138.
A média das cinco medidas é :
141 + 136 + 157 + 143 + 138
= 143 horas
5
Em ordem crescente os dados ficam :
X =
136 138 141 143 157
Assim, a mediana é Me = 141.
Este conjunto de medidas é amodal, isto é, não tem moda porque nenhum
valor ocorre com maior freqüência que os demais.
5.5.7 VARIÂNCIA E DESVIO PADRÃO DE UMA AMOSTRA DE
MEDIDAS
Considere os dois conjuntos de medidas A e B abaixo :
A: 3 5 6 5 8 3
B : 0 1 6 9 12 2
Note que ambos os conjuntos de medidas tem a mesma média 6. Entretanto,
existe uma diferença entre eles quanto à sua variabilidade ou dispersão que não
pode ser identificada através da média.
VARIÂNCIA :
É uma medida de dispersão dos dados de uma amostra definida por:
1
s =
n -1
2
2
n
∑( X
i
- X)
i=1
_____________________________________________________________________________________
Marcia Olandoski Erbano
Depto. de Informática
CEFET-PR
98
ESTATÍSTICA
Notas de Aula
_____________________________________________________________________________________
DESVIO PADRÃO :
É também uma medida de dispersão dos dados de amostra, definida como
sendo a raiz quadrada positiva da variância.
5.5.7.1 Propriedades da Variância
• Somando-se uma constante qualquer a cada elemento de um conjunto de
medidas, a variância não se altera.
• Se cada medida de uma amostra for multiplicada por uma constante, a variância
fica multiplicada por esta constante ao quadrado.
EXEMPLO
Considere as mesmas medidas de duração de vida do exemplo anterior.
A variância é :
(141-143) 2 + (136 -143) 2 + (157 -143) 2 + (143 -143) 2 + (138 -143) 2
= 68,5
s =
5 - 1
O desvio padrão é :
2
s = ( variância )1/2 = ( 68,5 )1/2 = 8,28
5.5.8 AMPLITUDE
É a diferença entre o maior e o menor valor numa amostra de medidas.
5.5.9 COEFICIENTE DE VARIAÇÃO
É uma medida de dispersão que expressa o desvio padrão como um
percentual da média .
V =
s
100 %
X
_____________________________________________________________________________________
Marcia Olandoski Erbano
Depto. de Informática
CEFET-PR
ESTATÍSTICA
99
Notas de Aula
______________________________________________________________________________________
Como V é uma medida de variação relativa expressa em porcentagem, então
ela pode ser utilizada para comparar a variabilidade de dois ou mais conjuntos de
medidas mesmo que as observações sejam expressas em diferentes unidades.
EXEMPLO
Os pesos de 10 caixas de um certo tipo de cereal tem conteúdo médio de
278 g com um desvio padrão de 9,64 g. Se estas caixas são vendidas por um preço
médio de 1,29 u.m. com um desvio padrão de 0,09 u.m., podemos concluir que os
pesos são relativamente mais homogêneos do que os preços ?
Vpeso =
9, 64
100 % = 3,74 %
278
Vpreço =
0,09
100 % = 6,98 %
1,29
Concluímos, então, que os pesos são mais homogêneos do que os preços.
5.5.9.1 Algumas Observações Sobre a Interpretação da Média e do Desvio
Padrão de uma Amostra
• A média, que é uma medida de posição central, indica o centro da amostra. Note,
por exemplo, o diagrama de pontos ( gráfico 1 ) onde aparece a média
posicionando o centro da distribuição dos pontos.
• A variância pode ser vista como a média dos desvios que cada medida da
amostra tem em relação à média X , elevados ao quadrado. Lembre que os
desvios, se somados, se compensam e levam a soma a zero. Assim, elevados ao
quadrado, temos uma medida que caracteriza, basicamente, o afastamento dos
dados em relação ao centro da distribuição. Portanto, quanto maior for a
variância ( ou o desvio padrão ), maior será a variabilidade ou dispersão dos
dados. Uma variância pequena indica que os dados da amostra se apresentam de
forma concentrada em torno da média.
• Amostras de medidas em muitas situações práticas apresentam histogramas com
simetria bastante acentuada e em forma de sino. Poderíamos pensar na
distribuição Normal como sendo o modelo adequado a estas medidas. Neste caso,
vale as seguintes afirmações :
1. Em torno de 68 % das medidas caem no intervalo : ( X - s , X + s ).
2. Em torno de 95 % das medidas caem no intervalo : ( X - 2s , X + 2s ).
3. Em torno de 99,9 % das medidas caem no intervalo : ( X - 3s , X + 3s ).
4. Em torno de 50 % das medidas caem no intervalo : ( X - 2/3s , X + 2/3s ).
• Quanto maior o tamanho da amostra, mais o histograma se aproxima da
distribuição normal.
_____________________________________________________________________________________
Marcia Olandoski Erbano
Depto. de Informática
CEFET-PR
100
ESTATÍSTICA
Notas de Aula
_____________________________________________________________________________________
5.5.10 MÉDIA E VARIÂNCIA DE UMA AMOSTRA DE MEDIDAS
APROXIMADAS
Suponha que se tenha uma amostra de medidas X1 , X2 , . . ., Xn agrupadas
em uma distribuição de freqüências com k classes ( intervalos ), pontos médios de
classes m1 , m2 , . . ., mk e freqüências de classes f1 , f2 , . . ., fk .
Uma vez que temos f1 dos X’s sendo aproximados por m1 , f2 dos X’s
n
aproximados por m2 ,etc. , é evidente que a expressão ∑ X i é aproximada por :
i=1
n
∑f
j
mj .
i=1
Sendo assim, uma aproximação para X é dada por :
1 k
X = ∑ fj mj
n j=1
Para o cálculo da variancia, uma aproximação é dada por :
s2 =
1
n -1
n
∑f
j
(m j − X) 2
j=1
EXEMPLO
Considere os dados da Tabela 2.
_____________________________________________________________________________________
Marcia Olandoski Erbano
Depto. de Informática
CEFET-PR
ESTATÍSTICA
101
Notas de Aula
______________________________________________________________________________________
Pontos Médios de
Classe (mi)
Freqüências
(fi)
fi . mi
fi . mi m
1,33
5
6,65
8,8445
1,38
5
6,90
9,5220
1,43
8
11,44
16,3592
1,48
15
22,20
32,8560
1,53
13
19,89
30,4317
1,58
17
26,86
42,4388
1,63
12
19,56
31,8828
1,68
2
3,36
5,6448
1,73
2
3,46
5,9858
1,78
1
1,78
3,1684
80
122,10
187,134
122,10
= 1,52625
80
1 ⎛
1
⎞
⎜187,134 s =
122,102 ⎟ = 0,0098591
⎠
80 - 1 ⎝
80
X =
5.6 DISTRIBUIÇÕES AMOSTRAIS
Suponha que se tenha uma população conhecida representada pela v.a. X e
que θ seja um parâmetro de interesse nesta população. Imagine que se retire todas
as amostras possíveis de tamanho n desta população, segundo um plano amostral
previamente definido e que, para cada amostra se obtenha o valor de uma estatística
θ$ . Tem-se, assim, um conjunto de todos os possíveis valores de θ$ que dependem do
tamanho da amostra, do tamanho da população e do procedimento da amostragem e
que variam de uma amostra para outra. Desta forma, a estatística θ$ é uma variável
aleatória e tem uma distribuição de probabilidade. Esta distribuição é denominada
DISTRIBUIÇÃO AMOSTRAL DE θ$ .
Esquematicamente temos :
_____________________________________________________________________________________
Marcia Olandoski Erbano
Depto. de Informática
CEFET-PR
102
ESTATÍSTICA
Notas de Aula
_____________________________________________________________________________________
População
Amostra 1
θ$ 1
X
Amostra 2
θ$ 2
θ
θ
Amostra k
θ$ k
θ
Em resumo, a distribuição de probabilidade de uma estatística é chamada de
distribuição amostral. Por exemplo, a distribuição de probabilidade de X é chamada
de distribuição amostral da média, a distribuição de probabilidade de p$ é chamada
de distribuição amostral da proporção. O desvio padrão de uma distribuição
amostral é chamado de erro padrão da estatística.
EXEMPLO
Suponha que se retire amostras de uma população uniforme discreta
consistindo dos valores 0, 1, 2 e 3. As quatro observações que compõem a
população são valores de uma v.a. X que tem distribuição de probabilidade :
1
p(x) = P(X=x) =
, para x = 0, 1, 2, 3.
4
3
3
com média : µ = E(X) = ∑ x.p(x) =
2
x=0
3
5
e variancia : σ 2 = V(x) = E[(X - µ ) 2 ] = ∑ (x - µ ) 2 . p(x) =
4
x=0
O histograma de probabilidade desta v.a. é dado por :
p(x)
1/4
0
1
2
3
x
_____________________________________________________________________________________
Marcia Olandoski Erbano
Depto. de Informática
CEFET-PR
ESTATÍSTICA
103
Notas de Aula
______________________________________________________________________________________
Suponha agora que se retire todas as possíveis amostras de tamanho n = 2,
com reposição, e que para cada amostra se calcule a estatística X . As 16 amostras
possíveis e suas respectivas médias são :
Amostra
0,0
0,1
0,2
0,3
1,0
1,1
1,2
1,3
2,0
2,1
2,2
2,3
3,0
3,1
3,2
3,3
X
0
0,5
1
1,5
0,5
1
1,5
2
1
1,5
2
2,5
1,5
2
2,5
3
À partir daí, vemos que a v.a. X tem a seguinte distribuição de
probabilidade:
0
x
0,5
1,0
1
2
3
16
16
16
A média desta distribuição é :
p( x)
µ X = E(X) =
∑ x .p(x)
=
1,5
2,0
2,5
4
16
3
16
2
16
3,0
1
16
3
= µ
2
e a variancia é :
σX
2
σ2
5
= V(X) = ∑ (x − µ X ) . p( x) =
= .
8
n
2
_____________________________________________________________________________________
Marcia Olandoski Erbano
Depto. de Informática
CEFET-PR
104
ESTATÍSTICA
Notas de Aula
_____________________________________________________________________________________
p( x )
4/16
3/16
2/16
1/16
x
0
0 0,5
1,0 1,5 2,0 2,5 3,0
Note que o histograma de probabilidade da distribuição amostral de X
surege uma curva normal com uma média e uma variancia apropriadas.
5.6.1 Distribuição Amostral da Média
Se uma amostra aleatória de tamanho n é retirada de uma população infinita
com média µ e variancia σ2, então a distribuição amostral de X é aproximadamente
Normal com média µ X = µ e variancia σ 2X = σ2/n. Assim :
Z =
X−µ
σ/ n
tem distribuição Normal com média 0 e variancia 1. (Este é o chamado Teorema
Central do Limite)
Note que isto é o mesmo que dizer que, para n grande, a distribuição de X é :
⎛
σ2 ⎞
X : N⎜ µ ,
⎟.
n⎠
⎝
Observe que a distribuição de X está centrada em µ e que a variancia
depende do tamanho n da amostra. Quanto maior a amostra, mais concentrada é X
em torno de µ. Quanto à forma da distribuição, o Teorema afirma que no limite para
n tendendo ao infinito a distribuição amostral de X tende à distribuição Normal.
Essa convergência é mais rápida se a distribuição da v.a. X na população já for
próxima da Normal. Como regra prática, aceita-se que para amostras com mais de
30 elementos a aproximação já pode ser considerada muito boa.
2
σx2 = σn
µx= µ
X
_____________________________________________________________________________________
Marcia Olandoski Erbano
Depto. de Informática
CEFET-PR
ESTATÍSTICA
105
Notas de Aula
______________________________________________________________________________________
EXEMPLO 1 (Bussab)
_____________________________________________________________________________________
Marcia Olandoski Erbano
Depto. de Informática
CEFET-PR
106
ESTATÍSTICA
Notas de Aula
_____________________________________________________________________________________
EXEMPLO 2
Uma fábrica da material elétrico produz lâmpadas que tem duração de vida
com distribuição aproximadamente normal, com média igual a 800 horas e desvio
padrão de 40 horas. Encontre a probabilidade de que uma amostra aleatória de 16
lâmpadas tenha vida média X menor do que 775 horas.
Solução :
X : duração de vida da lâmpada
µ = 800 horas e σ = 40 horas.
X tem distribuição normal com média : µ X = 800 e desvio padrão :
σX =
σ
40
=
= 10.
n
16
Z=
X − µ 775 − 800
=
= −2, 5
10
σ/ n
P( X < 775) = P( Z < −2, 5) = 0, 00062
775
800
X
5.6.2 Distribuição Amostral da Proporção
Considere uma população em que a proporção de elementos que possuem
uma certa característica é p. Seja p$ a proporção de elementos com a referida
característica na amostra.
População
Amostra 1
p$ 1
Amostra 2
p
p$ 2
Amostra k
p
p
p$ k
_____________________________________________________________________________________
Marcia Olandoski Erbano
Depto. de Informática
CEFET-PR
ESTATÍSTICA
107
Notas de Aula
______________________________________________________________________________________
Para n suficientemente grande, podemos considerar que a distribuição
amostral de p$ é :
pq ⎞
⎛
⎟
p$ : N⎜ p ,
⎝
n⎠
onde q = 1- p.
Note que, então :
z =
p$ - p
p.q
n
EXEMPLO
Uma máquina está em operação sob controle quando a proporção de defeitos
apresentada é de 10 %. A cada dia uma amostra de 30 peças fabricadas por esta
máquina é retirada. Se esta máquina está sob controle, qual a probabilidade dessa
amostra apresentar proporção de defeitos maior do que 0,18 ?
0,1.0,9 ⎞
⎛
⎟
p$ = N⎜ 0,1 ;
⎝
30 ⎠
ou seja :
p$ : N(0,1 ; 0,003)
Para p$ = 0,18 :
0,18 - 0,1
p$ - p
=
= 1,46
z =
p.q
0,10
. ,9
n
30
P(p$ > 0,18) = P(z > 1,46) = 1 - 0,9278 = 0,0722
0,10
0,18
p
5.6.3 Distribuição Amostral da Diferença de Duas Médias
Admita-se que são dadas duas populações 1 e 2, com médias µ1 e µ2 e
variancias σ12 e σ22 , e que se retire, independentemente, amostras de tamanho n1 da
população 1 e amostras de tamanho n2 da população 2. De todas as possíveis
amostras retiradas pode-se obter a distribuição amostral da diferença de duas médias
X 1 - X 2. Se n1 e n2 forem suficientemente grandes :
_____________________________________________________________________________________
Marcia Olandoski Erbano
Depto. de Informática
CEFET-PR
108
ESTATÍSTICA
Notas de Aula
_____________________________________________________________________________________
⎛
σ2 σ2 ⎞
X1 − X 2 : N⎜ µ1 - µ2 , 1 + 2 ⎟
n1 n 2 ⎠
⎝
Z=
X1 − X 2 − (µ1 − µ2 )
σ12 σ22
+
n1 n 2
EXEMPLO
As lâmpadas elétricas do fabricante A tem duração média de 1400 horas,
com um desvio padrão de 200 horas, enquanto as do fabricante B tem duração
média de 1200 horas, com um desvio padrão de 100 horas. Se forem ensaiadas
amostras aleatórias de 125 lâmpadas de cada marca, qual será a probabilidade que
as lâmpadas da marca A tenham vida média maior do que as da marca B de pelo
menos 160 horas ?
X 1 = duração média da amostra A.
X 2 = duração média da amostra B.
⎛
σ2 σ2 ⎞
X1 − X 2 : N⎜ µ1 - µ2 , 1 + 2 ⎟ com :
n1 n 2 ⎠
⎝
µ1 - µ2 = 1400 - 1200 = 200
σ12 σ22
2002 1002
=
= 400
+
+
125
125
n1 n 2
(σ
X1 − X 2
)
= 20
Para X1 − X 2 = 160
Z =
X1 − X 2 − ( µ 1 − µ 2 )
σ12 σ 22
+
n1 n 2
=
160 − 200
= -2
20
160 180 200 220 240
X1 - X 2
P(a média da amostra da marca A ser maior do que a média da amostra da marca B de pelo
menos 160 horas) = P( X 1 > X 2 + 160 ) = P( X 1- X 2 > 160 ) = P(Z > -2) = 0,9772.
_____________________________________________________________________________________
Marcia Olandoski Erbano
Depto. de Informática
CEFET-PR
ESTATÍSTICA
109
Notas de Aula
______________________________________________________________________________________
5.6.4 Distribuição Amostral da Diferença da duas Proporções
Suponha que se retire amostras de tamanho n1 de uma população 1 cuja
proporção de elementos com uma certa característica seja p1 e que se retire amostras
de tamanho n2 de uma população 2 cuja proporção de elementos com a referida
característica seja p2. A distribuição amostral da diferença das duas proporções
p$ 1 − p$ 2 é dada por :
⎛
p .q
p .q ⎞
p$ 1 − p$ 2 : N ⎜ p1 - p 2 , 1 1 + 2 2 ⎟
n1
n2 ⎠
⎝
p$ − p$ 2 − ( p1 - p 2 )
z= 1
p1.q 1 p 2 .q 2
+
n1
n2
EXEMPLO
A e B jogam uma partida “cara e coroa” lançando cada um 50 vezes uma
moeda. O jogador A vencerá o jogo se conseguir 5 ou mais caras do que o jogador
B e, quando isso não ocorrer, B vencerá. Determinar a probabilidade de ganho do
jogador A e do jogador B.
p$ 1 = proporção de caras obtidas por A.
p$ 2 = proporção de caras obtidas por B.
Admitindo-se que as moedas sejam honestas com probabilidade de “cara”
igual a 0,5, temos :
⎛
p .q p .q ⎞
p$ 1 − p$ 2 : N ⎜ p1 - p 2 , 1 1 + 2 2 ⎟ onde :
n1
n2 ⎠
⎝
p1 - p 2 = 0,5 - 0,5 = 0
p1.q 1 p 2 .q 2
0,5 . 0,5 0,5 . 0,5
=
+
= 0,01
+
n1
n2
50
50
Para p$ 1 − p$ 2 = 0,1 (5 caras em 50 jogadas):
z=
p$ 1 − p$ 2 − ( p1 - p 2 ) 0,1 − 0
=
=1
0,1
p1 .q 1 p 2 .q 2
+
n1
n2
-0,3 -0,2 -0,1
0 0,1 0,2 0,3
p1 - p 2
P( A vencer ) = P( p$ 1 > p$ 2 + 0,1 ) = P( p$ 1 − p$ 2 > 0,1 ) = P( z >1 ) = 1- P( z ≤ 1 ) =
= 1 - 0,84134 = 0,15866.
P ( B vencer ) = 1 - P( A vencer ) = 0,84134.
_____________________________________________________________________________________
Marcia Olandoski Erbano
Depto. de Informática
CEFET-PR
Download

Introdução à Inferência Estatística