Aula 2. Estimação I.
Capítulo 11, Bussab&Morettin β€œEstatística Básica” 7ª Edição
distribuição populacional
𝑋~𝐡(𝑝)
Estimar a proporção 𝑝, 𝑝 ∈ (0,1) de pessoas
favoráveis (desfavoráveis 1 βˆ’ 𝑝, 𝑝 ∈ (0,1) ) a
politica de governo atual.
distribuição populacional
𝑋~𝑁(πœ‡, 𝜎 2 )
Estimar a vida média útil de novo tipo de
lâmpada πœ‡ , e estimar a variância 𝜎 2 , sabendo
que a distribuição é normal.
Estimação de parâmetros
Parâmetro = função qualquer da distribuição populacional
população
𝑋~𝐡(𝑝)
𝑝 = 𝐸(𝑋)
população
𝑋~𝑁(πœ‡, 𝜎 2 )
πœ‡=𝐸 𝑋
𝜎 2 = π‘‰π‘Žπ‘Ÿ(𝑋)
Estatística = função qualquer da amostra
população
𝑋~𝐡(𝑝)
amostra
𝑋1 , … , 𝑋𝑛 , 𝑋𝑖 ∈ {0,1}
estimador de 𝑝 é estatística
𝑝≑𝑋
população
𝑋~𝑁(πœ‡, 𝜎 2 )
amostra
𝑋1 , … , 𝑋𝑛 , 𝑋𝑖 ∈ ℝ
estimador de πœ‡ é estatística
πœ‡β‰‘π‘‹
estimador de 𝜎 2 é estatística
𝜎2 ≑ 𝑆2
Dois possíveis procedimentos de estimação:
β€’ Estimação pontual
β€’ Estimação intervalar
- Para estimação de proporção vamos observar 𝑛
elementos, extraídos ao acaso e com reposição da
população;
- Para cada elemento selecionado, verificamos a
presença (sucesso) ou não (fracasso) da característica
de interesse.
Exemplo: Sejam,
𝑝: proporção de alunos da USP que foram ao teatro pelo
menos uma vez no último mês, e
𝑋: número de estudantes que respondem β€œsim” em uma
pesquisa com n entrevistados.
Suponha que foram entrevistados 𝑛 = 500 estudantes e
que, desses, π‘˜ = 100 teriam afirmado que foram ao teatro
pelo menos uma vez no último mês.
A estimativa pontual (proporção amostral) para 𝑝 é dada por:
π‘˜ 100
𝑝= =
= 0.20
𝑛 500
ou seja, 20% dos estudantes entrevistados afirmaram que
foram ao teatro pelo menos uma vez no último mês.
Note que, outra amostra de mesmo tamanho pode levar a
uma outra estimativa pontual para 𝑝.
Estimativa intervalar ou
intervalo de confiança
β€’ Para uma amostra observada, os estimadores pontuais
fornecem como estimativa um único valor numérico para o
parâmetro.
β€’ Os estimadores pontuais são variáveis aleatórias e, portanto,
possuem uma distribuição de probabilidade, em geral,
denominada distribuição amostral.
Idéia: construir intervalos de confiança, que incorporem à
estimativa pontual informações a respeito de sua variabilidade
(erro amostral).
Intervalos de confiança são obtidos por meio da
distribuição amostral do estimador pontual.
A estimativa intervalar corresponde a um intervalo
determinado da seguinte maneira:
𝑝 βˆ’ πœ€; 𝑝 + πœ€
sendo πœ€ o erro amostral ou margem de erro.
Pergunta: Como encontrar πœ€ ?
Seja 𝑃(Ξ΅) a probabilidade da estimativa pontual estar a
uma distância de, no máximo, ο₯ da proporção verdadeira
𝑝, ou seja,
𝑃 πœ€ =𝑃 π‘βˆ’π‘ β‰€πœ€
A probabilidade 𝑃(ο₯) é também denominada coeficiente
de confiança do intervalo, que denotamos pela letra grega
𝛾 (gama).
Afirma-se ainda que a estimativa intervalar tem
coeficiente de confiança 𝛾 = 𝑃(ο₯).
Formalmente,
𝑃 πœ€ =𝑃 π‘βˆ’π‘ β‰€πœ€ =𝑃
𝑋
βˆ’π‘ β‰€πœ€
𝑛
𝑋
=𝑃 π‘βˆ’πœ€ ≀ ≀𝑝+πœ€
𝑛
= 𝑃 𝑛𝑝 βˆ’ π‘›πœ€ ≀ 𝑋 ≀ 𝑛𝑝 + π‘›πœ€
βˆ’π‘›πœ€
𝑋 βˆ’ 𝑛𝑝
=𝑃
≀
≀
𝑛𝑝(1 βˆ’ 𝑝)
𝑛𝑝(1 βˆ’ 𝑝)
π‘›πœ€
𝑛𝑝(1 βˆ’ 𝑝)
Como 𝑋 ~ 𝐡(𝑛, 𝑝) temos que, para 𝑛 grande, a variável
π‘‹βˆ’π‘›π‘
aleatória 𝑍 =
tem distribuição 𝑁(0,1).
𝑛𝑝(1βˆ’π‘)
Deste modo, para n grande,
𝑃 πœ€ ≅𝑃
βˆ’π‘›πœ€
𝑛𝑝 1 βˆ’ 𝑝
=𝑃
onde 𝑍~𝑁(0,1).
βˆ’ π‘›πœ€
𝑝 1βˆ’π‘
≀𝑍≀
≀𝑍≀
π‘›πœ€
𝑛𝑝 1 βˆ’ 𝑝
π‘›πœ€
𝑝 1βˆ’π‘
Denotando
π‘›πœ€
𝑝 1βˆ’π‘
= 𝑧 temos que
𝑃 πœ€ = 𝛾 = 𝑃 βˆ’π‘§ ≀ 𝑍 ≀ 𝑧
Assim, podemos obter 𝑧 conhecendo-se  (ou 𝑃(ο₯)).
Por exemplo, considere  = 0,80.
𝑧 é tal que 𝐴(𝑧) = 0,90.
Pela tabela, temos 𝑧 = 1,28.
Erro da estimativa intervalar
Da igualdade 𝑧 =
π‘›πœ€
𝑝 1βˆ’π‘
é imediato mostrar que o erro amostral ο₯ é dado por
𝑝(1 βˆ’ 𝑝)
πœ€=𝑧
𝑛
onde 𝑧 é tal que  = 𝑃(βˆ’π‘§ ο‚£ 𝑍 ο‚£ 𝑧), com 𝑍 ~ 𝑁(0,1).
Intervalo de confiança para 𝑝
Vimos que a estimativa intervalar para 𝑝 tem a forma:
𝑝 βˆ’ πœ€; 𝑝 + πœ€
com πœ€ = 𝑧
𝑝(1βˆ’π‘)
𝑛
e 𝑧 tal que 𝛾 = 𝑃 βˆ’π‘§ ≀ 𝑍 ≀ 𝑧 na 𝑁(0,1)
Na prática, substituímos a proporção desconhecida 𝑝 pela
proporção amostral 𝑝 , obtendo o seguinte intervalo de
confiança com coeficiente de confiança  :
𝑝 1βˆ’π‘
𝑝 1βˆ’π‘
𝐼𝐢 𝑝; 𝛾 = 𝑝 βˆ’ 𝑧
;𝑝 + 𝑧
𝑛
𝑛
No exemplo temos 𝑛 = 500 e 𝑝 = 0,20.
Construir um intervalo de confiança para 𝑝 com coeficiente de
confiança  = 0,95.
Como  = 0,95 fornece 𝑧 = 1,96,
o intervalo é dado por:
𝑝 1βˆ’π‘
𝑝 1βˆ’π‘
π‘βˆ’π‘§
;𝑝 +𝑧
𝑛
𝑛
0,20 × 0,80
0,20 × 0,80
= 0,20 βˆ’ 1,96
; 0,20 + 1,96
500
500
= 0,20 βˆ’ 0,035; 0,20 + 0,035 = 0,165; 0,235
Nesse intervalo ( = 0,95), a estimativa pontual para 𝑝 é 0,20, com
um erro amostral ο₯ igual a 0,035.
Interpretação do IC com  = 95%:
Se sortearmos 100 amostras de tamanho n = 500 e
construirmos os respectivos 100 intervalos de confiança, com
coeficiente de confiança de 95%, esperamos que,
aproximadamente, 95 destes intervalos contenham o
verdadeiro valor de p.
Comentários:
Da expressão πœ€ = 𝑧
𝑝(1βˆ’π‘)
𝑛
é possível concluir que:
β€’ para  fixado, o erro diminui com o aumento de 𝑛.
β€’ para 𝑛 fixado, o erro aumenta com o aumento de .
Ainda no exemplo da USP, temos k = 100 e n = 500. Qual é a
probabilidade da estimativa pontual estar a uma distância de,
no máximo, 0,03 da proporção verdadeira?
Dados do problema: 𝑛 = 500, 𝑝 = 0,20 e πœ€ = 0,03
β‡’ 𝑃 πœ€ = 𝛾 =?
Como a proporção verdadeira 𝑝 é desconhecida, utilizamos
a estimativa pontual 𝑝 para calcular 𝑧 e, assim, obter
 (ou 𝑃(ο₯)).
Cálculo de z:
zο€½
Ξ΅ n
0,03 500

ο€½ 1,68 .
p( 1 ο€­ p)
0,2 ο‚΄ 0,8
Logo, obtemos
P( Ξ΅ )  2 ο‚΄ A( z ) ο€­ 1
ο€½ 2 ο‚΄ A(1,68) ο€­ 1
ο€½ 2 ο‚΄ 0,953 ο€­ 1
ο€½ 0,906 (90,6%).
Exemplo 6: Suponha que estamos interessados em
estimar a proporção p de pacientes com menos de 40
anos diagnosticados com câncer nos pulmões que
sobrevivem pelo menos 5 anos.
Em uma amostra aleatoriamente selecionada de 52
pacientes, somente 6 sobreviveram mais de 5 anos.
6
- Estimativa por ponto para p: pˆ 
ο€½ 0,115(proporção amostral)
52
- Intervalo de confiança aproximado de 95% para p:
0,115(1 ο€­ 0,115)
0,115(1 ο€­ 0,115)
(0,115 ο€­ 1,96
; 0,115  1,96
)
52
52
ο€½ (0,028, 0,202)
Comentário:
Embora esse intervalo tenha sido construído usando a
aproximação normal para a distribuição binomial,
poderíamos ter gerado um intervalo de confiança exato
para p usando a própria distribuição binomial.
Um intervalo exato é particularmente útil para pequenas
amostras, em que o uso da aproximação normal não
pode ser justificada.
Download

Aula 2 - IME-USP