Aula 1. Introdução à Inferência
Estatística
Capítulo 10, Bussab&Morettin “Estatística Básica” 7ª Edição
População é o conjunto de
todos os elementos
ou resultados sob
investigação
Estatística
Amostra é qualquer
subconjunto da
população
Técnicas de amostragem
Amostra / dados
𝑥1 , 𝑥2, … , 𝑥𝑛
População
Características
Análise
descritiva
Conclusões
sobre as
características
da população
Inferência
estatística
Informações contidas
nos dados
População ↔ Amostra
Exemplo 10.1: Consideramos uma pesquisa para estudar os salários dos 500
funcionários da Companhia M&B. Seleciona-se uma amostra de 36 indivíduos, e
anotam-se os seus salários.
População = 500 salários correspondentes aos 500 funcionários
Amostra = 36 salários de funcionários selecionados
Esperamos que amostra reflita as caraterísticas principais da distribuição
populacional de salários da empresa =
Amostra representativa
População ↔ Amostra
Exemplo 10.3: Consideramos uma pesquisa para estudar a duração de vida útil
de um novo tipo de lâmpadas, pois acredita-se que a duração desse novo tipo é
maior. Então 100 lâmpadas do novo tipo são deixadas acesas até queimarem.
População = a vida útil de todas as lâmpadas fabricadas ou que
venham a ser fabricadas por essa empresa;
= a distribuição de vida útil de lâmpada fabricada por
empresa
Amostra = tempos de vida observada de 100 lâmpadas
selecionados
Esperamos que amostra reflita as caraterísticas principais da distribuição
populacional de vida útil de lâmpadas produzidas pela empresa =
Amostra representativa
Técnicas de amostragem
População
Características
A.A.S.
Amostra / dados
𝑥1 , 𝑥2, … , 𝑥𝑛
Amostragem
Aleatória
Simples
Aleatoriamente sorteia-se um elemento da população, sendo que todos os elementos
têm a mesma chance de ser escolhidos. Repete-se o procedimento até que sejam
sorteadas as n unidades da amostra.
AAS com/sem reposição. AAS com reposição implica a propriedade de independência
entre unidades selecionadas. Isso facilita o tratamento matemático
de propriedades de estimadores que vamos construir em cima de amostra.
Amostra / dados
𝑥1 , 𝑥2, … , 𝑥𝑛
Amostra aleatória simples
𝑋1, 𝑋2, … , 𝑋𝑛
Amostra Aleatória Simples de tamanho 𝑛 de uma variável aleatória
𝑋, com dada distribuição, é o conjunto de 𝑛 variáveis aleatórias
independentes 𝑋1, 𝑋2, … , 𝑋𝑛 cada uma com a mesma distribuição
de 𝑋.
Amostra / dados
𝑥1 , 𝑥2, … , 𝑥𝑛
População
Características
é v.a. 𝑋
Amostra aleatória simples
𝑋1, 𝑋2, … , 𝑋𝑛
Amostra Aleatória Simples de tamanho 𝑛 de uma variável aleatória
𝑋, com dada distribuição, é o conjunto de 𝑛 variáveis aleatórias
independentes 𝑋1, 𝑋2, … , 𝑋𝑛 cada uma com a mesma distribuição
de 𝑋.
Amostra / dados
𝑥1 , 𝑥2, … , 𝑥𝑛
População
Características
é v.a. 𝑋
Amostra aleatória simples
𝑋1, 𝑋2, … , 𝑋𝑛
Amostra Aleatória Simples de tamanho 𝑛 de uma variável aleatória
𝑋, com dada distribuição, é o conjunto de 𝑛 variáveis aleatórias
independentes 𝑋1 , 𝑋2 , … , 𝑋𝑛 cada uma com a mesma distribuição
de 𝑋.
Em caso de população 𝑋 contínua, com função de densidade 𝑓(𝑥), a densidade
conjunta da amostra (𝑋1 , 𝑋2 , … , 𝑋𝑛 ) será dada por 𝑓(𝑥1 , 𝑥2 , … , 𝑥𝑛 ) tal que
𝑓 𝑥1 , 𝑥2 , … , 𝑥𝑛 = 𝑓 𝑥1 𝑓(𝑥2 ) … 𝑓(𝑥𝑛 )
Estatística
Qualquer função de amostra (𝑋1, 𝑋2, … , 𝑋𝑛 ) chamaremos
estatística
1
𝑋=
𝑛
𝑛
𝑋𝑖
𝑖=1
𝑋(1) = min 𝑋1 , 𝑋2, … , 𝑋𝑛
1
𝑆2 =
𝑛−1
𝑛
𝑋𝑖 − 𝑋
𝑖=1
𝑊 = 𝑋(𝑛) − 𝑋(1)
𝑋(𝑛) = max 𝑋1 , 𝑋2, … , 𝑋𝑛
𝑋(𝑖) − 𝑖-gêsima maior observação da amostra
2
Amostra ↔amostra
amostra (𝑋1, 𝑋2, … , 𝑋𝑛 )
é vetor aleatório
amostra (𝑥1 , 𝑥2 , … , 𝑥𝑛 )
é vetor de números observados
1
1
𝑛
estatística 𝑋 =
𝑋
𝑛 𝑖=1 𝑖
é variável aleatória
1
estatística 𝑆 2 = 𝑛−1
é variável aleatória
𝑛
𝑖=1
𝑛
estatística 𝑥 =
𝑥
𝑛 𝑖=1 𝑖
é valor observado de 𝑋
𝑋𝑖 − 𝑋
2
1
estatística 𝑠 2 = 𝑛−1 𝑛𝑖=1 𝑥𝑖 − 𝑥
é valor observado de 𝑆 2
2
distribuição populacional
𝑋~𝑓(𝑥)
distribuição populacional
𝑋~𝑁(𝜇, 𝜎 2 )
distribuição amostral da
estatística
𝑇𝑛 = 𝑇𝑛 𝑋1, 𝑋2, … , 𝑋𝑛
𝑇𝑛 ~𝑔(𝑦)
distribuição amostral da
estatística
1
𝑋=
𝑛
𝑛
𝑋𝑖
𝑖=1
𝜎2
𝑋 ~𝑁 𝜇,
𝑛
Distribuição amostral da média
Teorema. Seja 𝑋 uma variável aleatória com média 𝜇 e variância
𝜎 2, e seja 𝑋1 , 𝑋2, … , 𝑋𝑛 uma amostra aleatória simples (AAS) de
variável 𝑋. Então
𝜎2
𝐸 𝑋 = 𝜇,
𝑉𝑎𝑟 𝑋 =
𝑛
1
𝐸 𝑋 =𝐸
𝑛
1
𝑉𝑎𝑟 𝑋 = 𝑉𝑎𝑟
𝑛
𝑛
𝑋𝑖
𝑖=1
𝑛
𝑋𝑖
𝑖=1
1
=
𝑛
1
=
𝑛
𝑛
𝑖=1
𝑛
𝑖=1
1
𝐸 𝑋𝑖 =
𝑛
𝑛
𝑖=1
1
𝑉𝑎𝑟 𝑋𝑖 =
𝑛
1
𝜇 = 𝑛𝜇 = 𝜇
𝑛
𝑛
1 2
𝜎 = 𝑛𝜎 = 𝜎 2
𝑛
2
𝑖=1
Distribuição amostral da média
𝑋−𝜇
𝑛(𝑋 − 𝜇) aprox
𝑍=
=
≈ 𝑁 0,1
𝜎
𝜎/ 𝑛
Distribuição amostral da média
Teorema. Seja 𝑋 uma variável aleatória normal com média 𝜇 e
variância 𝜎 2, 𝑋~𝑁(𝜇, 𝜎 2) , e seja 𝑋1, 𝑋2, … , 𝑋𝑛 uma amostra
aleatória simples (AAS) de variável 𝑋. Então
𝜎2
𝑋 ~𝑁 𝜇,
𝑛
𝑋−𝜇
𝑛(𝑋 − 𝜇)
𝑍=
=
~𝑁 0,1
𝜎
𝜎/ 𝑛
distribuição populacional
𝑋~𝑁(2,1)
distribuição amostral da
estatística 𝑛 = 5
1
𝑋 ~𝑁 2,
5
Exemplo 10.11
Uma máquina está regulada para encher pacotes de café automaticamente
segundo a distribuição normal com média de 500 gramas e desvio padrão de
10 gramas. Colhendo-se uma amostra de 𝑛 = 100 pacotes e pesando-os. Qual
é a probabilidade de encontramos a média 𝑥 defirindo de 500 g. de menos de
2 gramas.
𝑃 𝑋 − 500 < 2 = 𝑃 498 < 𝑋 < 502 =
= 𝑃 −2 < 𝑍 < 2 ≈ 0.95
Distribuição amostral de proporção
distribuição populacional
𝑋~𝐵 (𝑝)
𝐸 𝑋 =𝑝
𝑉𝑎𝑟 𝑋 = 𝑝(1 − 𝑝)
Distribuição amostral de proporção
distribuição amostra
𝑋1, 𝑋2, … , 𝑋𝑛
𝑋𝑖 ~𝐵 (𝑝)
𝐸 𝑋𝑖 = 𝑝
𝑉𝑎𝑟 𝑋𝑖 = 𝑝(1 − 𝑝)
𝑋−𝜇
𝑛(𝑋 − 𝜇)
𝑍=
=
≈ 𝑁 0,1
𝜎
𝜎/ 𝑛
𝑍=
𝑛(𝑝 − 𝑝)
𝑝(1 − 𝑝)
≈ 𝑁 0,1
Exemplo 10.12
Suponha que 30% dos estudantes de uma escola sejam mulheres. Colhemos uma
AAS de 𝑛 = 10 estudantes e calculamos 𝑝 proporção de mulheres na amostra.
Qual probabilidade de que 𝑝 difira de 𝑝 em menos de 0,01?
𝑝(1 − 𝑝)
𝐸 𝑝 = 𝑝, 𝑉𝑎𝑟 𝑝 =
𝑛
𝑝 1−𝑝
𝑝 ≈ 𝑁 𝑝,
= 𝑁(0.3, 0.021)
𝑛
𝑃 𝑝 − 𝑝 < 0.01 = 𝑃 −0.01 < 𝑝 − 𝑝 < 0.01 ≈
0.01
0.01
≈𝑃 −
<𝑍<
= 𝑃 −0.07 < 𝑍 < 0.07 = 0.056
0.021
0.021
Dimensionamento da amostra
p(1 p )
εz
,
n
segue que o tamanho amostral n, dados  e a
margem de erro , tem a forma
Da relação
2
z
n    p(1 p ),
ε
onde z é tal que  = P(-z  Z  z) e Z ~ N(0,1).
Entretanto, nesta expressão, n depende de p(1-p), que
é desconhecido.
 Como calcular o valor de n?
Gráfico da função p(1-p), para 0  p  1.
Pela figura observamos que:
• a função p(1-p) é uma parábola simétrica em torno de p = 0,5;
• o máximo de p(1-p) é 0,25, alcançado quando p = 0,5.
Assim, na prática, substituímos p(1-p) por seu valor máximo,
2
obtendo
z
n    0,25 ,
ε
que pode fornecer um valor de n maior do que o necessário.
Pergunta: É possível reduzir o tamanho da amostra
quando temos alguma informação a respeito de p?
Por exemplo, sabemos que:
• p não é superior a 0,30, ou
• p é pelo menos 0,80, ou
• p está entre 0,30 e 0,60.
Resposta: Depende do tipo de informação sobre p.
Em alguns casos, podemos substituir a informação
p(1-p), que aparece na expressão de n, por um valor
menor que 0,25.
Redução do tamanho da amostra
Vimos que, se nada sabemos sobre o valor de p, no cálculo
de n, substituímos p(1-p) por seu valor máximo, e
calculamos
2
z
n     0,25 .
ε
Se temos a informação de que p é no máximo
0,30 (p  0,30), então o valor máximo de p(1-p) será
dado por 0,3x0,7 = 0,21.
Logo, reduzimos o valor de n para
2
z
n     0,21 .
ε
Agora, se p é pelo menos 0,80 (p  0,80), então o
máximo valor de p(1-p) é 0,8x0,2 = 0,16, e temos
2
z
n     0,16 .
ε
Mas, se 0,30  p  0,60, o máximo valor de p(1-p) é
0,5x0,5=0,25 e, neste caso, não há redução, ou seja,
2
z
n     0,25.
ε
Exemplo 3:
No Exemplo 2, suponha que temos a informação de que
no máximo 30% dos alunos da USP foram ao teatro no
último mês.
Portanto, temos que p  0,30 e, como vimos, o
máximo de p(1-p) neste caso é 0,21.
Assim, precisamos amostrar
2
2
 1,96 
z
n    0,21  
 0,21  2017 estudantes ,
ε
 0,02 
conseguindo uma redução de 2401- 2017 = 384 estudantes.
Intervalo de confiança para p
Vimos que a estimativa intervalar para p tem a forma:
 pˆ  ε ;
pˆ  ε  ,
p( 1  p ) e z tal que  = P(-z  Z  z) na N(0,1).
com ε  z
n
Na prática, substituímos a proporção desconhecida p
pela proporção amostral p̂, obtendo o seguinte
intervalo de confiança com coeficiente de confiança  :

pˆ( 1  pˆ )
pˆ( 1  pˆ ) 
IC( p ; γ )   pˆ  z
; pˆ  z

n
n 

Download

Aula 1 - IME-USP