Pós
GRADUAÇÃO
MÉTODOS QUANTITATIVOS
submódulo 2 - ESTATÍSTICA
Gestão inovadora da empresa gráfica
Programa
Aula 1 – 26 de agosto – recordação de probabilidade e
estatística básica – conceitos gerais de amostragem
Aula 2 – 2 de setembro – amostragem aleatória simples (AAS) e
amostragem estratificada (AE)
Aula 3 – 16 de setembro – Estimadores do tipo razão e do tipo
regressão
Aula 4 – interpretação da norma NBR5426 – planos de
amostragem e procedimentos na inspeção por atributos
Aula 5 – exercícios práticos com aplicação da NBR5426 na
empresa gráfica
CURSO SUPERIOR DE TECNOLOGIA GRÁFICA – PÓS GRADUAÇÃO – GESTÃO INOVADORA DA EMPRESA GRÁFICA
SENAI - SP
Exercícios de probabilidade
1. Jogando-se três dados, calcular a
probabilidade de que a soma dos pontos
obtidos seja superior a 14.
Solução
• Número de resultados do espaço amostral S:
n = 6 3 = 216
• Cada um dos 216 resultados de S tem a
mesma probabilidade 1/216.
• Resultados favoráveis ao evento E (m):
m=20
• P(E) = m/n = 20/216=0,0926
Exercícios de probabilidade
2. Seja um baralho comum de 52 cartas.
Qual é a probabilidade de uma carta ser de
ouros ou de copas?
Solução
• E = sair carta de ouros
• F = sair carta de copas
• P(E υ F) = P(E) + P(F) = ¼ + ¼ =1/2
Exercícios de probabilidade
3. Seja um baralho comum de 52 cartas.
Qual é a probabilidade da primeira carta ser
de ouros e a segunda ser de copas, com
reposição?
Solução
• E = sair primeira carta de ouros
• F = sair segunda carta de copas
• P(E ∩ F) = P(E) × P(F) = ¼ × ¼ =1/16
Exercícios de probabilidade
4. Seja um baralho comum de 52 cartas.
Qual é a probabilidade da primeira carta ser
de ouros e a segunda ser de copas, sem
reposição?
Solução
• E = sair primeira carta de ouros
• F = sair segunda carta de copas
• P(E ∩ F) = P(E) × P(F│E) = ¼ × 13/51
=13/204
Exercícios de probabilidade
5. Seja um baralho comum de 52 cartas.
Qual é a probabilidade da primeira carta ser
de ouros ou a segunda ser de copas, com
reposição?
Solução
• E = sair primeira carta de ouros
• F = sair segunda carta de copas
• P(E υ F) = P(E) + P(F) – P(E ∩ F) = 7/16
• Solução alternativa pelo evento complementar
P(E υ F) = 1 – P(~E ∩ ~F) = 1 – 9/16
Exercícios de probabilidade
6. Seja uma urna com 7 bolas com as letras
A A A C C R R.
Extraindo-se as bolas uma por uma, calcular a
probabilidade de obter a palavra CARCARÁ.
Solução
• Evento desejado: F, intersecção dos 7
eventos:
• E1 = primeira bola com C
• E2 = segunda bola com A
• E3 = terceira bola com R
• E4 = quarta bola com C
• E5 = quinta bola com A
• E6 = sexta bola com R
• E7 = sétima bola com A
P(F) = P(E1) × P(E2|E1) × P(E3|E1E2) ×... =
= 2/7 × 3/6 × 2/5 × ¼ × 2/3 × ½ × 1 = 1/210
Exercícios de probabilidade
7. Seja uma urna com 3 bolas brancas e 4 bolas
pretas. Extrái-se simultaneamente 3 bolas. Calcular
a probabilidade de
a) pelo menos duas sejam brancas.
E = saírem 3 bolas brancas
F = saírem 2 bolas brancas e uma preta.
P(EUF) = P(E) + P(F)
P(E) = 3/7 . 2/6 . 1/5 = 1/35
P(F) = 3 (1 – 1/7 . 2/6 . 4/5) = 12/35
P(EUF) = 1/35 + 12/35 = 13/35
Exercícios de probabilidade
7. Seja uma urna com 3 bolas brancas e 4 bolas
pretas. Extrái-se simultaneamente 3 bolas. Calcular
a probabilidade de
b) pelo menos uma seja preta.
G = pelo menos uma ser preta.
~G = nenhuma ser preta = saírem 3 bolas brancas = E
P(G) = 1 - P(~G) = 1 – 1/35 = 34/35
Exercícios de probabilidade
8. Seja um baralho de 32 cartas de 7 a Ás. Qual
é a probabilidade de tirar no poquer uma
quadra de mão?
Exercícios de probabilidade
9. Seja um baralho de 32 cartas de 7 a Ás. Qual
é a probabilidade de tirar no poquer um flush
(todas do mesmo naipe) de mão?
Exercícios de probabilidade
10. Seja um baralho de 32 cartas de 7 a Ás.
Qual é a probabilidade de tirar no poquer um
par de mão?
Aula 2 - AMOSTRAGEM
• Noções Básicas
– Procedimentos amostrais
– Objetivo: obter informações sobre o todo,
baseando-se no resultado de uma amostra
– Perigo: viés de interpretação do resultado
– Adequações e inadequações de alguns protocolos
de obtenção de amostras
– Inferência estatística: obter resultados para o
todo, baseando-se em resultados da amostra
Vocabulário Técnico
• Ver apêndice A (Bolfarine)
• Amostra – subconjunto de uma população
• Amostragem por quotas – processo de
amostragem em que a seleção das unidades
amostrais é feita em campo, até o número
especificado em projeto para ser coletado em
cada estrato.
• Característica de interesse (variável) –
propriedade dos elementos da população que
se pretende conhecer.
Vocabulário Técnico
– Censo – resultado do levantamento estatístico
que visa a conhecer a totalidade das
características individuais de uma população.
– População ou universo – conjunto de elementos,
cujas propriedades e investigam por meio de
subconjuntos que lhes pertencem.
– Viés ou vício (de um estimador de um parâmetro)
– é a diferença entre o seu valor esperado e o
valor do parâmetro.
– Sistema de referência – lista ou descrição das
unidades amostrais da população, por meio da
qual é possível selecionar a amostra.
Tópicos para um levantamento amostral
– Apêndice B
– Identificação dos objetivos e populações
– Coleta das informações
– Planejamento e seleção da amostra
– Processo de coleta dos dados (em campo)
– Processamento dos dados
– Análise dos resultados (modelos estatísticos)
– Apresentação dos resultados
– Disponibilização dos dados
O que é uma boa amostra?
1. É aquela que permite a generalização de
seus resultados dentro dos limites aceitáveis
de dúvidas.
2. É aquela que possui um custo mínimo de
planejamento e execução e ainda atenda ao
objetivo no. 1
O tamanho da amostra e o erro do estimador
O erro padrão do estimador decresce à medida que
aumenta o tamanho da amostra.
Exemplo: seja um levantamento amostral cujo
objetivo é prever qual dentre os dois únicos
possíveis partidos terá maior porcentagem de
votos válidos. Um dos partidos obteve 56% dos
votos.
Caso tenha sido usada uma amostra de 100
eleitores: intervalo de 95% de confiança
indicaria um número entre 46% e 66%
(inconclusivo).
O tamanho da amostra e o erro do estimador
Um dos partidos obteve 56% dos votos.
Caso tenha sido usada uma amostra de 400
eleitores: intervalo de 95% de confiança
indicaria um número entre 51% e 61%
(conclusivo e suficiente).
Caso tenha sido usada uma amostra de 1600
eleitores: intervalo de 95% de confiança
indicaria um número entre 53,5% e 58,5%
(conclusivo e exagerado).
Viés e desvio padrão
Seja uma população ou universo: o conjunto
u = {1,2,...,N} de todas as unidades elementares de
interesse. N é o tamanho fixo da população, às
vezes desconhecido.
Elemento populacional é qualquer elemento
i pertencente a
Yi
u, do qual se deseja conhecer
Parâmetro populacional
• É o vetor de todos os valores de uma variável
de interesse que se denota por
D = ( Y1,...,YN)
Função paramétrica populacional
• É uma característica numérica qualquer da
população, que condensa funcionalmente os
Yi.
Tal função será denotada por
θ(D)
Exemplo 2.1 (pag. 38)
Variável
Unidade
Notação
1
2
3
i
Ada
Beto
Ema
Ai
Sexo
0
1
0
Xi
Idade
20
30
40
Yi
Fumante
0
1
1
Gi
Renda bruta familiar
12
30
18
Fi
No. de trabalhadores
1
3
2
Ti
Nome do chefe
Funções paramétricas populacionais
• Idade média
θ(Y) = (20+30+40)/3 = 30
• Renda média do trabalhador
θ(D) = (12+30+18)/(1+3+2) = 10
Funções paramétricas populacionais mais usadas
• Média populacional
θ(Y) = μ = (Y1+ Y2+...+YN)/N
• Variância populacional
θ(Y) = σ2 = Σ(Yi – μ)2/N
• Desvio padrão
σ
Exercício
• Determinar a média e o
desvio padrão das
idades dos habitantes
de um determinado
bairro. Os valores estão
apresentados à direita:
45 54 23 35 46 67 37
19 66 43 22 76 44 19
33 41 60 81 47 39 47
56 20 29 31 40 19 22
24 33 80 76 34 67 70
39 79 21 32 33 55 50
29 40 38 44 22 78 22
Amostras
• Uma seqüência qualquer de n unidade de
denominada uma amostra ordenada de
u.
• Exemplo:
u = {1,2,3}
s1 = (1,2)
s2 = (2,1)
ué
s3 = (1,1,3)
Planejamento amostral
• Se cada amostra tem associada a si uma probabilidade de
ser sorteada e a soma de todas as probabilidades for igual
a 1, então tem-se um planejamento amostral ordenado.
• Exemplo:
u = {1,2,3}
Plano A: P(11) = P(12) = P(13) = 1/9
P(21) = P(22) = P(23) = 1/9
P(31) = P(32) = P(33) = 1/9
P(s) = 0, para as demais s pertencentes ao
conjunto de todas as amostras possíveis S.
Planejamento amostral
• Plano B: P(12) = P(13) = P(21) = P(23) =
P(31) = P(32) = 1/6
P(s) = 0, para as demais s pertencentes ao conjunto
de todas as amostras possíveis S.
• Diferença entre o plano A e o plano B:
• Plano A: com reposição
• Plano B: sem reposição
Planejamento amostral
• Plano C:
P(2) = 1/3
P(12) = P(32) = 1/9
P(112) = P(132) = P(332) = P(312) = 1/27
P(111) = P(113) = P(131) = P(311) = 1/27
P(133) = P(313) = P(331) = P(333) = 1/27
P(s) = 0, para as demais s pertencentes ao conjunto
de todas as amostras possíveis S.
Descrição textual do Plano C
• Plano C:
“Sorteie uma unidade após a outra, repondo a
unidade sorteada antes de sortear a seguinte,
até o surgimento da unidade 2 (i=2) ou até
que 3 unidades tenham sido sorteadas”.
Planos equiprobabilísticos
• São os planos em que todas as amostras têm
a mesma probabilidade de ser escolhida.
Amostragem Aleatória Simples (AAS)
• Seleciona-se seqüencialmente cada unidade
amostral com igual probabilidade, de tal forma que
cada amostra tenha a mesma chance de ser
escolhida. A seleção pode ser feita com ou sem
reposição.
Estimadores
• O objetivo principal da amostragem é produzir
estimadores para parâmetros populacionais
desconhecidos.
• Quando se associa uma estatística com a expressão
que irá estimar o parâmetro populacional, ele recebe
o nome de estimador. O valor numérico do
estimador, para cada amostra, chama-se estimativa.
Viés ou vício do estimador
• BA[θe] = EA[θe – θ]
• B de bias (viés em inglês)
Variância de uma estatística H
• Var A[H] = Σ {h(ds) – EA[H]}2 PA(s) para
todas as amostras do plano A.
Distribuição binomial
Seja p a probabilidade de um evento acontecer em
uma tentativa única (probabilidade de sucesso)
q = 1 – p é a probabilidade insucesso
A probabilidade do evento ocorrer X vezes, em N
tentativas, é
p(X) = NCXpXqN-X = N!/[X!(N-X)!] pXqN-X
Exemplo: Qual é a probabilidade de obter exatamente
2 caras em 6 lances de uma moeda não-viciada?
Distribuição binomial
Esta distribuição discreta de probabilidade é
denominada distribuição binomial, visto que a
X= 0, 1, 2, ..., N correspondem os termos
sucessivos da fórmula binomial ou do
desenvolvimento binomial
(p+q)n = qN + NC1qN-1p1 + NC2qN-2p2 +...+pN
em que 1, NC1, NC2,... são os coeficientes
binomiais
Propriedades da distribuição binomial
Média
μ=Np
Variância
σ2 = N p q
Desvio padrão
σ = raiz (N p q)
Distribuição de Poisson
X
λ
-λ
e /X!
p(X) =
em que e = 2,71828...
e λ é uma constante dada
Média:
μ=λ
Variância: σ2 = λ
Relação entre as distribuições
binomial e de Poisson
Se N for grande e p for pequeno, o
evento é raro. Na prática:
N≥50 e Np<5, então o evento é raro.
Neste caso, a distribuição binomial é
muito aproximada da de Poisson,
com λ= Np
Exercício
Dez por cento das revistas produzidas por um
certo processo revelaram-se defeituosos.
Determinar a probabilidade de em uma
amostra de 10 ferramentas escolhidas ao
acaso, exatamente duas serem defeituosas,
mediante o emprego:
a) da distribuição binomial
b) da aproximação de Poisson para essa
distribuição
Exercício - resolução
Probabilidade de uma revista ser defeituosa:
p = 0,1
a) Pr{2 revistas defeituosas em 10} =
2q8 = 10!/(2!8!) (0,1)2 (0,9)8
C
p
10 2
= 0,1937
b) λ = Np = 10 (0,1) = 1
Pr{2 revistas defeituosas em 10} = λ2e- λ/2!
= 0,1839
Distribuição normal (ou de Gauss)
1
1 / 2 ( X   )2 /  2
Y
e
 2
na qual μ é a média, σé o desvio padrão,
π=3,14159..., e= 2,712828...
Distribuição normal (ou de Gauss)
Usando a unidade reduzida z = (X – μ)/σ:
1 1 / 2 z 2
Y
e
2
Distribuição normal (ou de Gauss)
68,27%
95,45% (-2 a +2)
99,73%
Relação entre as distribuições
binomial e normal
Se N for grande e nem p nem q forem
próximos de zero, a distribuição
binomial é muito aproximada da de
uma normal. Quanto maior o N,
melhor será a aproximação.
Exercício
Determinar a probabilidade de, em 120 lances
de uma moeda honesta, ocorrerem caras:
a) entre 40 e 60%;
b) em 5/8 ou mais desses lances.
Solução
a) caras entre 40% e 60%
40% de 120 = 48
60% de 120 = 72
probabilidade do evento cara p = ½
probabilidade do evento coroa q = 1 –p = ½
Número de caras é uma variável discreta
Em uma distribuição normal, verifica-se a
probabibilidade do número de caras estar
situado entre 47,5 e 72,5
Solução (cont.)
a) μ = número esperado de caras = Np = 60
σ2 = 120 (1/2) (1/2) = 30
σ = 5,48
47,5 em unidades reduzidas=(47,5-60)/5,48
z1 = -2,28
72,5 em unidades reduzidas=(72,5-60)/5,48
z2 = +2,28
Probabilidade = área (sob a curva normal
entre z1= -2,28 e z2=+2,28) = 0,9774
Solução (cont.)
b) 5/8 ou mais dos lances serem caras
número de caras > 120 x 5/8 = 75 caras
número de caras entre 74,5 e 120
74,5 em unidades reduzidas:
z1 = (74,5 – 60)/5,48 = 2,65
120 em unidades reduzidas:
z2 = (120 – 60)/5,48 = 10,95
Prob = 0,50 – 0,4960 = 0,004
Exercício
Cada pessoa de um grupo de 500, lança uma
moeda honesta 120 vezes. Quantas
pessoas seria de esperar que relatassem ter
obtido caras:
a) entre 40 e 60% dos seus lances;
b) em 5/8 ou mais desses lances.
Resposta a) 489 pessoas
b) 2 pessoas.
Exercício
Verificou-se que 2% das revistas produzidas por
uma certa impressora são defeituosas. Qual é
a probabilidade de, em uma remessa de 400
dessas revistas, revelarem-se defeituosas: (a)
3% ou mais; (b) 2% ou menos?
Solução
a) 3% ou mais
(3% de 400) = 12 revistas defeituosas.
Baseado na continuidade, 12 ou mais revistas
significam 11,5 ou mais.
X = (2% de 400) = 8
σ2 = N p q = (400) x (0,02) x (0,98) = 7,84
σ = 2,8
11,5 em unidades reduzidas: z = (11,5 – 8)/2,8
z = 1,25
Prob = 0,5 – 0,3944 = 0,1056 = 10,56%
Solução (cont.)
b) 2% ou menos
(2% de 400) = 8 revistas
8 revistas ou menos significa 8,5 ou menos
8,5 em unidades reduzidas:
z = (8,5 – 8)/2,8 = 0,18
Prob = (0,5 + 0,0714) = 0,5714 = 57,14%
Exercício
Uma pesquisa amostral foi conduzida com o objetivo de se estudar
o índice de ausência ao trabalho em um determinado tipo de
indústria. Uma AAS sem reposição de mil operários de um total de
36 mil é observada com relação ao número de faltas não
justificadas em um período de 6 meses. Os resultados obtidos
foram:
Faltas
0
1
2
3
4
5
6
7
8
Operários
451 162 187 112 49
21
5
11
2
Qual é a estimativa de μ dada por essa amostra?
Qual é o erro aceitável dentro de um intervalo de confiança de 95%?
Distribuição amostral das médias
Todas as amostras possíveis de tamanho N são
retiradas, sem reposição, de uma população finita
de tamanho Np > N. Se a media e o desvio padrão
da distribuição amostral das médias foram
designados por  X
e X
e os valores correspondentes da população o
forem por μ e σ, então:
X  
X 

N
Np  N
N p 1
( 451  0  162  1  ...  2  8)

 1,296
1000

2
(Y   )


X 
i
n 1

N
Np  N
N p 1
2
 2,397

2,397 36000 1000
 0,048
36000 1
1000
Para ter 95% de certeza: intervalo entre μ -1,96σX e μ+1,96σX
isto é, (1,20;1,39)
Exercício
Em uma população de 60 milhões de eleitores, foi feita
uma pesquisa com 2500 eleitores de acordo com um
plano de amostragem aleátoria simples, sem reposição.
Um determinado candidato obteve 51% dos votos.
Qual é a estimativa de número total de votos desse
candidato na população total, a partir da estatística
amostral?
Qual é o erro aceitável dentro de um intervalo de confiança
de 95%?
Distribuição amostral das proporções
P  p  0,51
N P  60000000
N  2500
  pq
  0,51 0,49  0,4999
P 

N
NP  N
0,499 60000000 2500

 0,00998
NP 1
60000000 1
2500
P  1,96 P  0,51  1,96  0,00998 0,53
P  1,96 P  0,51  1,96  0,00998 0,49
:
N  25000

(0,504;0,516)
Exercício
Em uma tiragem de 3000 livros, foi analisada uma
amostra de 100 livros de acordo com um plano de
amostragem aleátoria simples, sem reposição.
Foram encontrados um certo número de livros
defeituosos.
Qual é a estimativa de número total de livros
defeituosos na tiragem?
Qual é o erro aceitável dentro de um intervalo de
confiança de 95%?
Intervalos de confiança
%
n, em nσ
68,27
1
95
1,96
95,45
2
99
2,58
99,73
3
NBR 5426
Planos de amostragem e procedimentos
na inspeção por atributos