MOTIVAÇÃO
A Estatística e Deming.
W. E. DEMING
Nasceu em 14 de Outubro de 1900 em
Sioux City, Iowa. Em 1921 licenciou-se
em Física, na Universidade do Wyoming
e, em 1928, doutorou-se em Matemática
pela Yale University.
1
O impacto das suas idéias foi de tal forma elevado que
Deming é, hoje, considerado “o pai do milagre industrial
japonês”. Morreu em 1993, com 93 anos.
Em sua homenagem, a JUSE (Japan Union of Scientists
and Engineers) instituiu o Deming Prize, que premia
anualmente as melhores empresas no campo da qualidade.
Deming foi condecorado pelo imperador do Japão com o
mais elevado galardão atribuído a um estrangeiro: a
Medalha de 2.ª Ordem do Sagrado Tesouro.
Os Estados Unidos só o descobriram na década de 80. Em
1986, Reagan atribuiu-lhe a National Medal of Technology
e nesse ano foi lançado o livro Out of Crisis, a obra que
consolidou de vez a sua fama como o grande mestre da
2
qualidade.
W.E.W.
DEMING
E. DEMING
3
4
5
ENGENHARIA: CEP, DOE, CONFIABILIDADE
6
Allysson Paulinelli Ministro da Agric. 1974 linelli
Coloca Eliseu Alves, na presidência da EMBRAPA
Cria 14 Centros de Pesquisas em 14 regiões do país
(exceto o café que tinha o IBC e o cacau que tinha a
CEPLAC)
Criou 4 Centros de Recursos Genéticos para o
cerrado em Brasília.
Com uma verba de US 200 milhões, escolheu nas
melhores universidades brasileiras 1600 recémformados e mandou-os fazer Mestrado e Doutorado
nas melhores escolas agrícolas do mundo: California,
Wisconsin, California, Wisconsin, França, Espanha,
Índia, Japão, etc.
7
8
1. ANÁLISE COMBINATÓRIA
As várias maneiras de se dispor os objetos de um conjunto
em grupos denominados agrupamentos dependem
basicamente de duas características:
1ª.) em cada agrupamento formado todos os elementos são
distintos;
2ª.) em cada agrupamento pode haver repetição de
elementos.
9
Quando os agrupamentos têm a primeira característica
(todos os elementos são distintos) são chamados de
agrupamentos simples.
E, quando os agrupamentos têm a segunda característica
(repetição de elementos) denominam-se agrupamentos
com repetição.
Considerando o modo de formação dos grupos tem-se:
Arranjos, Permutações e Combinações
10
Análise Combinatória Simples é o estudo da formação,
contagem e propriedades dos agrupamentos simples.
Nos agrupamento simples os grupos diferem pela ordem
ou pela natureza dos elementos que o compõem.
E, no caso de diferirem pela natureza, tem-se que pelo
menos um dos elementos de um dos grupos formados não
pertence ao outro.
11
FATORIAL de um número inteiro n representado por n! é
definido por:
n! = n(n-1)(n-2)(n-3)........(n-n+2)(n-n+1)
n! = n(n-1)(n-2)(n-3)........3.2.1
Especialmente, tem-se, por definição:
0! = 1
1! = 1
ARRANJOS de n elementos tomados p a p
n!
= n(n-1).(n-2)......(n-p+2)(n-p+1)
A =
(n  p)!
n
p
12
Permutação de n elementos é a denominação dada aos
arranjos com n = p, ou seja, são os elementos de A com p =
n. Fica fácil ver que Pn = A nn = n(n-1)(n-2) ... (n-n+1) = n!
Combinação simples de n elementos tomados p a p é
representada por
n
 
p
= Cn,p =
A np
p!
n!
=
p!(n  p)!
Números Binomiais ou Combinatórios
Os números conhecidos como binomiais são aqueles da
n!
forma
p!(n  p)!
e são representados por:
n
 
p
13
Exercícios:
1) Calcule o valor numérico de cada uma das expressões:
a) 5! + 2! = 5.4.3.2.1 + 2.1 = 120 + 2 = 122
3!2!1!
b)
=
0!
3.2.1  2.1  1
=
1
6  2 1
7
1
5) Calcule o valor de x na equação (x+2)! = 2(x+1)!
Solução:
(x+2)(x+1)x(x-1)(x-2)……1 = 2[(x+1)x(x-1)(x-2)...1]
(x+2) = 2  x = 0
14
8) Calcule o número de arranjos de 4 elementos tomados
de 2 em 2.
n!
4!
n
Solução: A p =
=
= 12
(n  p)!
(4  2)!
11) Calcule o valor da expressão A50  A55  A00
Solução:
5!
5!
0!
+
+
= 1+ 120+ 1 = 122
(5  0)!
(5  5)!
(0  0)!
2) Qual o número de permutações simples com objetos
repetidos que se pode obter com as letras da palavra
matemática?
 , ,....,
n
P
n!
= !!......!
15
Matemática tem: 2 letras m, 3 letras a, 2 letras t, 1 letra e,
1 letra i e 1 letra c. Logo, n = 10 letras.
 , , ... 
n
P
10!

2!3!2!1!1!1!
2 , 3, 2 ,1,1,1
10
P
10.9.8.7.6.5

 151200
1
16
4) Em certo ano, somente quatro times de futebol têm
chances de ficar em dos três primeiros lugares do
campeonato brasileiro. São eles Santos, Corinthians,
Coritiba e Flamengo. Quantas são as possibilidades para
cada um dos três primeiros lugares? R: 24
Solução:
Deve-se agrupar 4 elementos de 3 em 3. Como os
agrupamentos são distintos pela ordem e pelos elementos
tem-se Arranjo.
4
A3
=
4!
24

 24
(4  3)! 1
17
7) Quantas diagonais tem o pentágono?
Solução:
É necessário agrupar os 5 vértices do pentágono de 2
em 2. Trocando a ordem o agrupamento é o mesmo,
portanto tem-se combinação de 5 elementos tomados
de 2 em 2, mas deve-se descontar os 5 lados.
n!
Cn,p =
p!(n  p)!
5!
-5=
- 5 = 10 – 5 = 5
2!(5  2)!
18
9) Considere n objetos. Agrupando-os 4 a 4 de modo que
cada grupo possua pelo menos um objeto diferente do
outro obtém-se o mesmo número de grupos que o obtido
quando se junta os objetos de 6 em 6. Qual o valor de n?
Solução:
n!
Cn,p =
p!(n  p)!
Cn,4 =
n!
4!(n  4)!
Cn,6 =
n!
n!(n  6)!
Sabe-se que números binomiais com mesmo numerador
(n) e módulos complementares (p) são iguais.
19
Então,
 n   n  são complementares
  e  
 4  6
portanto 4 = p e 6 = n – p
6=n - 4
n = 10
20
2. PROBABILIDADE E MODELOS DE
PROBABILIDADE
Considere o experimento de jogar um dado equilibrado e
observar o número da face superior. Observa-se no
experimento que:
a)Os “resultados possíveis” de ocorrer formam o conjunto
 = {1, 2, 3, 4, 5, 6}.
DEF. 1 ESPAÇO AMOSTRAL, , de um experimento
realizado sob condições fixas, é o conjunto de todos os
resultados possíveis do experimento, entendendo-se por
resultado possível todo resultado elementar e indivisível do
experimento.
21
2.1.1) Considere, o experimento que consiste na escolha,
ao acaso, de um ponto equidistante dos extremos do
segmento de reta AB com comprimento de 2 cm,
contido no eixo das abscissas de um Sistema
Cartesiano e com A colocado na origem do sistema.
y
m
A
1
1
B
x
22
a) Descreva o espaço amostral do experimento;
 = {(x,y)  R2 | x = 1}
b) Descreva o resultado 1 “distância entre o ponto
escolhido e o ponto médio do segmento é  2” na
forma de subconjunto do espaço amostral;
1 = { (x,y)   | y  2}
c) Descreva o resultado 2 “distância entre o ponto
escolhido e a origem é  ½”;
2 = { } = 
d) Descreva o resultado 3 “a 1a. coordenada do ponto
escolhido tem comprimento menor que a 2ª. ”.
{ (x,y)   | x  |y|}
23
DEF. 2 RESULTADO COMPOSTO é todo resultado
formado por mais de um resultado elementar e indivisível.
Ex.: O resultado “número par” NP = {2, 4, 6} não é
elementar e indivisível, pois é composto por três resultados
deste tipo {2}, {4} e {6}, logo “número par” é um
resultado composto.
O resultado “número par” é o subconjunto NP = {2, 4, 6}
 . Assim, todo resultado do experimento é subconjunto
do espaço amostral.
24
DEF. 3 -ÁLGEBRA, A, de subconjuntos do conjunto nãovazio  é a classe de subconjuntos de  satisfazendo as
propriedades:
1a.)   A
2a.) Se A  A  Ac  A

3a.) Se A1, A2, A3, .....  A   A i A
i 1
A -ÁLGEBRA mais simples é o conjunto das partes de ,
ou seja, P() = {, {1}, ... , {6}, {1,2}, ... , {5,6},...., }
no experimento do lançamento do dado, p.ex.
DEF. 4 Seja  o espaço amostral do experimento. Todo
subconjunto A   será chamado de evento, o conjunto 
é evento certo, o subconjunto  é o evento impossível e se
 o evento {} é dito elementar e indivisível.
25
DEF. 5 DEFINIÇÃO CLÁSSICA DE PROBABILIDADE
(quando  é finito).
Seja A um subconjunto do espaço amostral , AP(),
então se todos os resultados elementares de  são
equiprováveis a medida da probabilidade de ocorrência do
evento A é dada por
P(A) = # A , A  A.
#
26
2.1.2) Um dado é lançado. Pergunta-se a probabilidade
dos eventos:
a) A = sair um número ímpar.
 = {1, 2, 3, 4, 5, 6}
A = {1, 3, 5}
P(A) = # A
#
= 3
6
b) B = sair um número menor que 3.
B = {1, 2}
P(B) =
#B
#
=
2
6
= 1/3
27
c) C = sair um número maior que 10.
C={ }
#C
P(C) =
#
0
= 0
6
d)  = sair um número inteiro maior ou igual a 1 e menor
ou igual a 6.
 = {1, 2, 3, 4, 5, 6}
#
P() = # 
6
= 6 1
28
2.2.5) Durante um período de 24 h, em algum momento X,
uma chave é posta na posição “ligada”. Depois em
algum momento futuro Y (dentro do período de 24h) a
chave é virada para a posição “desligada”. Suponha que
X e Y sejam medidas em horas, no eixo dos tempos, com
o início do período na origem da escala. O resultado do
experimento é constituído pelo par de números (X, Y).
29
a) Descreva o espaço amostral.
 = {(x,y)  R2 | 0 < x < y < 24}
b) Descreva e marque no plano XY os seguintes eventos:
(i) O circuito está ligado por uma hora ou menos.
A = {(x,y)   | y – x < 1}
y< x + 1
y > x+1
y=x
30
(ii) O circuito está ligado no tempo Z, onde Z é algum
instante no período de 24 h.
B = {(x,y)   | 0 < x < z < y < 24}
y>x
31
(iii) O circuito é ligado antes do tempo t1 e desligado
depois do tempo t2 (onde t1< t2 são dois instantes
durante o período especificado de 24 h).
C = {(x,y)   | x < t1 < t2 < y < 24}
(iv) O circuito permanece ligado duas vezes mais tempo do
que desligado.
y – x = 2(x+24-y)
y – x = 2x+48-2y
3y = 3x + 48
y = x + 16
0
x
y
24
32
D = {(x,y)   | y = x + 16}
33
DEF. 7 DEF. GEOMÉTRICA DE PROBABILIDADE
(Gnedenko)
Suponha que um segmento seja parte de um outro maior L
e que se tenha escolhido ao acaso um ponto de L.
Se admitirmos que a probabilidade deste ponto pertencer a 
seja proporcional ao comprimento de  e não depende do
lugar que ocupa em L, então a probabilidade de que o ponto
selecionado esteja em  é:
comp.
P ( ) 
compL

L
34
Exercício
Suponha que a área de um estado seja de
aproximadamente 200.000 km2. e que a área de uma
região metropolitana seja de 2.500 km2. Então, sabendose que um raio caiu no estado, qual a probabilidade de ter
caído nessa região metropolitana?
P(R) =
área da RM
área do estado
=
2500
200000
= 0,0125 = 1,25%
35
DEF. 9 DEF. AXIOMÁTICA DE PROBABILIDADE
(Kolmogorov)
Probabilidade ou medida de probabilidade na -álgebra A
é a função P definida em A e que satisfaz os axiomas
seguintes:
A1) P(A)  0
A2) P() = 1
A3) Se A e BA e são disjuntos P(A  B) = P(A) + P(B)
Se A1, A2, A3, ... , An A e são disjuntos, então
n
P (U Ai ) 
i 1
n
 P( A )
i
i 1
A3’) Se A1, A2, A3, ...


i 1
i 1
P( U A i )   P(A i )
A e são disjuntos, então
36
DEF.10 ESPAÇO DE PROBABILIDADE
É o trio (, A, P), onde , A e P são definidas anteriormente.
Propriedades da Probabilidade
Além das propriedades enunciadas na definição axiomática, a função P
goza, ainda, das seguintes:
P1) Se A é um evento aleatório, então a probabilidade de A não ocorrer
é dada por: P(Ac) = 1 – P(A)
P2) Se A é um evento aleatório, então 0  P(A)  1
P3) Se A1  A2 P(A1)  P(A2) e P(A2 - A1) = P(A2) - P(A1)
P4) P(A1A2) = P(A1) + P(A2) - P(A1A2)
n
n
P5)
P(U Ai )   P ( Ai )
i 1

P6)
i 1

P(U Ai )   P ( Ai )
i 1
i 1
37
n
P7)
P ( A1  A2  An )  P (U Ai )   (1) r 1 Sr  S1  S2  S3  (1) r 1 Sn
i 1
n
P8)
P9)
n
n
r 1
P(  AI )  1   P( AiC )
i 1
i 1


i 1
i 1
P (  Ai )  1   P ( AiC )
P10) Continuidade em Probabilidade: “Seja a seqüência {Ai}
i = 1,2,3, ... onde Ai  A i, então:
a) se Ai  A  P(Ai)  P(A) e
b) se Ai  A  P(Ai)  P(A).
38
Exercício 1: Prove a propriedade P1.
Prova de: P(Ac) = 1 – P(A)
Seja o espaço amostral 

A
Ac
Considere a união de subconjuntos disjuntos AAc = 
P(AAc) = P()
P(A) + P(Ac) = 1 pelos axiomas A2 e A3
P(Ac) = 1 – P(A)
39
Exercício 2: Prove a propriedade P2.
Prova de: 0 < P(A) < 1
Do axioma A1  P(A) > 0
E da propriedade P1  P(A) = 1 – P(Ac)
para o menor valor de P(Ac) que é zero (axioma 1) tem-se
o maior valor de P(A) que é 1. Portanto,
0 < P(A) < 1
40
Exercício 3: Prove a propriedade P3 .
Prova de: Se A1 A2  P(A1) < P(A2) e P(A2 – A1) = P(A2) – P(A1)
Seja a união de eventos disjuntos:
A2 = A1(A2A1
c)

A1
A2
P(A2) = P[A1(A2A1c)]
P(A2) = P(A1) + P(A2A1c) axioma A3
P(A1) = P(A2) – P(A2A1c)  P(A1) < P(A2)
E, P(A2 A1c) = P(A2 – A1)
P(A2 A1c) = P(A2) – P(A1)
Então, P(A2 – A1) = P(A2 A1c) = P(A2) – P(A1)
41
Exercício 4: Prove a propriedade P4 .
Prova: P(A1A2) = P(A1) + P(A2) – P(A1A2)

A2
A1
A1 A2
Seja a união de eventos disjuntos A1A2 = A1 (A2 – A1 A2)
Então, P(A1A2) = P[A1 (A2 – A1 A2)]
P(A1A2) = P(A1) + P[A2 – A1 A2)]
P(A1A2) = P(A1) + P(A2) – P(A1 A2) por P3
42
2.2.6) Sejam A, B, C três eventos associados a um
experimento. Exprima em notação de conjunto as
seguintes afirmações verbais:
• Veja que  significa “ou” e associamos a adição (+).
• E,  significa “e” e associamos a multiplicação (x).
a) Ao menos um dos eventos ocorre;
ABC
b) Exatamente um dos eventos ocorre;
(ABc Cc)  (AcBCc)  (AcBc C)
c) Exatamente dois dos eventos ocorrem;
(AB Cc) (ABc C) (AcBC)
d) Não mais de dois eventos ocorrem simultaneamente.
(AB C)c
43
Probabilidade Condicional
DEF. Seja o espaço de probabilidade (, A, P) e os
eventos A, B  A com P(B) > 0, a probabilidade
condicional do evento A dado o evento B é definida por:
P(AB) =
P(A  B)
P( B)
OBS:
1ª.) Se P(B) = 0, P(AB) pode ser arbitrariamente definida.
A maioria dos livros faz P(AB) = 0, mas é conveniente
pela independência se fazer P(AB) = P(A).
2ª.) Como P(AB) é uma probabilidade, vale para ela todas
as propriedades de probabilidade.
44
P(A  B)
3ª.) Como P(AB) =
P( B)
Então, a probabilidade da ocorrência simultânea de A e B
é dada por: P(A  B)  P(A).P(B | A)  P(B).P(A | B)
Teorema da Multiplicação ou da Prob. Composta
“Seja o espaço de probabilidade (, A, P), então:
I. P(A  B)  P( A).P(B | A)
A,B A
II. P( A1  A2  ... An ) 
= P(A1 ).P(A2 | A1 ).P(A3 | A1  A2 )...P(An | A1  A2  ...An1 )
A1, A2, A3, ....., AnA”.
45
Prova:
n = 2 P(A1A2) = P(A1)P(A2|A1) por definição
n = 3 P(A1 A2 A3) = P[(A1 A2) A3]
= P(A1 A2).P(A3|A1 A2) = P(A1)P(A2|A1)P(A3|A1 A2)
por indução, aceita-se a regra para n – 1
P(A1 ... An-1)=P(A1).P(A2|A1)...P(An-1|A1 A2 ... An-2)
E prova-se para n assumindo o resultado de n -1
P(A1 ... An)=P[(A1 ...An-1) An)
= P(A1 ... An-1)P(An|A1 ... An-1)
usando o resultado para n-1
= P(A1)P(A2|A1)...P(An-1|A1 ...An-2)P(An |A1 ... An-1) 46
Independência de eventos
DEF.: Seja o espaço de probabilidade (, A, P). Os eventos
aleatórios A e BA são estocasticamente independentes se:
P(A  B)  P(A). P( B), ou seja, P(B|A) = P(B) e P(A|B)=P(A).
Eventos Mutuamente Exclusivos
DEF.: Os eventos A e B, com A, B  A são mutuamente
exclusivos (disjuntos) se P(A  B)  0, ou seja, A  B .
47
Propriedades de Eventos Independentes
1a.) O evento aleatório AA é independente de si mesmo
se e somente se P(A) = 0 ou P(A) = 1.
2a.) Se A e B são eventos aleatórios independentes
pertencentes a A, então A e Bc, Ac e B, Ac e Bc
também são independentes.
3a.) Se A e B são eventos aleatórios mutuamente
exclusivos pertencentes a A, então A e B são
independentes somente se P(A) = 0 ou P(B) = 0.
48
Teorema da Probabilidade Total e Teorema de Bayes
PARTIÇÃO DO ESPAÇO AMOSTRAL 

A1
A3
.......
A2
 Sejam A1, A2, A3, ... eventos aleatórios mutuamente exclusivos
e exaustivos, isto é, os Ai são disjuntos e Ai = . Então, os
eventos Ai formam uma PARTIÇÃO DO ESPAÇO amostral .
49
É importante observar DUAS COISAS, admitindo-se que a
seqüência A1, A2, A3, ... seja FINITA ou INFINITA
ENUMERÁVEL:
1ª.) Ai e Aic formam uma PARTIÇÃO
Ai  A.
2ª.)  evento B  A tem-se B  U ( Ai  B) pois os Ai
i
são disjuntos e, então, os B  Ai também são disjuntos e
logo
P(B) = P[  (Ai  B)]
i
P(B)   P(A i  B)   P(A i )  P(B | A i )
i
i
50
Seja o evento B  , então a probabilidade do evento B ocorrer é
dada por: P(B)  i P(Ai )  P(B | Ai ) que é o Teorema da Probabilidade
Total
A4
A1
A3

A2
A5
B
51
Com base no Teorema da Probabilidade Total é possível
calcular a probabilidade do evento Aj dada a ocorrência
do evento B, pela fórmula conhecida como,
Teorema de Bayes
P( A j  B ) P( A j )  P ( B | A j ) P( A j )  P( B | A j )
P( A j | B ) 


P( B )
P( B )
 P ( A i )  P( B | A i )
i
52
2.3.1) Dez fichas numeradas de 1 a 10 são misturadas em
uma urna. Duas fichas, numeradas (x, y), são extraídas
da urna sucessivamente e sem reposição. Qual é a
probabilidade de x + y =10?
 = {(1,2), (1,3), ...... ,(9,10)} #
10
=  2 
A = {(1,9), (2,8), (3,7), (4,6), (9,1), (8,2), (7,3), (6,4)}
#A = 8
#A
8
8
P(A) = #   10  10x9/2 8 / 45
 
2
53
2.3.2) Um lote é formado de 10 artigos bons, 4 com
defeitos menores e 2 com defeitos graves. Um artigo é
escolhido ao acaso. Ache a probabilidade de que:
a) Ele não tenha defeitos;
P(B) =
# B 10
 5/8
#  16
b) Ele não tenha defeitos graves;
P(DGc)
=
1
# DG
2
1
1  1   7 / 8
#
16
8
54
c) Ele, ou seja perfeito ou tenha defeitos graves;
P(B DG) = P(B) + P(DG) – P(BDG)
10
2
12
P(B DG) =
+
-0=
= ¾ (mutuamente exclusivos)
16
16
16
d) Resolva os itens b e c aplicando a definição de
probabilidade.
(b)
P(DGc)
=
# DGC 10  4

7 /8
#
16
(c) P(B DG) =
# (B  DG) 10  2

6 /8 3/ 4
#
16
55
2.3.3) Se do lote de artigos do problema anterior, dois
artigos forem escolhidos (sem reposição), ache a
probabilidade de que:
a) Ambos sejam perfeitos;
10 9
x  3/8
P(B1  B2) = P(B1)P(B2|B1) =
16 15
b) Ambos tenham defeitos graves;
2 1
P(DG1 DG2) = P(DG1)P(DG2|DG1) = 16 x 15  1 / 120
c) Ao menos 1 seja perfeito;
P[(B1  B2c )  (B1c  B2)  (B1 B2) =
= P[(B1  B2c )+P(B1c  B2) + P(B1  B2)
= P(B1)P(B2c|B1) + P(B1c)P(B2| B1c) + P(B1)P(B2|B1)
56
=
10 6 6 10 10 9
.  .  .
= 7/8
16 15 16 15 16 15
d) No máximo 1 seja perfeito;
P[(B1c  B2c)  (B1  B2c)  (B1c  B2)] =
= P(B1c  B2c) + P(B1  B2c) + P(B1c  B2) =
= P(B1c)P(B2c|B1c) + P(B1)P(B2c|B1) + P(B1c)P(B2|B1c) =
6 5 10 6 6 10
= 16 . 15  16 . 15  16 . 15  5 / 8
57
2.5.2) A probabilidade de que um aluno saiba a resposta
para certa questão, de um exame de múltipla escolha é p.
Das opções de resposta para cada questão, somente uma
é correta. Se o aluno não sabe a resposta para a questão,
ele seleciona ao acaso uma resposta dentre as m opções.
Se a probabilidade do aluno responder corretamente
dado que ele sabe a resposta é 0,88 pergunta-se:
a) Se o aluno responder corretamente a questão, qual a
probabilidade de que ele “chutou” a resposta?
P(chutou|RC) =
P(chutou RC)
P(RC)
=
P(chutou)P(RC | chutou)
P(RC)
58
P(chutou|RC) =
(1  p).1 / m

P(RC)
(1  p).1 / m
0,88p  (1  p) / m
(RC) = (AS  RC)  (ASc  RC)
P(RC) = P[(AS  RC)  (ASc  RC)]
P(RC) = P(AS)P(RC|AS)+P(ASc)P(RC|ASc]
P(RC) = p.0,88 + (1-p) 1
m
59
b) Se o aluno responder incorretamente a questão, qual a
probabilidade de que ele não “chutou” a resposta?
P(não chutou|RI) = P(nãochutou RI) = P(nãochutou)P(RI | nãochutou)
P(RI)
P(RI)
RI = (ASRI)(ASc  RI)
P(RI) = P[(AS RI) + (ASc  RI)]
P(RI) = P(AS)P(RI|AS)+P(ASc)P(RI|ASc]
m 1
P(RI) = p.(1-0,88) + (1-p) m
P(não chutou|RI) =
p(1  0,88)
m 1
0,12p  (1  p)
m
=
0,12p
m 1
0,12p  (1  p)
m
60
2.5.4) Durante o mês de novembro a probabilidade de
chuva é 0,3. O meu time ganha um jogo em dia de chuva
com probabilidade 0,4 e em dia sem chuva com
probabilidade 0,6. Se ganhou o jogo em novembro, qual a
probabilidade de que tenha chovido no dia?
A1
B
A2
A1: chove no dia e A2: não chove
B : meu time ganha o jogo
P(A1  B)
P(A1  B)

P(B)
 P(A i )P(B | A i )
P(A1|B) =
i
P(A1|B) =
P ( A1 ) P ( B | A1 )
 P(A i )P(B | A i )
0,3.0,4
= 0,3.0,4  0,7.0,6  0,222
i
61
P(A1|B) =
0,3.0,4
0,12

 0,222
0,3.0,4  0,7.0,6 0,12  0,42
62
3. VARIÁVEL ALEATÓRIA
DEF. Uma variável X em um espaço de probabilidade
(,A,P) é uma função real definida no espaço , tal que
o evento [X  x] é evento aleatório x  R isto é, a
função X:  R é v. a. se o evento [ X  x ]  A,  x 
R.
EXEMPLO
Seja uma família com duas crianças.
a) Escreva todas as situações possíveis de ocorrer quanto ao sexo das
crianças;
R:  = {(F1, F2), (F1, M2), (M1, F2), (M1, M2)}
63
b) Associe a cada situação possível um número real considerando a
função que conta o número de meninos do evento;

1=(F1,F2)
X() = x
2=(F1,M2)
2=(M1,F2)
2=(M1,M2)
O
1
2
R
64
c) O campo de variação da variável aleatória X, ou contradomínio, é
o conjunto {0, 1, 2}.
DEF. VARIÁVEL ALEATÓRIA DISCRETA
A v.a. X é chamada de DISCRETA quando o seu
contradomínio é um conjunto finito ou infinito
enumerável, ou melhor, se existe um conjunto finito ou
infinito enumerável {x1, x2, x3, ... }  R tal que
X()  {x1, x2, x3, ... }   .
DEF. VARIÁVEL ALEATÓRIA CONTÍNUA
A v.a. X é chamada de CONTÍNUA quando o seu
contradomínio é um conjunto infinito não enumerável.
65
DEF. FUNÇÃO DISTRIBUIÇÃO F(x): A função
distribuição ou função distribuição acumulada da v.a. X
é definida por F(x) = P(X  x).
DEF. A f.p. da v.a. X, discreta, representada por P(X=xi) =
p(xi) é uma função tal que para X()  {x1, x2, x3, ...}

  A P(X = xi) = p(xi)  0
e
 p(x )  1
i
i 1
DEF. A f.d.p. da v.a. X, contínua, representada por fX(x) é
uma função tal que fX(x)  0 e

 f (x)dx  1
.

66
DETERMINAÇÃO da DISTRIBUIÇÃO de
PROBABILIDADE da v.a. X
A distribuição de probabilidades de uma v.a. X fica
determinada por qualquer das seguintes funções. Usa-se,
geralmente, a mais apropriada.
A função distribuição, f.d., F(X);
A função de probabilidade, f.p., P(X = x) = p(x);
A função densidade de probabilidade, f.d.p., fx(x);
A função característica X(x) = E(eitx).
67
DISTRIBUIÇÕES DE PROBABILIDADES
Distribuição de Bernoulli (v.a. discreta)
Uma v.a. X tem uma distribuição de Bernoulli com
parâmetro  quando assume apenas os valores 1 e 0 com
probabilidade  e (1 - ), respectivamente, (1 em geral
representa sucesso).
EXEMPLOS
1) Face de uma moeda: cara ou coroa.
2) Sexo de uma criança: masculino ou feminino.
3) Qualidade de uma peça: perfeita ou defeituosa.
68
A f.p. da v.a. Bernoulli é dada por:
P(X = x) = x(1 - )1-x
x = 0, 1
0<<1
Os parâmetros de uma variável Bernoulli são:
•Média  = E(X) = 
•Variância 2 = V(X) = (1-)
e o desvio padrão  = V(X)
=
(1  )
69
Distribuição Bernoulli
0.6
Prob. Sucesso
0,4
P(X=x)
0.5
0.4
0.3
0.2
0.1
0
0
0.2
0.4
0.6
0.8
1
x
70
EXERCÍCIO
3.2.1.1) Qual a esperança e a variância da v.a. X ~ b(1, 1/4)?
Solução:
= E(X) =  xP ( X  x ) = 1.P(X=1)+0.P(X=0) = P(X=1) = 
x
 = E(X) = ¼
2 = V(X) =  ( x  ) 2 P(X  x ) =
x
= (0- )2.P(X=0)+(1- )2.P(X=1) =
= 2(1- )+(1- )2  = (1- )[+(1- )]
2 = V(X) = (1- )[+(1- )] = (1- ) = (1/4)(3/4) = 3/16
71
Distribuição Binomial (v.a. discreta)
Uma v.a. Y tem distribuição binomial com parâmetros n e
 quando assume valores no conjunto {0, 1, 2, 3, ... , n} e
a sua f.p. é dada pela expressão:
n y
P( y)  PY (Y  y)    (1  ) n  y
 y
y = 0, 1, ... , n
A esperança e a variância de Y são:
 = E(Y) = n
e
2 = V(Y) = n(1- )
A v.a. Binomial corresponde ao número de sucessos em n
provas tipo Bernoulli independentes.
72
Exemplos de v.a. Binomial:
1) Número de peças defeituosas em um lote com n = 20
peças;
y = 0, 1, 2, ..... , 20
n = 20
2) Número de meninas em uma família com n = 5
crianças.
y = 0, 1, 2, .... , 5
n=5
73
Distribuição
Distribuição
Binomial
Binomial
(f.p.)
Prob. Sucesso n
P(Y=1)=0,4
n=
0,4; n=10
0.3
P(Y = y)
0.25
0.2
0.15
0.1
0.05
0
0
2
4
6
8
10
x
y
74
3.2.1.3) De um lote que contém vinte e cinco peças das
quais cinco são defeituosas, são escolhidas quatro ao
acaso. Seja X o número de defeituosas encontradas na
amostra tomada do lote. Escreva a distribuição de
probabilidade de X, quando as peças forem escolhidas
com reposição.
P(D) = 5/25 = 1/5 =  n = 4 – Binomial b(4, 1/5)
n y
ny


PY ( y)  PY (Y  y)    (1  )
 y
 4
P(Y  y)   (1 / 5) y (4 / 5) 4 y
 y
75
3.2.1.3) De um lote que contém vinte e cinco peças das
quais cinco são defeituosas, são escolhidas quatro ao
acaso. Seja X o número de defeituosas encontradas na
amostra tomada do lote. Escreva a distribuição de
probabilidade de X, quando as peças forem escolhidas
sem reposição.
 5  20 
 

y 4  y
P(Y = y) =card. def .   
Hipergeométrica
card.
 25
 
4
D
1
D

D3

D
4

D
5 
B
1 
B
2 
....
B
20

2



25
76
Distribuição Hipergeométrica
P(X = x)
0.4
Prob. evento
0.2,10,100
0.3
0.2
0.1
0
0
2
4
6
8
10
x
77
Exercício
a) Calcule a esperança matemática de Y no
experimento do exercício 3.2.1.3 – primeira parte.
 = E(Y) = n = 4x(1/5) = 4/5
b) Calcule o desvio padrão de Y no experimento do
3.2.1.3 – primeira parte.
  n(1  ) = 4(1/ 5)(4 / 5)  4 / 5
78
Distribuição de Poisson
Uma v.a. X tem distribuição de Poisson quando a sua f.p. é
da forma:
x 

e
P(X = x) =
x = 0,1,2,3,... e  > 0
x!
A esperança e a variância de X são dadas por:
 = E(X) = 
e
2 = V(X) = 
Exemplos:
1) Número de erros tipográficos em uma única página de
um livro é P(); no exercício 3.2.1.9  = 1.
2) Número erros de solda em uma placa de circuito
impresso é P().
79
Distribuição de Poisson
Média
10
0.15
P(X = x)
0.12
0.09
0.06
0.03
0
0
5
10
15
20
25
30
x
80
Distribuição Normal (Gaussiana) – v.a. contínua
Uma v.a. X tem distribuição Normal ou Gaussiana quando
a sua f.d.p. tem a forma:

1
f(x) =
e
 2
( x  ) 2
x  ,    e   +
22
Distribuição Normal ou Gaussiana
0.4
Mean,Std. dev.
20,1
f(x)
0.3
0.2
0.1
0
15
17
19
21
23
25
x
81
A fig. anterior mostra o gráfico da f.d.p. f(x) de uma
N(20, 1), ou seja, Gaussiana com média  = 20 e desvio
padrão  = 1.
A fig. adiante mostra o gráfico da f.d.p. f(x) de uma
Normal Padrão, ou seja, N(0, 1).
Distribuição Normal Padrão
0.4
Mean,Std. dev.
0,1
f(z)
0.3
0.2
0.1
0
-5
-3
-1
1
3
5
z
82
Como é difícil trabalhar-se com todos os membros da
família Normal, prefere-se trabalhar com a Normal
Reduzida ou Normal Padrão. Esta v.a. é representada por Z
e tem a seguinte f.d.p.:
f(z) =
1
e
2
P(X < x) = P(
z2

2
X 
<

z
x 

) = P(Z < z)
83
Na distribuição Normal a probabilidade da v.a. X assumir
um valor entre a e b (a < b) é dado por:
b
 f ( x)dx
P(a  X  b) =
a
A distribuição da v.a. Z tem média e variância iguais a,
respectivamente,  = 0 e 2 = 1 e essa v.a. é obtida da
transformação de X em Z = (X - )/, onde X ~ N(, 2).
a 

P(a<X<b) = P(
<
X 

<
b

) = P(a< Z < b)
b
P(a< Z < b) =  f (z)dz  F(b)  F(a )
a
84
VERIFICAÇÃO DA NORMALIDADE DE UMA
AMOSTRA (dados)
A Gaussianidade de dados, ou seja, o teste da hipótese de
que as observações seguem uma distribuição Gaussiana,
N(, 2), pode ser feito por meio dos métodos:
Kolmogorov-Smirnov; Shapiro-Wilks; Qui-quadrado;
e outros.
O método de Kolmogorov-Smirnov é geral, usado para a
Normal e para as outras distribuições. Já o método de
Shapiro-Wilks é especifico para a distribuição Normal. O
teste Qui-quadrado é aplicável, somente, quando a mostra
tem um tamanho grande. Na prática estes métodos são
aplicáveis com uso de programa estatístico (MINITAB,
STATGRAPHICS, R, SPSS, etc.
85
Exemplo 1
Verifique usando os métodos de Kolmogorov-Smirnov e
Shapiro-Wilks se a amostra aleatória segue a distribuição
Gaussiana. Os dados estão em gramas e correspondem ao
peso de determinado produto observado n = 20 vezes.
49,6890 50,4332 49,1072 49,7983 49,9152 50,2821
50,0048 49,8834 49,7633 49,8403 49,9567 50,8553
49,5055 49,4060 50,3345 50,4099 49,3756 49,9681
49,2399 50,2500
MTB> STAT, BASIC STATISTICS, NORMALITY TEST
(entre com peso, o teste K-S e depois o de R-J).
86
Teste de Gaussianidade - KS - do peso
Normal
99
Mean
StDev
N
KS
P-Value
95
Percentagem
90
49.90
0.4442
20
0.108
>0.150
80
70
60
50
40
30
20
10
5
1
49.0
49.5
50.0
peso
50.5
51.0
87
O gráfico de probabilidade normal é apresentado adiante e
mostra que o valor-p do teste é p > 0,150 indicando que os
dados vêm de uma população (distribuição Gaussiana)
conforme o teste de Kolmogorov-Smirnov. Já o teste de
Ryan-Joiner similar ao de Shapiro-Wilks (disponível no
programa) indicou um valor-p de p > 0,100 confirmando o
apontado pelo teste de Kolmogorov-Smirnov.
88
Exemplo 2
Escreva a expressão do modelo Gaussiano que pode ser
ajustado adequadamente aos dados.
f(x) =
1
 2
e
1 x 2
 (
)
2 
=
1
0,444 2
e
1 x  49 , 901 2
 (
)
2 0 , 444
xR
Exemplo 3
Verifique usando o método de K-S se a a.a. adiante segue
a distribuição Exponencial de probabilidades. Os dados
estão em mm e correspondem ao comprimento de
determinado produto que foi observado n = 30 vezes.
89
Usando o STATGRAPHICS
STATG> DESCRIBE, DISTRIBUTIONS,
DITRIBUTION FITTING (entra com a coluna com os
dados), BOTÃO DA DIREITA DO MOUSE,
ANALYSIS OPTIONS (marcar Exponencial), BOTÃO
AMARELO DAS OPÇÕES, GOODNESS OF FITTING.
0,451000 1,96945 7,13563 31,7629 6,64905 6,18010
9,09503 0,384300 0,951424 9,40156 9,51063 14,0222
3,94125 8,65843 6,12337 5,32622 9,42843 22,7070
8,62611 43,0589 14,4677 2,12289 4,74482 14,7730
0,120617 6,38820 2,80350 20,7474 7,38290 5,69364
90
RESULTADOS:
Estimated Kolmogorov statistic DPLUS = 0.133655
Estimated Kolmogorov statistic DMINUS = 0.129582
Estimated overall statistic DN = 0.133655
Valor-p p = 0.657417
Como o teste de Kolmogorov-Smirnov forneceu valor-p
de p = 0,657417 > 0,05 aceitá-se a hipótese de que os
dados tenham vindo de uma distribuição exponencial com
parâmetro = 9,48758 (média amostral).
91
Exemplo 4
Escreva a expressão do modelo exponencial que pode ser
ajustado aos dados do exemplo 3 adequadamente.
f(x) = e-x = 9,48758e 9 ,48758 x
x>0
EXERCÍCIOS
3.2.1.12) Seja a v.a. X ~ N (10,4). Calcule:
a) P(8<X<10).
Solução:
1
e
P(8<X<10) =  f ( x )dx = 
8
8 2 2
10
10
1 x 10 2
 (
)
2 2
dx
P(8<X<10) = 0,341345
92
E, usando o MINITAB o caminho é:
MTB> CALC/ PROBABILITY DISTRIBUTIONS/ NORMAL
Cumulative probability
Mean 10 Standard deviation 2
Input constant 10 (depois entra com 8)
As saídas são: 0,5 e 0,158655
P(8<X<10) = F(10) – F(8) = 0,5 – 0,158655 = 0,341345
93
ESPERANÇA E VARIÂNCIA DE UMA VARIÁVEL
ALEATÓRIA - Definições
DEF. Seja uma variável aleatória X, discreta, que assume
valores no conjunto {x1, x2, x3, ... , }. Chamamos valor
médio ou esperança matemática de X ao valor:


i 1
i 1
  E ( X )   xi  PX ( xi )   xi  PX ( X  xi )
DEF. Chamamos VARIÂNCIA da v.a. X ao valor:
2
n
2
(
x


)
P(X  x i )
= V(X) =  i
i 1
94
DEF. A raiz quadrada da variância da v.a. X é denominada
V(X)
desvio-padrão da v.a. X,  =
Uma relação muito importante é
V ( X )  E ( X 2 )   E ( X )
2
, onde
n
E ( X 2 )   xi  P ( X  xi ).
2
i 1
Se a v.a. é contínua tem-se a esperança de X dada por:
E( X )   

 xf ( x) dx

e a variância por E(x-)2 = 2 =

2
(
x


)
f ( x )dx


95
DEF. Se as v.a’s X e Y não são independentes existe uma
diferença entre E(X.Y) e E(X).E(Y). Esta diferença é
chamada de covariância e definida por:
cov(X,Y) = E[(X - E(X)).(Y - E(Y))]
cov(X,Y) = E[(X - X).(Y - Y )]
e se cov(X,Y) = 0 as v.a’s são chamadas de
correlacionadas.
não-
DEF. A covariância entre as v.a’s X e Y padronizadas é
chamada de coeficiente de correlação
 = E[( X  E(X) )( Y  E(Y) )]
x
y
96
Exemplo
Os dados adiante referem-se ao peso e ao comprimento de
uma aste de seção constante. Calcule a correlação entre as
variáveis.
Peso:
5
8
10
15
21
24
31
36
Comprimento: 10 15
20
30
40
50
60
75
O Diagrama de Dispersão (adiante) mostra a tendência da
evolução dos dados, ou seja, a forma do relacionamento
entre as duas variáveis Peso e Comprimento.
97
Diagrama de Dispersão - Peso x Comprimento
PesoxComprimento
40
35
30
Peso
25
20
15
10
5
10
20
30
40
50
Comprimento
60
70
80
98
Esse gráfico foi obtido no MINITAB usando o caminho:
MTB> graphs/ scatterplots / with regression
E, o valor do coeficiente de correlação  estimado é
obtido aplicando-se a expressão do estimador de  dada
n
por:
ˆ 
 ( x i  x )(y i  y)
i 1
n
 ( x i  x ) ( y i  y)
2
2
i 1
onde x é a média amostral da v.a. X
e y é a média amostral da v.a. Y
99
O caminho do cálculo no MINITAB é o seguinte:
MTB> STAT/ BASIC STATISTICS/ CORRELATION
n
ˆ 
 ( x i  x )(y i  y)
i 1
n
 ( x i  x ) ( y i  y)
2
2
= 0,997 (correlação alta)
i 1
Quando se pretende modelar o relacionamento pode-se
ajustar o modelo linear:
Yi = 0 + 1xi + i
i = 1,2, ..., n
MTB> STAT / REGRESSION / REGRESSION – RESPONSE Y /PREDICTORS X
100
A equação de regression estimada é:
y = 0,557 + 0,485x
Os resultados para os coeficientes são:
Predictor
Coef.
E.P.
t p
0.5574 0.4110
1.36 0.196
ˆ 0
ˆ 1
0.485135 0.009508 51.03 0.000
s = 0.817875 R2 = 99.5%
101
ESTATÍSTICA DESCRITIVA
População, Amostra e Descrição Numérica de
Variáveis.
POPULAÇÃO
Em Estatística denomina-se população alvo a totalidade
de elementos que estão sob discussão e dos quais se
deseja informação.
AMOSTRA ALEATÓRIA
Uma a.a. aleatória tomada de uma determinada
população é aquela em que os elementos que compõem a
população têm uma chance probabilística de pertencer à
amostra. Uma amostra aleatória de tamanho n é
geralmente representada por [X1, X2, ... , Xn], onde Xi i =
1,2, .. ,n são os valores obtidos para compor a amostra. 102
Na Ciência Estatística a população amostrada corresponde
à distribuição de probabilidade correspondente a certa
característica (física ou não) e a amostra corresponde a
valores medidos dessa característica. Essa distribuição de
probabilidade é definida por uma função que depende de
parâmetros que são, em geral, desconhecidos. Esses
parâmetros devem ser estimados com base nos valores
amostrais usando-se seus estimadores.
103
Exemplo 1
O diâmetro de um calibrador tampão liso cilíndrico foi
medido em uma máquina de medição universal por meio
de um método de medição direta e se obteve uma
amostra de n = 10 leituras. A amostra está na tabela
adiante. As n = 10 medidas obtidas correspondem à a.a.
tomada da característica “diâmetro do calibrador”. A
população amostrada corresponde à distribuição de
probabilidade da característica X = diâmetro do
calibrador. Uma medida física geralmente tem
distribuição de probabilidade Gaussiana (Normal), então
a população amostrada é a Distribuição de Probabilidade
Gaussiana (Normal).
104
Número da Leitura
Leitura em mm
1
2
3
4
5
6
7
8
9
10
10,0024
10,0027
10,0028
10,0027
10,0021
10,0026
10,0020
10,0026
10,0023
10,0026
105
Gaussianidade
Será que os dados vêm de uma distribuição Gaussiana?
Aplicação do Teste de Kolmogorov-Smirnov
CAMINHO:
MTB> STAT/BASIC STATISTICS/NORMALITY
TEST/ KOLMOGOROV-SMIRNOV
RESULTADOS DO TESTE; valor-p p > 0,150
Os dados vem de distribuição Gaussiana (Normal).
106
Teste de Gaussianidade - KS - do Diâmetro do Calibrador
Normal
99
Mean
StDev
N
KS
P-Value
95
90
10.00
0.0002700
10
0.172
>0.150
Percentual
80
70
60
50
40
30
20
10
5
1
10.00200 10.00225 10.00250 10.00275 10.00300 10.00325
diam_calib
107
Exemplo 2
Seja a a.a. [X1, X2, ... , Xn] de uma característica
populacional com f.d.p. Gaussiana com média  e variância
2 e representada por N(, 2). A média amostral
, a
variância xamostral s2 e o desvio padrão s são estatísticas.
São funções de v.a’s observáveis e não dependem de
qualquer parâmetro desconhecido. Veja as expressões das
estatísticas citadas:
1 n
Média amostral X =  x i
n i1
s2
Variância e amostral =
1 n
2
d.p. s =
 (x i  x)
n  1 i 1
estima o parâmetro 
1 n
2
 (x i  x)
n  1 i1
estima o parâmetro  2
estima o parâmetro 
108
Exemplo 3
• A função da média amostral X é estimar a média
populacional (parâmetro desconhecido) ;
• A função da variância amostral s2 é estimar a
variância populacional (parâmetro desconhecido) 2;
A função do desvio padrão amostral s é estimar o desvio
padrão populacional (parâmetro desconhecido) ;
109
Exemplo 4
Usando os dados da tabela 1 estime o parâmetro
correspondente à verdadeira média  do diâmetro do
calibrador.
Caminho no MINITAB:
MTB> STAT/BASIC STATISTICS/DISPLAY
DESCRIPTIVE STATISTICS
x=
1 10
 xi
10 i 1
1
=
(10,0024 + .... + 10,0026) = 10,0025
10
110
Exemplo 5
Usando os dados da tabela 1 estime o parâmetro
correspondente à verdadeira variância 2 do diâmetro do
calibrador.
s2 =
s2
1 n
2
 (x i  x)
n  1 i1
1 10
2
(
x

10
,
0025
)

=
i
i

1
10  1
1
2
2
[(
10
,
0024

10
,
0025
)

...

(
10
,
0026

10
,
0025
)
= 9
s2 = = 0,000000072889
111
Exemplo 6
Usando os dados da tabela 1 estime o parâmetro
correspondente ao verdadeiro desvio padrão  do
diâmetro do calibrador.
s=
1 n
2
 (x i  x)
n  1 i 1
s=
0,00000334
333 = 0,000270
1 10
2
(
x

10
,
0025
)

= 10  1 i1 i
=
112
Exemplo 7
A figura adiante mostra a distribuição de probabilidade da
v.a. correspondente ao diâmetro do calibrador da tabela 1.
Distribuição do Diâmetro do Calibrador
Média
10,0025
0,00027
1500
density
1200
900
600
300
0
10001 10001.5 10002 10002.5 10003 10003.5 10004
(X 0.001)
x
113
Exemplo 8
As figuras adiante representam as distribuições
(populações) correspondentes a uma característica X de
um produto fabricado por três empresas. De qual das
empresas você compraria o produto considerando que a
característica X é fundamental ao funcionamento do
produto? Considere que a característica X do produto está
especificada por: alvo  = 5,0 e tolerância de  = 0,5, ou
seja, 5,0 ± 0,5.
114
Característica X - Fabricante 1
4
Média e D. Padrão
5,0
0,1
f(x)
3
2
1
0
4.5
4.7
4.9
5.1
5.3
5.5
x
115
Característica X - Fabricante 2
Média e D. Padrão
5,0
0,05
8
f(x)
6
4
2
0
4.7
4.8
4.9
5
5.1
5.2
5.3
x
116
Característica X - Fabricante 3
1
Média e D. Padrão
5,0
0,4
f(x)
0.8
0.6
0.4
0.2
0
3
4
5
6
7
x
117
118
Observe que você deve comprar do fabricante 2
porque o desvio padrão da característica X do
produto desse fabricante é 0,05 e, portanto, a
produção ficará mais concentrada dentro das
especificações. De modo nenhum a compra deve ser
feita do fabricante 3, pois a quantidade de
defeituosos (fora das especificações) será
inaceitavelmente grande. Observe as amplitudes de
variação mostradas nos três gráficos.
119
DESCRIÇÃO NUMÉRICA DE VARIÁVEL
A descrição numérica dos dados (amostra) de uma
variável aleatória é feita usando as estatísticas seguintes:
Estatísticas de Centralidade (Medidas de Tendência
Central) e Separatrizes.
•média amostral (a média amostral estima a verdadeira
média populacional ).
120
Exemplo 1:
Duas máquinas produzem peças que estão especificadas
com valor nominal  = 2 mm e tolerância  = 0.2 mm.
Foi tomada da 1a. máquina uma amostra com tamanho
n = 5 peças que forneceram as seguintes observações:
1,98 2,01 2,02 1,99 e 2,00. Já a 2a. máquina forneceu
uma amostra do mesmo tamanho com as observações:
2,00 2,01 2,01 1,98 2,0. Você diria, com base nas
amostras, que as duas máquinas estão centradas no alvo
das especificações? Tome a sua decisão calculando as
médias amostrais.
121
1 n1
x1 
 xi =
n 1 i 1
1
(1,98+2,01+2,02+1,99+ 2,00) = 2,00
5
1 n2
x2   xi =
n1 i 1
1
(2,00+2,01+2,01+1,98+ 2,00) = 2,00
5
Sim, as máquinas estão centradas no alvo (valor nominal)
das especificações.
122
• mediana  (separa os dados ordenados em duas
partes com igual número de termos)
P(X  )  P(X  )  0,50
Exemplo 3:
Calcule a mediana amostral de cada uma das amostras
aleatórias seguintes. Lembre de primeiro ordenar as
observações.
a) 20 30 40 20 25
b) 1,5 2,0 1,0 2,5 3,0
123
Solução:
a) Ordenando os termos: 20, 20, 25, 30, 40
  25
b) Ordenando os termos: 1,0 1,5 2,0 2,5 3,0
  2,0
c)
xi
20
25
30
fi
3
4
2
  25
124
EXERCÍCIOS
1) A mediana  é uma separatriz, além de uma medida
de centralidade. Então, o que faz a separatriz?
R: Separa as observações ordenadas em duas partes com
igual número de termos.
2) Os quartis são medidas de posição (ordem), ou ainda,
separatrizes. Quantos são os quartis e o qual a sua
função?
R: Os quartis são três: Q1 é o quartil inferior, Q2 é a
mediana e Q3 é o quartil superior. A função dos três
quartis é separar os dados ordenados em quatro partes
com igual número de termos; deste modo 25% das
observações são inferiores a Q1, 50% são nferiores a Q2
=  e 75% são inferiores a Q3.
125
3) A descrição dos dados de uma amostra forneceu os
seguintes valores para os quartis: Q1 = 7, Q2 = 10 e Q3
= 13. Interprete o significado de cada um dos quartis
quanto à população de onde vieram os dados.
4) Os percentís são medidas de posição (ordem), ou
ainda, separatrizes. Qual a sua função?
R: Os percentís são em número de 99 e têm por função
separar os dados ordenados em 100 partes com igual
número de termos.
126
Exercício
Descreva os dados do diâmetro do calibrador que estão
na tabela 1 do exemplo 1.
Solução: usa-se um pacote estatístico (MINITAB p.ex.)
Descriptive Statistics: diam_calib
Variável
Média E.P.
D.P.
Variância
Min. Q1
diam_calib 10.0025 0.0000854 0.000270 7.28889E-08 10.002 10.0020
Variable Mediana Q3
Max. Amplitude
diam_calib 10.0026 10.003 10.0028 0.000800
127
Q1= 10.0023
Média = 10,0025
Mediana = 10,0026
Q3 = 10,0027
Máximo = 10,0028
Amplitude = 0,0220
Desvio padrão = 0,000270
Caminho no Minitab:
STAT BASIC STATISCS DISPLAY DESCRIPTIVES ...
128
Exercício 3:
Os dados abaixo correspondem a uma amostra aleatória do
diâmetro do furo (em mm) para fixação de certo
equipamento aeronáutico. Descreva os dados
numericamente e graficamente.
120,5 120,9 120,3 121,3 120,4 120,2 120,1 120,5 120,7 121,1
120,9 120,8 120,3 120,2 120,3 120,4 120,5 120,2 120,8 120,9
120,5 120,6 120,4 120,7 120,5 120,6 120,5 120,7 120,6 120,5
129
Solução:
Caminho no Minitab:
STAT > BASIC STATISCS >DISPLAY > DESCRIPTIVES
...
Descrição numérica consiste em calcular as estatísticas
descritivas: média, desvio padrão, variância, etc.
Variable Mean SE Mean StDev Variance CoefVar Minimum
Q1 Median
diam_furo 120,56 0,0511 0,280 0,0783
0,0023
120,10 120,38 120,50
Variable
Q3 Maximum Range
diam_furo 120,73 121,30 1,20
130
n
1
Média x   x i = 120,56
n i 1
Desvio padrão s =
1 n
2
 (x i  x)
n  1 i 1
Erro padrão da média EP =
Variância =
s2
1 n
2
=
 (x i  x)
n  1 i1
= 0,280
s 0,280

 0,0511
n
30
= 0,0783
131
s
Coef. de variação
=
x
0,280
 0,0023= 0,23%
120,56
Então, o desvio padrão é 0,23% da média.
O valor mínimo x(1) = 120,10
O primeiro quartil Q1 = 120,38
Significa que 25% dos termos são inferiores a 120,38
N
30
Posição de Q1 é i
= 1  7,5 , então Q1 está entre o 70.
4
4
e o 80. termos ordenados.
132
A mediana  = 120,5
Posição da mediana n/2
• Se n é impar a mediana é o termo central (termos
ordenados).
• Se n é par a mediana é a média aritmética dos dois
termos centrais (termos ordenados).
• O segundo quartil Q2 =  = 120,5
O terceiro quartil Q3 = 120,73
n
30
A posição de Q3 é 3  3  22,5
4
4
Então Q3 situa-se entre o 220. e o 230. termos.
133
O valor máximo é x(n) = 121,30
A amplitude dos dados é R = x(n) - x(1) = 121,30 – 120,10
R = 1,20
134
Descrição gráfica consiste em construir o histograma dos
dados.
Caminho no MINITAB: GRAPH HISTOGRAM
Histograma de diam_furo
Normal
Mean
StDev
N
10
120.6
0.2798
30
Frequência
8
6
4
2
0
120.0
120.2
120.4
120.6 120.8
diam_furo
121.0
121.2
121.4
135
2) O tempo de vida até falhar, em horas, de um
componente eletrônico sujeito a um teste de durabilidade
acelerado é mostrado abaixo para uma amostra com
tamanho n = 40. Para acelerar a falha no teste, as unidades
experimentais são testadas sob uma temperatura elevada.
127 125 131 124 129 121 142 151 160 125 124 123 120
119 128 133 137 124 142123 121 136 140 137 125 124
128 129 130 122 118 131 125 133 141 125 140 132 129
126
136
a) Calcule a média amostral.
b) Calcule a variância amostral.
c) Calcule o desvio padrão amostral.
d) O erro padrão da média.
e) Calcule a variância.
f) Calcule o coeficiente de variação.
g) Calcule a mediana e os quartis.
h) Calcule a amplitude dos dados.
i) Qual a finalidade das estatísticas que você calculou nos
itens anteriores.
j) Construa o histograma. E ajuste a curva normal aos
dados, use qualquer programa estatístico.
137
Solução:
Usando o MINITAB com o caminho:
MTB> STAT>BASIC STATISTICS>DISPLAY
DESCRIP. ......
Resultados:
Variable
Mean SE Mean StDev Var. CoefVar Minimum Q1 Median
tempoVIDA 130,00 1,41
8,92 79,54 6,86% 118,00 124,00 128,00
Variable
Q3 Maximum Range
tempoVIDA 135,25 160,00 42,00
138
1 n
Média x   x i =
n i 1
Desvio padrão s =
1
(127+125+ … +126) = 130,00
40
1 n
2
 ( x i  130) = 8,92
40  1 i 1
Erro padrão da média EP =
sx
=
s 8,92

1,41
n
40
n
1
2
2
(
x

130
)

Variância s =
= 79,54
i
40  1 i 1
Coef. de Variação cv =
s
=
x
8,92
= 6,86%
130,00
139
Mediana  = 128 (N = 40, então a mediana é a media
aritmética dos dois termos centrais: 190 e 200);
10. Quartil Q1 = 124 (25% dos termos são inferiores a 124)
30. Quartil Q3 = 135,25 (25% dos termos são superiores a
135,25)
Amplitude R = x(n) – x(1) = 160 – 118 = 42
i) A finalidade das estatísticas calculadas é estimar
(avaliar) os verdadeiros parâmetros.
140
f) Histograma e ajuste a curva normal
Solução: usando o MINITAB com o caminho:
STAT BASIC STATISTICS NORMALITY TEST
Teste de Gaussianidade - KS - do Tempo de Vida
Normal
99
Mean
StDev
N
KS
P-Value
95
90
130
8.918
40
0.125
0.115
Percentual
80
70
60
50
40
30
20
10
5
1
110
120
130
140
tempoVIDA
150
160
141
O ajuste da Curva Normal foi aceito pois no teste de
Kolmogorov-Smirnov o valor-p foi p = 0,115 > 0,05.
HISTOGRAMA DOS DADOS tempVIDA
Normal
Ajuste da Distribuição Normal
14
Mean
StDev
N
12
130
8.918
40
Frequencia
10
8
6
4
2
0
110
120
130
140
tempoVIDA
150
160
142
3) Os dados adiante são leituras do rendimento de um
processo químico em dias sucessivos (leia da esquerda
para a direita). Faça o histograma dos dados, comente o
aspecto do histograma e verifique se o histograma lembra
alguma distribuição de probabilidade conhecida. E,
ainda, descreva numericamente os dados, calculando as
estatísticas listadas adiante.
a) Calcule a media amostral.
b) Calcule a variância amostral.
c) Calcule o desvio padrão amostral.
d) Calcule a mediana e os quartis.
e) Qual a finalidade das estatísticas que você calculou nos
itens anteriores. Escreva para que serve cada uma delas.
143
94,1 87,3 94,1 92,4 84,6 85,4 93,2 84,1 92,1 90,683,6 86,6
90,6 90,1 96,4 89,1 85,4 91,7 91,4 95,288,2 88,8 89,7 87,5
88,2 86,1 86,4 86,4 87,6 84,286,1 94,3 85,0 85,1 85,1 85,1
95,1 93,2 84,9 84,089,6 90,5 90,0 86,7 87,3 93,7 90,0 95,6
92,4 83,089,6 87,7 90,1 88,3 87,3 95,3 90,3 90,6 94,3 84,1
86,6 94,1 93,1 89,4 97,3 83,7 91,2 97,8 94,6 88,696,8 82,9
86,1 93,1 96,3 84,1 94,4 87,3 90,4 86,494,7 82,6 96,1 86,4
89,1 87,6 91,1 83,1 98,0 84,5
144
Solução: Usando o MINITAB no caminho
MTB> STAT> BASIC STATISTICS> DISPLAY DESCR..
Variable Mean SE Mean StDev Variance CoefVar Minimum Q1 Median
RENDpq 89,476 0,438 4,158 17,287
4,65
82,6 86,1 89,250
Variable
RENDpq
Q3 Maximum Range
93,1 98,000 15,400
A finalidade dessas estatísticas é estimar os verdadeiros
parâmetros.
145
1 n1
 x i = 89,476
Média amostral x 
n1 i 1
A verdadeira média do rendimento médio é um parâmetro
desconhecido e estimado pela média amostral em 89,476.
n
1
2
2
(
x

x
)

Variância amostral s =
= 17,287.
i
n  1 i1
A verdadeira variância do rendimento médio é um
parâmetro desconhecido e estimado pela variância amostral
em 17,287.
Desvio padrão amostral s =
ˆ ( x )  17,287  4,158
s V
1 n
2
 (x i  x)
= 4,158
n  1 i 1
146
O verdadeiro desvio padrão do rendimento é um parâmetro
desconhecido, mas estimado pelo desvio padrão amostral
s = 4,158.
A mediana amostral é
ˆ 
89,250
A verdadeira mediana do rendimento é um parâmetro
desconhecido, mas estimado pela mediana amostral 89,250.
Então, entende-se que 50% dos valores do rendimento são
inferiores ao rendimento de 89,250.
147
O primeiro quartil é Q1 = 86,1
O valor de Q1 é determinado a partir da posição dessa
n 90
separatriz i  1  22,5 . Então, o primeiro quartil está
4
4
entre o 220. termo (86,1) e o 230. termo (86,1) ordenados.
Logo, ele é 86,1. Isto significa que 25% dos termos são
inferiores a 86,1 e, consequentemente, 75% são
superiores.
148
O terceiro quartil é Q3 = 93,1
O valor de Q3 é determinado a partir da posição dessa
separatriz
N
90
i  3  67.,5Então, o terceiro quartil está
4
4
entre o 670. termo (93,1) e o 680. termo (93,1) ordenados.
Logo, ele é 93,1. Isto significa que 25% dos termos são
superiores a 93,1 e, consequentemente, 75% dos termos são
inferiores.
A finalidade de cada estatística calculada é avaliar (estimar)
o parâmetro verdadeiro (populacional) desconhecido.
149
Ajustamento de Um modelo Probabilístico aos Dados
Seja agora o problema de se ajustar um modelo de
probabilidade aos dados adiante. Isto deve ser feito por
programa estatístico computacional. Usando o MINITAB
o caminho é: GRAPH PROBABILITY PLOT
Dados: (Amostra de uma distribuição log-normal)
3,94026
2,65617
3,56792
3,86631
3,60134
1,94644
2,21181
1,48382
4,69082
1,57235
2,83870
2,18587
2,41691
1,76695
2,91195
2,17336
3,19817
2,06446
2,62691
2,94858
150
Vamos examinar o histograma dos dados:
Histograma
6
Frequencia
5
4
3
2
1
0
1.5
2.0
2.5
3.0
x
3.5
4.0
4.5
151
Ajuste do Modelo Normal p = 0,597 > 0,05 (aceito)
Ajuste da Distribuição Normal
Normal - 95% CI
Dados x
99
Mean
StDev
N
AD
P-Value
95
90
2.733
0.8657
20
0.283
0.597
Percentual
80
70
60
50
40
30
20
10
5
1
0
1
2
3
4
5
6
x
152
Modelo Lognormal p = 0,962 > 0,05 (melhor modelo)
Ajuste da Distribuição Lognormal
Lognormal - 95% CI
Dados x
99
Loc
Scale
N
AD
P-Value
95
90
Percentual
80
0.9582
0.3172
20
0.145
0.962
70
60
50
40
30
20
10
5
1
9 0
0. 1.
1.
5
2.
0
x
3.
0
4.
0
5.
0
6.
0
0
0
7. 8.
153
5. Estimação de Parâmetros
Introdução
Seja a a.a. [X1, X2, ... , Xn] obtida de uma distribuição de
probabilidade que corresponde a população amostrada.
Então, essa amostra trás informações sobre os parâmetros
da distribuição (população) e é possível estimar esses
parâmetros usando as informações da amostra.
ESTIMADOR
Um estimador é uma estatística (função conhecida de v.a’s
observáveis que também é uma v.a.) cujos valores são
usados para estimar alguma função do parâmetro .
154
Exemplo 1
A estimação da média populacional  (parâmetro) é
feita usando-se o estimador mais adequado, que é a
média amostral
n
1 1
x   xi
n1 i 1
Este estimador (estatística) tem propriedades excelentes,
tais como: é suficiente, é consistente, é eficiente e é nãoviciado, ou seja, ele é UMVU.
155
Pergunta importante:
Precisão e acurácia significa a mesma coisa?
Seja a a.a. [x1, x2, ... , xn] obtida de uma distribuição de
probabilidade que corresponde a população amostrada.
Então, essa amostra trás informações sobre os parâmetros
da distribuição (população) e é possível estimar esses
parâmetros usando as informações da amostra.
Precisão mede a diferença entre a estimativa que avalia o
parâmetro e a média da amostra, ou seja, x . Precisão tem
a ver com dispersão dos dados.
Acurácia mede a diferença entre a estimativa que avalia o
parâmetro e o próprio parâmetro estimado, ou seja, ˆ - 
156
Um estimador suficiente resume todas as informações
que a a.a. trás, este resumo pode ser observado na
estatística que agrega todas as informações;
Já um estimador consistente é aquele que à medida que o
tamanho da amostra (n) aumenta, a estimativa obtida se
aproxima do verdadeiro parâmetro populacional ;
Um estimador eficiente significa que as estimativas
fornecidas por ele possuem a menor variância entre as de
todos os possíveis estimadores do parâmetro;
E, finalmente, um estimador não-viciado é tal que a
esperança matemática (média) dele é o próprio parâmetro
que ele está estimando, ou seja, E(T) = .
157
ESTIMATIVA
É o valor numérico obtido para o estimador com os dados
da amostra.
TIPOS ESTIMAÇÃO
Existem dois tipos de estimação. O que fornece uma
estimativa PONTUAL, e que nesse caso corresponde a um
único valor para a estimativa. E o que fornece uma
estimativa por INTERVALO, nesse caso tem-se um limite
inferior e um limite superior para a variação do parâmetro
com certo nível de confiança.
ESTIMAÇÃO PONTUAL
Seja a abordagem desse tema por meio de um exemplo:
158
Exemplo 2
Seja a a.a. das cinco leituras do diâmetro do calibrador listada
na tabela adiante.
a) A estimativa pontual do verdadeiro diâmetro médio do
calibrador  é obtida usando-se o estimador:
n
x
 xi
i 1
= 10,0028
n
que forneceu a estimativa pontual de 10,0028.
b) A estimativa pontual da variância 2 é dada pelo
estimador:
s2
1 n
2
=
 (x i  x) = 5.9E-7
n  1 i1
159
que forneceu com os valores da amostra a estimativa
pontual de s2 = 5.9E-7.
c) A estimativa pontual do desvio padrão  é dada pelo
estimador:
n
s=
2
 (x i  x)
i 1
= 0,00768115
n 1
que forneceu com os valores da amostra a estimativa
pontual s = 0,00768115.
160
Os dados analisados são:
Medidas do Diâmetro do Calibrador
Número da leitura
Medidas do Diâmetro do
Calibrador
1
10,0024
2
10,0027
3
10,0041
4
5
10,0027
...................
...................
10,0021
...................
...................
161
ESTIMAÇÃO POR INTERVALO:
A estimação por intervalo consiste na construção de um
intervalo de confiança em torno da estimativa pontual, de
modo que esse tenha uma probabilidade fixada do
intervalo cobrir o verdadeiro valor do parâmetro.
Geralmente, o que se faz na construção do intervalo é
somar e subtrair à estimativa pontual um múltiplo do erro
padrão da estatística usada na estimação, de modo que se
tenha certa probabilidade de cobrir o intervalo.
162
INTERVALO DE CONFIANÇA PARA A
MÉDIA POPULACIONAL
Quando os dados vêm de uma distribuição Normal, ou
ainda, quando n > 30 e se  for conhecido tem-se a
seguinte expressão para o intervalo de confiança de nível
(1 - ) para a média :
Px  z / 2 .X    x  z / 2 .X   1  
onde  x 

n
163
Este intervalo é construído com base na estatística:
x 
~z
/ n
A v.a. z tem uma distribuição de probabilidade Normal
Padrão, ou seja, N(0, 1). Sua f.d.p. é:
1
f(z) =
1  2 z2
e
2
z R
164
Distribuição Normal Padrão
N(0, 1)
0.4
Média e D.Padrão
0 e 1
f(z)
0.3
0.2
0.1
0
-5
-3
-1
1
3
5
z
165
Quando os dados vêm de uma distribuição Normal
(Gaussiana) e  for desconhecido, tem-se a seguinte
expressão para o intervalo de confiança de nível (1 - )
para a média :
Px  tn1, / 2 .sX    x  tn1, / 2 .sX   1  
s
onde s x 
n
Este intervalo é construído com base na estatística:
x 
~ t n 1
s/ n
166
A f.d.p. da distribuição “t” de Student tem o seguinte
gráfico no caso do número de G.L. ser n – 1 = 5 – 1 = 4
Distribuição "t" de Student
G.L. = 4
0.4
G.L.
4
f(t)
0.3
0.2
0.1
0
-8
-4
0
4
8
t
167
Exercícios
1) Seja a amostra aleatória dos diâmetros de esferas de
rolamento com tamanho n = 5, [2,0; 2,1; 2,0; 2,2; 2,1].
Os diâmetros estão em milímetros. Estime por ponto a
média do processo de produção desse item.
n
ˆ  x 
5
 xi
i 1
n
=
 xi
i 1
5
2,0  ..... 2,1
=
5
= 2,08
168
2) Estime por ponto o desvio padrão da amostra do ex. 1.
n
s=
 (x i  x)
i 1
n 1
s=
2
5
=
 ( x i  2,08)
2
i 1
5 1
(2,0  2,08) 2  ...  (2,1  2,08) 2
= 0,0837
5 1
169
3) Estime o erro padrão da estimativa do exercício 1.
EP = s x =
s
n
=
0,0837
=
5
0,0374
4) Estime por intervalo a média do processo de produção
do diâmetro considerando o nível de confiança de 95%.
Px  tn1, / 2 .sX    x  tn1, / 2 .sX   1  
2,08  t n 1, / 2 .0,0374 = 2,08 t 4;0,025 .0,0374
170
Px  tn1, / 2 .sX    x  tn1, / 2 .sX   1  
Mas, será que os dados vêm de uma distribuição Gaussiana?
MT> STAT>BASIC STATISTICS> NORMALITY TEST
Teste de Gaussianidade - da Esfera
Valor-p p > 0,150
Normal
99
Mean
StDev
N
KS
P-Value
95
90
Percentual
80
70
60
50
40
2.08
0.08367
5
0.131
>0.150
Aceito a hipotese nula
dos Dados serem
Gaussianos
30
20
10
5
1
1.9
2.0
2.1
diamESFF
2.2
2.3
171
O cálculo do escore da distribuição “t” de Student com  =
n – 1 = 4 graus de liberdade é:
MTB> CALC> PROBABILITY DISTRIBUTIONS> t >
Inverse Cumulative Probability
P( T <= t )
t
0,025 -2,77645
Então, faz-se as contas:
P(2,08-2,77645.0,0374<  < 2,08 + 2,77645.0,0374) = 0,95
P(1,97607 <  < 2,18389) = 0,95
Então, IC de nível 95% é:
[1,976607 ; 2,18389]
172
Intervalo de Confiança Usando o MINITAB:
MTB> STAT> BASIC STATISTICS> 1-Sample t
One-Sample T: diamESFF
Test of mu = 2 vs not = 2
Variable N
diamESFF 5
Mean StDev SE Mean
95% CI
T
p
2,080 0,08367 0,03742 (1,97611; 2,18389) 2,14 0,099
Este comando faz também o teste de H0 :  = 0 = 2
Decisão: Aceita-se H0 pois o valor-p é p = 0,099 > 0,05.
173
5) A amostra adiante corresponde a n = 20 observações da
espessura de chapas metálicas. Este produto está
especificado pelo valor nominal  = 5 mm e tolerância
de 0,5 mm e toda chapa produzida deve ficar dentro dos
limites de especificação, ou seja, entre LIE = 4,5 e LSE
= 5,5 mm.
4.83629
5.10238
5.09497
4.96608
4.93144
5.06309
4.90608
4.89091
5.06783
5.07828
4.96388
4.94415
4.93216
4.83297
5.13654
4.86722
5.10440
4.97626
5.01899
4.81916
174
a) Verifique se os dados vêm de uma distribuição Normal.
Usando o MINITAB no caminho:
MTB> STAT> BASIC STATISTICS> NORMALITY TEST
Gráfico de Probabilidade Normal
Normal
99
Mean
StDev
N
KS
P-Value
95
90
4.977
0.1012
20
0.154
>0.150
Percentual
80
70
60
50
40
30
20
10
5
1
4.7
4.8
4.9
5.0
ESP_CHAPA
5.1
5.2
175
Como o valor-p é p > 0,150 aceita-se a Gaussianidade.
b) Determine o intervalo de confiança de nível 1 -  = 0,95
para a média e verifique se ele está contido no intervalo da
especificação.
Px  tn1, / 2 .sX    x  tn1, / 2 .sX   1  
One-Sample T: ESP_CHAPA
Test of mu = 5 vs not = 5
Variable
N Mean StDev SE Mean
95% CI
t
p
ESP_CHAPA 20 4,97665 0,10115 0,02262 (4,92931; 5,02400) -1,03 0,315
LIE = 4,5 e LSE = 5,5 logo o IC não está dentro da amplitude de
especificação, existe uma parcela de não-conformes abaixo de 4,5.
176
c) Teste a hipótese de que a espessura média das chapas
seja igual ao alvo das especificações.
Solução:
H0 =  = 0 = 5 (hipótese nula)
H1 =   5
x  0
Estatística do teste: t =
~ tn-1
s/ n
4,976 5
Então, t =
= -1,03 ~ t19
0,10115/ 20
Então, determina-se o valor-p dessa estatística.
177
No MINITAB com o caminho:
MTB> CALC>PROBABILITY DISTRIBUTIONS> t
Valor-p
p = 2x0,151084 = 0,315 > 0,05
Aceitá-se H0 e o processo de produção da chapa tem média
estatisticamente igual ao alvo do processo.
Verifique o desempenho do processo de produção
analisando a capacidade do processo no MINITAB
CAMINHO:
MTB> STAT>QUALITY TOOLS>CAPABILITY
ANALYSIS> NORMAL
178
Capacidade do Processo da ESP_CHAPA
LSL
Target
USL
P rocess D ata
LS L
4.50000
Target
5.00000
USL
5.50000
S ample M ean
4.97665
S ample N
20
S tDev (Within) 0.11098
P otential (Within) C apability
Cp
1.50
C PL
1.43
C PU
1.57
C pk
1.43
C C pk 1.50
4.50
O bserv ed P erformance
P P M < LS L 0.00
P P M > U S L 0.00
P P M Total
0.00
4.65
4.80
4.95
5.10
5.25
5.40
E xp. Within P erformance
P P M < LS L 8.74
P P M > U S L 1.21
P P M Total
9.95
179
Analisando os números da capacidade do processo:
LSE  LIE = 1,50
Cp 
6s
Razão entre as amplitudes de
especificação e do processo.
Cpk  min{Cpi , Cps }1,43
x  LIE
C pi 
 1,43
3s
( X é 4,976)
LSE  x
C ps 
1,57
3s
Com esta capacidade (capability) de 1,50 o número de
defeituosos esperado é de: 9,95  10 ppm
180
6) Suponha que outra empresa produz a mesma chapa e
uma descrição de uma a.a. de n = 20 dessas chapas
produziu: y = 4,8 e s = 0,1021. Verifique se os dois
processos são equivalentes na média.
Hipótese nula a ser testada H0 : X = y Û X - y = 0
( x  y)  ( x   y )
Estatística do teste: t =
onde sp =
sp
1 1

n1 n 2
~ tn1+n2-2
(n1  1)s 2x  (n 2  1)s 2y
n1  n 2  2
181
Cálculo da estatística do teste:
( x  y)  ( x   y )
t=
Sp =
sp
1 1

n1 n 2
=
(4,976 4,8)  0
1
1
0,101626

20 20
(20  1)0,101152  (20  1)0,10212
20  20  2
= 5,476 ~ t38
= 0,101626
Valor-p p = 0,0000 < 0,05 Rejeita-se a hipótese H0.
182
E, se queremos fazer direto no MINITAB?
Usa-se o comando:
MTB> STAT> BASIC STATISTICS> 2-sample t
E, entra-se com os valores das médias e desvios padrões ou
com os dados, conforme o caso. Resultados:
Two-Sample T-Test and CI
Sample N Mean StDev SE Mean
1
20 4.976 0.101 0.023
2
20 4.800 0.102 0.023
Difference = mu (1) - mu (2)
Estimate for difference: 0.176000
95% CI for difference: (0.110942; 0.241058)
T-Test of difference = 0 (vs not =): T-Value = 5.48 P-Value = 0.000 DF = 38
Both use Pooled StDev = 0.1016 – REJEITA-SE H0
183
ANÁLISE DA VARIÂNCIA
Quando se faz um experimento que envolve amostras de
mais de dois grupos (populações) e se necessita testar a
hipótese nula:
H0: 1 = 2 = .... = k =  contra
H1: pelo menos uma das médias é diferente das demais,
aplica-se o método conhecido como Análise da Variância,
detalhado a seguir.
184
EXEMPLO
Os dados adiante correspondem aos resultados de um
experimento onde 4 tratamentos de plasma são comparados
quanto ao tempo de coagulação. Amostras de plasma de 32
indivíduos foram alocadas aos 4 tratamentos numa ordem
aleatória (experimento completamente casualizado). Faça
uma análise estatística com a finalidade de verificar se
existe diferença estatisticamente significativa entre os
tratamentos.
185
T1
T2
T3
T4
8.4
12.8
9.6
9.8
8.4
8.6
8.9
7.9
9.4
15.2
9.1
8.8
8.2
9.9
9.0
8.1
9.8
12.9
11.2
9.9
8.5
9.8
9.2
8.2
12.2
14.4
9.8
12.0
8.5
10.9
10.4
10.0
186
SOLUÇÃO:
MTB> STAT>ANOVA>ONEWAY ANOVA
Resultados:
One-way ANOVA: REPOSTA versus TRAT
Source
TRAT
Error
Total
DF
SS MS F
p
3 13.02 4.34 1.31 0.291
28 92.76 3.31
31 105.78
S = 1.820 R-Sq = 12.31% R-Sq(adj) = 2.91%
H0: 1 = 2 = 3 = 4
Conclusão: Não existe diferença entre as médias, aceitá-se H0, ou
seja os tratamentos produzem a mesma média.
187
EXEMPLO
Uma fábrica de papel usado para fazer sacolas de papel está
interessada em melhorar a resistência do papel à tensão. A
engenharia de produto da empresa imagina que a resistência à
tensão depende da concentração da madeira de lei na polpa e
que a faixa prática de interesse dessa concentração está entre
5% e 20%. Foi feito então um experimento nos seguintes
níveis de concentração: 5%, 10%, 15% e 20% e mediu-se a
resistência à tensão em seis sacolas de prova em cada nível. Os
resultados estão adiante. Faça uma Análise da Variância.
188
Resistência à Tensão (psi)
5%
10%
15%
20%
7
12
14
19
8
17
18
25
15
13
19
22
11
18
17
23
9
19
16
18
10
15
18
20
189
1. A aplicação da ANOVA exige Gaussianidade dos dados.
Isto é verificado com base nos resíduos do ajuste do
moedelo para a resposta (resistência):
yij =  + i + ij
onde: yij é a resposta medida;
 é a média geral;
i é o efeito do nível i fator (conc. da madeira de lei);
ij é o erro aleatório -componente estocástica do mod.
ij ~ N(0, 2) (suposições do modelo – verificar)
190
Testando a hipótese nula H0: 1 = 2 = 2 = 4
One-way ANOVA: concentração versus nível
Source DF
SS
MS
F
P
nível 3 382.79 127.60 19.61 0.000
Error 20 130.17 6.51
Total 23 512.96
S = 2.551 R-Sq = 74.62% R-Sq(adj) = 70.82%
Rejeitá-se a hipótese nula, pois p = 0,000 < 0,05.
191
Individual 95% CIs For Mean Based on
Pooled StDev
Level N Mean StDev +---------+---------+---------+--------5% 6 10.000 2.828 (----*----)
10% 6 15.667 2.805
(----*-----)
15% 6 17.000 1.789
(----*-----)
20% 6 21.167 2.639
(-----*----)
+---------+---------+---------+--------8.0 12.0 16.0 20.0
Pooled StDev = 2.551
Tukey 95% Simultaneous Confidence Intervals
All Pairwise Comparisons
Observa-se que 10%, 15% e 20% praticamente estão empatados. O nível de 5%
é diferente dos demais.
192
Gráfico dos Valores Individuais: 5%; 10%; 15%; 20%
25
Data
20
15
10
5
5%
10%
15%
20%
193
Verificando as suposições: Gaussianidade, homogeneidade da
variância e independência dos resíduos.
Gaussianidade
MTB> STAT> BASIC STATISTICS> NORMALITY TEST
Teste de Gaussianidade - Resíduos Concentração
Normal
99
Mean
StDev
N
KS
P-Value
95
90
2.960595E-16
2.379
24
0.095
>0.150
Percent
80
70
60
50
40
30
20
10
5
1
-5.0
-2.5
0.0
RESI1
2.5
5.0
194
Como o valor-p foi de p > 0,150 > 0,05 aceitá-se a
hipótese de Gaussianidade para os resíduos.
Homogeneidade de variância:
Test for Equal Variances: RESI1 versus nível
Bartlett's Test (normal distribution)
Test statistic = 1.14; p-value = 0.769
Levene's Test (any continuous distribution)
Test statistic = 0.60; p-value = 0.623
Aceitá-se a hipótese de homogeneidade na variância
H0: 12 = 22 = 32 = 42
pois p > 0,05
195
6. AMOSTRAGEM
Suponha que você deseja estimar a verdadeira média 
da espessura de uma chapa metálica. Qual será o tamanho
adequado, n, da amostra?
Tamanho da Amostra com Erro Especificado e 
Conhecido
• Deve ser fixado o nível de confiança: 1 - 
• Deve ser fixado o erro de | x   | = e
z  / 2 2
)
n= (
onde z / 2 é o escore da N(0, 1)
e
correspondente a  / 2
196
Exemplo
Suponha que no caso da espessura da chapa foi fixado um
erro de e = 0,05 e um nível de confiança de 95%. Então:
• Com 1 -  = 0,95 tem-se /2 = 0,025 e z0,025 = 1,96
MTB> CALC>PROBABILITY DISTRIBUTIONS>
NORMAL>INVERSE CUMULATIVE PROBABILITY
Normal with mean = 0 and standard deviation = 1
P( X <= x )
x
0.025 -1.95996
z  / 2 2
n= ( e ) =
 (1.95996 )0.1010 


0,05


2
= 15,675 = 16
197
Tamanho da Amostra com Erro Especificado e 
Desconhecido
•Neste caso há necessidade de se estimar o desvio padrão
.
•Assim, toma-se uma amostra piloto de tamanho n0 e
estima-se o desvio padrão s0.
 t n 0 1s 0 
• Usa-se a expressão para o tamanho n = 

e


2
• Então, se n > n0 tudo bem e recalcula-se o erro e;
•
se n < n0 toma-se mais n0 – n observações
adicionais.
198
Exemplo
Suponha que se deseja testar a hipótese de que o diâmetro
médio de um pino tem média de 10 mm. Qual o tamanho da
amostra, supondo que o desvio padrão  é desconhecido, o
nível de confiança é 95% e a precisão de 0,01.
Solução:
Como o desvio padrão é desconhecido toma-se uma amostra
piloto de tamanho n0 = 5. Os valores são: 10,1; 10,05; 9,98;
9,95 10.06.
A descrição da amostra piloto forneceu:
MTB> STAT> BASIC STATISTICS> DISPLAY ..
Variable N Mean SE Mean StDev
pino
5 10.010 0.0207 0.0464
199
Dimensionando o tamanho da amostra com base nas
informações da amostra piloto:
 t n 0 1s 0 
n= 

e


2
s0 = 0,0678
Escore tn0;/2
MTB> CALC> PROBABILITY DISTRIBUTIONS> t
Inverse Cumulative Distribution Function
Student's t distribution with 4 DF
P( X <= x )
x
0.025 -2.77645
200
2
 t n 0 1s 0 
n= 
 =
 e 
2
 2,777645x 0,0464

 = 166
0
,
01


Então, como tomamos n0 = 5, devemos tomar outras 161
observações adicionais.
Por que deu um tamanho de amostra tão grande? Devido
o nível de confiança de 95% (poderia ser menor – 90%) e
devido a precisão de 0,01.
201
PLANOS DE AMOSTRAGEM
Uma das maiores aplicações da estatística no
controle de qualidade de produtos está na amostragem
para aceitação de lotes. Muitas vezes as empresas
recebem carregamentos ou lotes de bens (produtos) e
fazem amostragem desses carregamentos com a finalidade
de aceitar ou rejeitar o carregamento ou lote todo. Essa
decisão é conhecida como sentenciamento do lote. No
início da aplicação do controle estatístico, de qualidade,
nas décadas de 30 e 40, a amostragem de aceitação era
usada, principalmente, para inspeção de entrada
(recebimento) de produtos.
202
Nos últimos anos passou-se a trabalhar com os
fornecedores a fim de fazer com que melhorassem os
seus processos de produção. Este aperfeiçoamento dos
processos poderia ser alcançado por meio de CEP, DOE e
outras técnicas estatísticas. Assim, conseguir uma
qualidade assegurada pareceu ser melhor do que a
amostragem de aceitação. Contudo, estas técnicas
continuam sendo necessárias e usadas.
203
6.3- Plano de Amostragem de Aceitação por Variável
Existem dois tipos de planos por variável:
1.) Planos que controlam a fração de defeituosos (ou não
conformes) do lote ou do processo;
2.) Planos que controlam um parâmetro do lote ou do
processo, em geral a média.
Suponha um plano de amostragem de variáveis para
controlar a fração de não-conformes do lote ou do
processo. A característica de qualidade é uma variável,
então existem limites de especificação: LIE e LSE, os
dois ou apenas um deles. Esses limites definem os valores
aceitáveis do parâmetro.
204
A fração p de não-conformes do lote corresponde a
P(X < LIE) = p,
no caso de especificação unilateral, e evidentemente
P(X < LIE) + P(X > LSE) = p
no caso de especificação bilateral. É claro que p depende
da média  e do desvio padrão  do processo.
Suponha, agora, que o desvio padrão  seja conhecido.
Então, pode-se tomar uma amostra do lote para determinar
se o valor da média é, ou não, tal que a fração de
defeituosos p seja aceitável. O que se faz é o seguinte:
205
1. Plano com a distância crítica k. Toma-se a a.a. de
tamanho n do lote, [x1, x2, .... ,xn] e calcula-se a estatística:
ZLIE =
X  LIE

Observe que quanto maior o valor de ZLIE mais afastada
está a média amostral do limite de especificação inferior
LIE e, conseqüentemente, menor será a fração p de
defeituosos do lote. Pode ser fixado um valor crítico, ou
melhor, uma distância crítica k, tal que ZLIE > k (no caso
unilateral). Dessa forma, se ZLIE > k o lote é aceito. E, em
caso contrário o lote será rejeitado.
206
2. Plano com a área crítica M. Este procedimento propõe
selecionar uma a.a. de n itens do lote e, então, calcula-se a
estatística:
ZLIE =
X  LIE

A seguir usa-se ZLIE para se estimar a fração de
defeituosos, p, do lote ou do processo como a área sob a
curva da normal padrão abaixo de ZLIE.
Uma melhor estimativa ocorre quando se usa a estatística
QLIE = ZLIE
n
n 1
ao invés de ZLIE, como o escore padronizado.
207
Então, seja o valor estimado de p que se obtém. Se exceder
um valor máximo especificado M (área crítica) rejeita-se o
lote, em caso contrário o aceite.
208
Elaboração de um Plano de Amostragem para
Variáveis com uma Curva Característica de Operação
Especificada
A elaboração do plano de amostragem que tenha uma
curva CO específica e o escore de interesse k (distância
crítica) é feita tomando-se dois pontos da curva (p1, 1 - )
e (p2, ). É claro que p1 e p2 podem ser níveis da fração de
não-conformes do lote ou do processo correspondentes a
níveis ACEITÁVEL e REJEITÁVEL de qualidade,
respectivamente. O nomograma, em anexo, permite que o
engenheiro (ou outro profissional da qualidade) encontre o
tamanho da amostra n exigido e o valor crítico k que
satisfaçam as condições dadas p1, 1 - , p2 e  para os
209
casos onde  é conhecido e  desconhecido.
EXEMPLO 1
Seja o problema em que se pretende obter um plano com
a distância crítica k. Uma fábrica de refrigerantes compra
garrafas descartáveis de um fornecedor. A fábrica
estabeleceu um limite de especificação inferior (LIE) de
LIE = 225 psi. Se até 1% das garrafas do lote de fato se
rompem abaixo desse limite a fábrica quer aceitar o lote
com uma probabilidade de 1 -  = 0,95. Assim, tem-se p1
= 0,01 e 1 -  = 0,95. Mas, se 6% ou mais das garrafas do
lote se rompem abaixo de LIE = 225, a fábrica deseja
rejeitar o lote com probabilidade 0,90. Dessa vez tem-se p2
= 0,06 e  = 0,10.
210
Solução:
Trace no nomograma, as linhas: uma de p1 a 1 -  e outra de
p2 a , ou melhor, da fração de defeituosos p1 = 0,01 a
probabilidade de aceitação 1 -  = 0,95 (em cada escala
respectiva), depois a outra linha da fração de defeituosos p2
= 0,06 a  = 0,10. A intersecção das linhas fornece k = 1,9.
Se  é desconhecido o tamanho da amostra é obtido
seguindo-se a curva até a escala superior que fornecerá n =
40. Então, o procedimento é tomar uma amostra de tamanho
n = 40 garrafas do lote, medir a força de ruptura de cada
uma, calcular a média e o desvio padrão s e, em seguida,
calcular:
ZLIE = X  LIE
e aceitar o lote se ZLIE > k = 1,9.
s
211
Mas, se  é conhecido deve-se descer verticalmente até a
escala inferior  conhecido resultando em n = 15.
Portanto, se o desvio padrão é conhecido obtém-se uma
amostra com tamanho sensivelmente reduzido.
212
213
EXEMPLO 2
Seja o problema do exemplo 1 e o plano com o
procedimento da área crítica M. Pretende-se determinar
a fração de defeituosos crítica (permissível) M.
Solução:
Neste caso segue-se o procedimento anterior e acrescentase um passo adicional, ou seja, converte-se os valores de
ZLIE ou ZLSE em uma fração de defeituosos estimada. É
sabido que n = 40 ( desconhecido) e k = 1,9. Então,
determina-se a abscissa :
1
k n
n 1
2
=
1
1,9 40
40  1
2
= 0,35
214
Então, com o valor 0,35 encontra-se diretamente no
nomograma adiante o valor de M = 0,030. Portanto,
tomando-se a amostra definida de n = 40 e calculando-se
a média amostral = 255 e o desvio padrão s = 15, tem-se:
ZLIE =
X  LIE
s
=
255  225
15
=2
215
216
Então, entrando no 30. nomograma com ZLIE = 2 encontrase pˆ = 0,02. E, como pˆ = 0,02 < M = 0,03 aceitá-se o lote.
217
Então, com o valor 0,35 encontra-se diretamente no
nomograma (em anexo) o valor de M = 0,030. Portanto,
tomando-se a amostra definida de n = 40 e calculando-se a
média amostral = 255 e o desvio padrão s = 15, tem-se:
ZLIE = = = 2
218
7. REGRESSÃO
Suponha que se deseja estabelecer a relação entre duas
variáveis por meio de um modelo.
EXEMPLO:
Foram tomadas n = 9 amostras de um solo (canteiros) que foram
tratadas com diferentes quantidades X de fósforo. Seja Y a
quantidade de fósforo presente em sementes de plantas, de 38
dias, crescidas nos diferentes canteiros. Os dados estão
adiante.
•
De início se faz um Diagrama de Dispersão para se visualizar
o tipo de função.
X 1 4
Y 64 71
5
54
9
81
11
76
13
93
23
77
23
95
28
109 219
Gráfico de Dispersão Y vs X
110
100
Y
90
80
70
60
50
0
5
10
15
X
20
25
30
Observa-se na forma do gráfico que a função é uma reta.
220
Ajusta-se então o modelo linear:
Yi = 0 + 1Xi + i
Onde 0 e 1 são os parâmetros do modelo;
Y é a variável resposta;
Xi é a variável explicativa;
i é o erro, supõe-se que i ~ N(o, 2)
O modelo é ajustado por Mínimos Quadrados Ordinários
221
O ajuste pelo MINITAB
MTB> STAT> REGRESSION> REGRESSION
Regression Analysis: Y versus X
The regression equation is
Y = 61.6 + 1.42 X
Predictor Coef SE Coef T P
Constant 61.580 6.248 9.86 0.000
X
1.4169 0.3947 3.59 0.009
S = 10.6933 R-Sq = 64.8%
222
Analysis of Variance
Source
Regression
Residual Error
Total
DF
SS
MS
F
P
1 1473.6 1473.6 12.89 0.009
7
800.4 114.3
8 2274.0
Conclui-se que:
• O modelo é estatísticamente significativo p = 0,009 <0,05
• A qualidade do modelo é razoável R2 = 0,648.
223
Download

1. ANÁLISE COMBINATÓRIA