Engenharia de Produção
É o grau de associação entre
duas ou mais variáveis. Pode ser:
correlacional
ou
Prof. Lorí Viali, Dr.
[email protected]
http://www.pucrs.br/famat/viali/
experimental.
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
Numa relação experimental os
valores de uma das variáveis são
controlados.
No relacionamento correlacional,
por outro lado, não se tem nenhum
controle sobre as variáveis sendo
estudadas.
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
Um engenheiro químico está
investigando o efeito da temperatura
de
operação
do
processo
no
rendimento do produto. O estudo
resultou nos dados da tabela
seguinte:
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
Temperatura, C 0 (X)
Rendimento (Y)
100
110
120
130
140
150
160
170
180
190
45
51
54
61
66
70
74
78
85
89
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
1
O primeiro passo para
100
determinar se existe relacionamento
75
entre as duas variáveis é obter o
50
diagrama
25
de
dispersão
(scatter
diagram).
Rendimento
(Y)
Temperatura (X)
0
100
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
O diagrama de dispersão
fornece uma idéia do tipo de
relacionamento
entre
as
duas
variáveis. Neste caso, percebe-se que
existe um relacionamento linear.
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
120
140
Prof. Lorí Viali, Dr. –
PUCRS –
160
180
200
FAMAT: Departamento de Estatística
Quando o relacionamento
entre
duas
variáveis
quantitativas for do tipo linear,
ele pode ser medido através do:
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
Observado um relacionamento
linear entre as duas variáveis é possível
determinar
a
intensidade
deste
relacionamento. O coeficiente que mede
este relacionamento é denominado de
Coeficiente de Correlação (linear).
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
2
Quando se está trabalhando com
amostras o coeficiente de correlação é
indicado pela letra “r” e é uma
estimativa do coeficiente de correlação
populacional que é representado por
“ρ” (rho).
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
Para determinar o coeficiente de
A covariância entre duas
correlação (grau de relacionamento
variáveis X e Y, é representada
linear entre duas variáveis) vamos
por “Cov(X; Y)” e calculada por:
determinar inicialmente a variação
conjunta entre elas, isto é, a
Cov ( X ,Y ) =
covariância.
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
Mas
∑( X i − X )( Y i − Y ) =
= ∑ [ X i Y i − X Y i − X i Y + XY ] =
Prof. Lorí Viali, Dr. –
= ∑ X i Y i − nXY −nXY + nXY =
PUCRS –
FAMAT: Departamento de Estatística
Então:
Cov ( X ,Y ) =
= ∑ X i Y i − ∑ X Y i − ∑ X i Y + ∑ XY =
= ∑ X i Y i − X ∑Y i − Y ∑ X i + ∑ XY =
∑ ( X i − X )( Y i − Y )
n −1
=
∑ ( X i − X )( Y i − Y )
=
n −1
∑ X i Y i − nXY
n −1
= ∑ X i Y i − nXY
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
3
A covariância poderia ser utilizada
para medir o grau e o sinal do
relacionamento entre as duas variáveis,
O coeficiente de correlação
linear (de Pearson) é definido por:
mas ela é difícil de interpretar por variar
de -∞ a +∞. Assim vamos utilizar o
coeficiente de correlação linear de
r =
Cov ( X ,Y )
S X SY
Pearson.
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
Onde:
Cov ( X ,Y ) =
Prof. Lorí Viali, Dr. –
Esta expressão não é muito
∑ X i Y i − nXY
n −1
prática para calcular manualmente o
coeficiente de correlação. Pode-se obter
∑Y 2i − n Y 2
n −1
o cálculo manual e o cálculo de outras
Prof. Lorí Viali, Dr. –
PUCRS –
uma expressão mais conveniente para
medidas necessárias mais tarde.
FAMAT: Departamento de Estatística
Prof. Lorí Viali, Dr. –
Tem-se:
Cov ( X , Y )
=
S X SY
∑ X i Y i − nXY
n −1
=
∑ X
=
FAMAT: Departamento de Estatística
∑ X 2i − n X 2
SX =
n −1
SY =
r =
PUCRS –
−n X
n −1
2
i
∑ X iY
2
i
2
∑Y
PUCRS –
− nY
n −1
− nXY
(∑ X 2i − n X )(∑ Y
Prof. Lorí Viali, Dr. –
=
2
2
i
2
i
−nY
FAMAT: Departamento de Estatística
2
)
PUCRS –
FAMAT: Departamento de Estatística
F
= ∑ X i Y i − nX Y
a S XY
z
2
2
Fazendo:
e S XX = ∑ X i − n X
n
d S YY = ∑ Y 2 − n Y 2
i
o
Tem − se :
Prof. Lorí Viali, Dr. –
r =
PUCRS –
S XY
S XX . S YY
FAMAT: Departamento de Estatística
4
A vantagem do coeficiente de
correlação
(de
Pearson)
é
ser
Assim se r
relacionamento
= -1, temos uma
linear
negativo
adimensional e variar de – 1 a + 1,
perfeito, isto é, os pontos estão todos
que o torna de fácil interpretação.
alinhados e quando X aumenta Y
decresce e vice-versa.
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
Prof. Lorí Viali, Dr. –
Se
r = −1
50
r
PUCRS –
=
relacionamento
40
30
FAMAT: Departamento de Estatística
+1,
temos
linear
uma
positivo
perfeito, isto é, os pontos estão todos
20
alinhados e quando X aumenta Y
10
0
10
15
Prof. Lorí Viali, Dr. –
50
20
PUCRS –
25
30
FAMAT: Departamento de Estatística
Prof. Lorí Viali, Dr. –
PUCRS –
Assim se r
r = +1
40
também aumenta.
FAMAT: Departamento de Estatística
= 0, temos uma
ausência de relacionamento linear,
30
isto é, os pontos não mostram
20
“alinhamento”.
10
0
10
15
Prof. Lorí Viali, Dr. –
20
PUCRS –
25
FAMAT: Departamento de Estatística
30
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
5
Assim se –1 < r < 0, temos uma
r =0
50
relacionamento linear negativo, isto é,
40
30
os pontos estão mais ou menos
20
alinhados e quando X aumenta Y
10
0
10
15
Prof. Lorí Viali, Dr. –
20
PUCRS –
25
30
FAMAT: Departamento de Estatística
50
decresce e vice-versa.
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
Assim se 0 < r < 1, temos uma
−1 < r < 0
relacionamento linear positivo, isto é,
40
os pontos estão mais ou menos
30
20
alinhados e quando X aumenta Y
10
também aumenta.
0
10
15
Prof. Lorí Viali, Dr. –
20
PUCRS –
25
30
FAMAT: Departamento de Estatística
Prof. Lorí Viali, Dr. –
0 <r <1
50
40
30
20
10
0
10
15
Prof. Lorí Viali, Dr. –
20
PUCRS –
25
FAMAT: Departamento de Estatística
30
PUCRS –
FAMAT: Departamento de Estatística
Uma correlação amostral não
significa necessariamente uma correlação
populacional e vice-versa. É necessário
testar o coeficiente de correlação para
verificar se a correlação amostral é
também populacional.
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
6
Observada uma amostra de seis
pares, pode-se perceber que a correlação é
quase um, isto é, r ≅ 1. No entanto,
observe o que ocorre quando mais pontos
são acrescentados, isto é, quando se
observa a população!
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
r ≅1
50
40
30
20
ρ ≅0
10
0
10
15
Prof. Lorí Viali, Dr. –
20
PUCRS –
25
30
FAMAT: Departamento de Estatística
Determinar o “grau de
relacionamento linear” entre
as
variáveis X = temperatura de
operação do processo versus Y =
rendimento do produto, conforme
tabela.
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
Prof. Lorí Viali, Dr. –
X
Y
XY
X2
Y2
100
110
120
130
140
150
160
170
180
190
1450
45
51
54
61
66
70
74
78
85
89
673
4500
5610
6480
7930
9240
10500
11840
13260
15300
16910
101570
10000
12100
14400
16900
19600
22500
25600
28900
32400
36100
218500
2025
2601
2916
3721
4356
4900
5476
6084
7225
7921
47225
PUCRS –
Vamos
utilizando
a
FAMAT: Departamento de Estatística
calcular
“r”
expressão
em
destaque vista anteriormente,
isto é, através das quantidades,
SxY, SXX e SYY.
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
7
Tem-se:
Então:
n = 10 ∑ X = 1450 ∑Y = 673
S XX = ∑ X 2i − n X 2 =
X = 145 Y = 67,3 ∑ XY = 101570
= 218500 − 10.145 2 =
∑ X 2 = 218500
= 8250
S XY = ∑ X i Y i − nXY =
S YY = ∑ Y 2i − n Y 2 =
= 101570 − 10.145.67 ,3 =
= 47225 − 10.67 ,32 =
= 3985
= 1932 ,10
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
S XY
=
S XX . S YY
r =
=
∑Y 2 = 47225
3985
=
8250 .1932 ,10
PUCRS –
PUCRS –
FAMAT: Departamento de Estatística
Apesar de “r” ser um
valor adimensional, ele não é
uma taxa. Assim o resultado
não deve ser expresso em
percentagem.
= 0 ,9981
Prof. Lorí Viali, Dr. –
Prof. Lorí Viali, Dr. –
FAMAT: Departamento de Estatística
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
O valor de “r” é obtido
com base em uma amostra. Ele é
portanto, uma estimativa do
verdadeiro valor da correlação
populacional (ρ).
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
8
A teoria dos testes de
hipóteses pode ser utilizada para
verificar se com base na estimativa
“r” é possível concluir se existe ou
não correlação populacional, isto é,
desejamos testar :
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
n −2
ρ<0
(teste unilateral/unicaudal à esquerda)
ρ≠0
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
tn-2 > tc
(teste unilateral/unicaudal à direita)
tn-2 < tc
(teste unilateral/unicaudal à esquerda)
|tn-2| > tc
n −2
=r
1 −r 2
PUCRS –
H 1: ρ > 0
(teste unilateral/unicaudal à direita)
(teste bilateral/bicaudal) .
O teste para a existência de
correlação linear entre duas variáveis é
realizado por:
r − µr
r −0
=
=
t n −2 =
2
ˆσr
1 −r
Prof. Lorí Viali, Dr. –
H 0: ρ = 0
(teste bilateral/bicaudal) .
FAMAT: Departamento de Estatística
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
Onde tc é tal que:
P(t < tc ) = 1− α
(teste unilateral/unicaudal à direita)
P(t < tc ) = α
(teste unilateral/unicaudal à esquerda)
P(t < tc ) = α/2 ou P(t > tc ) = α/2
(teste bilateral/bicaudal) .
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
9
Suponha que uma amostra de n = 12,
alunos forneceu um coeficiente de correlação
amostral de r = 0,66, entre X = “nota em
cálculo” e Y = “nota em Probabilidade e
Estatística”. Verifique se é possível afirmar que
uma nota boa em Cálculo está relacionada com
uma nota boa em Probabilidade e Estatística a
1% de significância.
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
n −2
1 −r 2
n −2
12 − 2
= 0 ,66
= 2 ,778
1 −r 2
1 −0662
Prof. Lorí Viali, Dr. –
PUCRS –
Trata-se de um teste unilateral à
direita para o coeficiente de correlação.
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
DECISÃO e CONCLUSÃO:
Então:
t10 = r
Hipóteses:
H0: ρ = 0
H1: ρ > 0
O valor crítico tc é tal que: P(T > tc) = 1- α
Então tc = 2,764. Assim RC = [2,764; ∞)
A variável teste é:
t n −2 = r
Dados:
n = 12
r = 0 ,66
α = 1%
FAMAT: Departamento de Estatística
Como t10 = 2,778 ∈ RC ou
2,778 > 2,764, Rejeito H0 , isto é, a 1% de
significância, podepode-se afirmar que a nota
de Cá
Cálculo está
está relacionada com a de
Probabilidade e Estatí
Estatística.
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
OPÇÃO:
2 ,778
α = 1%
Região de Não Rejeição
Prof. Lorí Viali, Dr. –
PUCRS –
RC = [ 2 ,764; +∞)
FAMAT: Departamento de Estatística
Trabalhar com a significância do
resultado obtido (2,778), isto é, o
valor-p. Para isto, deve-se calcular
P(T10 > 2,778). Utilizando o Excel,
tem-se:
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
10
Como a significância do resultado
(0,98%) é menor que a significância do teste
(1%) é possível rejeitar a hipótese nula.
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
O procedimento realizado para testar
o coeficiente de correlação só é válido
para testar a hipótese nula de que não
existe correlação, isto é, ρ = 0. Outros
tipos de testes só podem ser realizados
através da transformada “zeta” de
Fisher.
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
A vantagem desta transformação é que
os valores de “ζ” estão distribuídos
aproximadamente de acordo com uma
normal de média:
1 ⎛1 +ρ ⎞
⎟
µ ζ = ln ⎜⎜
2 ⎝ 1 − ρ ⎟⎠
E desvio:
1
σζ =
n −3
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
A transformada “ζ” é dada por:
1 ⎛ 1 +r ⎞
ζ = ln ⎜
⎟
2 ⎝ 1 −r ⎠
O que equivale a considerar “r”
como a tangente hiperbólica de “ζ”
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
Esta transformação permite,
realizar, testes de hipóteses e
construir intervalos de confiança
para o coeficiente de correlação,
através de ζ e da distribuição
normal.
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
11
H 0: ρ = ρ0
H 1: ρ > ρ0
(teste unilateral/unicaudal à direita)
ρ < ρ0
(teste unilateral/unicaudal à esquerda)
ρ ≠ ρ0
(teste bilateral/bicaudal) .
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
O teste para a existência de
correlação linear populacional entre
duas variáveis X e Y é realizado por:
1 ⎛1 + ρ⎞
⎟
ζ − ln ⎜⎜
ζ − µζ
2 ⎝ 1 − ρ ⎟⎠
=
z=
1
σζ
n −3
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
Onde zc é tal que:
z > zc
Φ(zc ) = 1− α
(teste unilateral/unicaudal à direita)
(teste unilateral/unicaudal à direita)
z < zc
Φ(zc ) = α
(teste unilateral/unicaudal à esquerda)
(teste unilateral/unicaudal à esquerda)
|z| > zc
(teste bilateral/bicaudal) .
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
Φ(zc ) = α/2 ou Φ(zc ) = 1− α/2
(teste bilateral/bicaudal) .
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
Suponha que uma amostra de n = 35,
alunos forneceu um coeficiente de correlação
amostral de r = 0,75, entre X = “número de
horas de estudo” e Y = “nota em Probabilidade
e Estatística”. Verifique se é possível afirmar
que o “o número de horas de estudo” apresenta
uma correlação de pelo menos 0,5 na população
com a “nota em Probabilidade e Estatística”, a
1% de significância.
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
12
Dados:
n = 35
r = 0 ,75
α = 1%
Hipóteses:
H0: ρ = 0,5
H1: ρ > 0,5
A variá
variável teste é:
1 ⎛1 +ρ⎞
⎟
ζ − ln ⎜⎜
ζ − µζ
2 ⎝ 1 − ρ ⎟⎠
=
z=
1
σζ
n −3
Então:
Trata-se de um teste unilateral à
direita para o coeficiente de correlação.
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
A mé
média vale:
1 ⎛ 1 + ρ ⎞ 1 ⎛ 1 + 0 ,5 ⎞
µζ = ln ⎜⎜
⎟ = ln ⎜
⎟ = 0 ,5493
2 ⎝ 1 − ρ ⎟⎠ 2 ⎝ 1 − 0 ,5 ⎠
E o desvio padrão vale:
σζ =
1
1
1
=
=
= 0 ,1768
n −3
35 − 3
32
Prof. Lorí Viali, Dr. –
PUCRS –
1 ⎛ 1 + 0 ,75 ⎞
ζ = ln ⎜
⎟ = 0 ,9730
2 ⎝ 1 − 0 ,75 ⎠
FAMAT: Departamento de Estatística
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
Padronizando, temtem-se:
1 ⎛1 + ρ ⎞
⎟
ζ − ln ⎜⎜
ζ − µζ
2 ⎝ 1 − ρ ⎟⎠
z=
=
=
1
σζ
n −3
=
0 ,9730 − 0 ,5493
= 2 ,40
0 ,1768
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
DECISÃO e CONCLUSÃO:
O valor crítico zc é tal que:
P(Z > zc) = α = 1%.
Ou Φ(zc) = 99%.
Então zc = 2,33.
Assim RC = [2,33; ∞)
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
Como z = 2,40 ∈ RC ou
2,40 > 2,33, Rejeito H0, isto é, a 1%
de significância, pode-se afirmar que
“o número de horas de estudo”
apresenta pelo menos 0,50 de
correlação com a “nota em
Probabilidade e Estatística”.
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
13
OPÇÃO:
Trabalhar com a significância do
resultado obtido (2,40), isto é, o valor2 ,40
α = 1%
Região de Não Rejeição
Prof. Lorí Viali, Dr. –
PUCRS –
RC = [ 2 ,33;+∞)
FAMAT: Departamento de Estatística
p.
Para
isto,
deve-se
calcular
P(Z > 2,40), isto é, Φ(-2,40) = 0,82%.
Como p = 0,82% < α = 1%. Rejeito H0.
Prof. Lorí Viali, Dr. –
PUCRS –
FAMAT: Departamento de Estatística
14
Download

É o grau de associação entre duas ou mais variáveis