Engenharia de Produção É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou Prof. Lorí Viali, Dr. [email protected] http://www.pucrs.br/famat/viali/ experimental. Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Numa relação experimental os valores de uma das variáveis são controlados. No relacionamento correlacional, por outro lado, não se tem nenhum controle sobre as variáveis sendo estudadas. Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Um engenheiro químico está investigando o efeito da temperatura de operação do processo no rendimento do produto. O estudo resultou nos dados da tabela seguinte: Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Temperatura, C 0 (X) Rendimento (Y) 100 110 120 130 140 150 160 170 180 190 45 51 54 61 66 70 74 78 85 89 Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística 1 O primeiro passo para 100 determinar se existe relacionamento 75 entre as duas variáveis é obter o 50 diagrama 25 de dispersão (scatter diagram). Rendimento (Y) Temperatura (X) 0 100 Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística O diagrama de dispersão fornece uma idéia do tipo de relacionamento entre as duas variáveis. Neste caso, percebe-se que existe um relacionamento linear. Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística 120 140 Prof. Lorí Viali, Dr. – PUCRS – 160 180 200 FAMAT: Departamento de Estatística Quando o relacionamento entre duas variáveis quantitativas for do tipo linear, ele pode ser medido através do: Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Observado um relacionamento linear entre as duas variáveis é possível determinar a intensidade deste relacionamento. O coeficiente que mede este relacionamento é denominado de Coeficiente de Correlação (linear). Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística 2 Quando se está trabalhando com amostras o coeficiente de correlação é indicado pela letra “r” e é uma estimativa do coeficiente de correlação populacional que é representado por “ρ” (rho). Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Para determinar o coeficiente de A covariância entre duas correlação (grau de relacionamento variáveis X e Y, é representada linear entre duas variáveis) vamos por “Cov(X; Y)” e calculada por: determinar inicialmente a variação conjunta entre elas, isto é, a Cov ( X ,Y ) = covariância. Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Mas ∑( X i − X )( Y i − Y ) = = ∑ [ X i Y i − X Y i − X i Y + XY ] = Prof. Lorí Viali, Dr. – = ∑ X i Y i − nXY −nXY + nXY = PUCRS – FAMAT: Departamento de Estatística Então: Cov ( X ,Y ) = = ∑ X i Y i − ∑ X Y i − ∑ X i Y + ∑ XY = = ∑ X i Y i − X ∑Y i − Y ∑ X i + ∑ XY = ∑ ( X i − X )( Y i − Y ) n −1 = ∑ ( X i − X )( Y i − Y ) = n −1 ∑ X i Y i − nXY n −1 = ∑ X i Y i − nXY Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística 3 A covariância poderia ser utilizada para medir o grau e o sinal do relacionamento entre as duas variáveis, O coeficiente de correlação linear (de Pearson) é definido por: mas ela é difícil de interpretar por variar de -∞ a +∞. Assim vamos utilizar o coeficiente de correlação linear de r = Cov ( X ,Y ) S X SY Pearson. Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Onde: Cov ( X ,Y ) = Prof. Lorí Viali, Dr. – Esta expressão não é muito ∑ X i Y i − nXY n −1 prática para calcular manualmente o coeficiente de correlação. Pode-se obter ∑Y 2i − n Y 2 n −1 o cálculo manual e o cálculo de outras Prof. Lorí Viali, Dr. – PUCRS – uma expressão mais conveniente para medidas necessárias mais tarde. FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – Tem-se: Cov ( X , Y ) = S X SY ∑ X i Y i − nXY n −1 = ∑ X = FAMAT: Departamento de Estatística ∑ X 2i − n X 2 SX = n −1 SY = r = PUCRS – −n X n −1 2 i ∑ X iY 2 i 2 ∑Y PUCRS – − nY n −1 − nXY (∑ X 2i − n X )(∑ Y Prof. Lorí Viali, Dr. – = 2 2 i 2 i −nY FAMAT: Departamento de Estatística 2 ) PUCRS – FAMAT: Departamento de Estatística F = ∑ X i Y i − nX Y a S XY z 2 2 Fazendo: e S XX = ∑ X i − n X n d S YY = ∑ Y 2 − n Y 2 i o Tem − se : Prof. Lorí Viali, Dr. – r = PUCRS – S XY S XX . S YY FAMAT: Departamento de Estatística 4 A vantagem do coeficiente de correlação (de Pearson) é ser Assim se r relacionamento = -1, temos uma linear negativo adimensional e variar de – 1 a + 1, perfeito, isto é, os pontos estão todos que o torna de fácil interpretação. alinhados e quando X aumenta Y decresce e vice-versa. Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – Se r = −1 50 r PUCRS – = relacionamento 40 30 FAMAT: Departamento de Estatística +1, temos linear uma positivo perfeito, isto é, os pontos estão todos 20 alinhados e quando X aumenta Y 10 0 10 15 Prof. Lorí Viali, Dr. – 50 20 PUCRS – 25 30 FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – Assim se r r = +1 40 também aumenta. FAMAT: Departamento de Estatística = 0, temos uma ausência de relacionamento linear, 30 isto é, os pontos não mostram 20 “alinhamento”. 10 0 10 15 Prof. Lorí Viali, Dr. – 20 PUCRS – 25 FAMAT: Departamento de Estatística 30 Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística 5 Assim se –1 < r < 0, temos uma r =0 50 relacionamento linear negativo, isto é, 40 30 os pontos estão mais ou menos 20 alinhados e quando X aumenta Y 10 0 10 15 Prof. Lorí Viali, Dr. – 20 PUCRS – 25 30 FAMAT: Departamento de Estatística 50 decresce e vice-versa. Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Assim se 0 < r < 1, temos uma −1 < r < 0 relacionamento linear positivo, isto é, 40 os pontos estão mais ou menos 30 20 alinhados e quando X aumenta Y 10 também aumenta. 0 10 15 Prof. Lorí Viali, Dr. – 20 PUCRS – 25 30 FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – 0 <r <1 50 40 30 20 10 0 10 15 Prof. Lorí Viali, Dr. – 20 PUCRS – 25 FAMAT: Departamento de Estatística 30 PUCRS – FAMAT: Departamento de Estatística Uma correlação amostral não significa necessariamente uma correlação populacional e vice-versa. É necessário testar o coeficiente de correlação para verificar se a correlação amostral é também populacional. Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística 6 Observada uma amostra de seis pares, pode-se perceber que a correlação é quase um, isto é, r ≅ 1. No entanto, observe o que ocorre quando mais pontos são acrescentados, isto é, quando se observa a população! Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística r ≅1 50 40 30 20 ρ ≅0 10 0 10 15 Prof. Lorí Viali, Dr. – 20 PUCRS – 25 30 FAMAT: Departamento de Estatística Determinar o “grau de relacionamento linear” entre as variáveis X = temperatura de operação do processo versus Y = rendimento do produto, conforme tabela. Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – X Y XY X2 Y2 100 110 120 130 140 150 160 170 180 190 1450 45 51 54 61 66 70 74 78 85 89 673 4500 5610 6480 7930 9240 10500 11840 13260 15300 16910 101570 10000 12100 14400 16900 19600 22500 25600 28900 32400 36100 218500 2025 2601 2916 3721 4356 4900 5476 6084 7225 7921 47225 PUCRS – Vamos utilizando a FAMAT: Departamento de Estatística calcular “r” expressão em destaque vista anteriormente, isto é, através das quantidades, SxY, SXX e SYY. Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística 7 Tem-se: Então: n = 10 ∑ X = 1450 ∑Y = 673 S XX = ∑ X 2i − n X 2 = X = 145 Y = 67,3 ∑ XY = 101570 = 218500 − 10.145 2 = ∑ X 2 = 218500 = 8250 S XY = ∑ X i Y i − nXY = S YY = ∑ Y 2i − n Y 2 = = 101570 − 10.145.67 ,3 = = 47225 − 10.67 ,32 = = 3985 = 1932 ,10 Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística S XY = S XX . S YY r = = ∑Y 2 = 47225 3985 = 8250 .1932 ,10 PUCRS – PUCRS – FAMAT: Departamento de Estatística Apesar de “r” ser um valor adimensional, ele não é uma taxa. Assim o resultado não deve ser expresso em percentagem. = 0 ,9981 Prof. Lorí Viali, Dr. – Prof. Lorí Viali, Dr. – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística O valor de “r” é obtido com base em uma amostra. Ele é portanto, uma estimativa do verdadeiro valor da correlação populacional (ρ). Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística 8 A teoria dos testes de hipóteses pode ser utilizada para verificar se com base na estimativa “r” é possível concluir se existe ou não correlação populacional, isto é, desejamos testar : Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística n −2 ρ<0 (teste unilateral/unicaudal à esquerda) ρ≠0 Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística tn-2 > tc (teste unilateral/unicaudal à direita) tn-2 < tc (teste unilateral/unicaudal à esquerda) |tn-2| > tc n −2 =r 1 −r 2 PUCRS – H 1: ρ > 0 (teste unilateral/unicaudal à direita) (teste bilateral/bicaudal) . O teste para a existência de correlação linear entre duas variáveis é realizado por: r − µr r −0 = = t n −2 = 2 ˆσr 1 −r Prof. Lorí Viali, Dr. – H 0: ρ = 0 (teste bilateral/bicaudal) . FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Onde tc é tal que: P(t < tc ) = 1− α (teste unilateral/unicaudal à direita) P(t < tc ) = α (teste unilateral/unicaudal à esquerda) P(t < tc ) = α/2 ou P(t > tc ) = α/2 (teste bilateral/bicaudal) . Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística 9 Suponha que uma amostra de n = 12, alunos forneceu um coeficiente de correlação amostral de r = 0,66, entre X = “nota em cálculo” e Y = “nota em Probabilidade e Estatística”. Verifique se é possível afirmar que uma nota boa em Cálculo está relacionada com uma nota boa em Probabilidade e Estatística a 1% de significância. Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística n −2 1 −r 2 n −2 12 − 2 = 0 ,66 = 2 ,778 1 −r 2 1 −0662 Prof. Lorí Viali, Dr. – PUCRS – Trata-se de um teste unilateral à direita para o coeficiente de correlação. Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística DECISÃO e CONCLUSÃO: Então: t10 = r Hipóteses: H0: ρ = 0 H1: ρ > 0 O valor crítico tc é tal que: P(T > tc) = 1- α Então tc = 2,764. Assim RC = [2,764; ∞) A variável teste é: t n −2 = r Dados: n = 12 r = 0 ,66 α = 1% FAMAT: Departamento de Estatística Como t10 = 2,778 ∈ RC ou 2,778 > 2,764, Rejeito H0 , isto é, a 1% de significância, podepode-se afirmar que a nota de Cá Cálculo está está relacionada com a de Probabilidade e Estatí Estatística. Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística OPÇÃO: 2 ,778 α = 1% Região de Não Rejeição Prof. Lorí Viali, Dr. – PUCRS – RC = [ 2 ,764; +∞) FAMAT: Departamento de Estatística Trabalhar com a significância do resultado obtido (2,778), isto é, o valor-p. Para isto, deve-se calcular P(T10 > 2,778). Utilizando o Excel, tem-se: Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística 10 Como a significância do resultado (0,98%) é menor que a significância do teste (1%) é possível rejeitar a hipótese nula. Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística O procedimento realizado para testar o coeficiente de correlação só é válido para testar a hipótese nula de que não existe correlação, isto é, ρ = 0. Outros tipos de testes só podem ser realizados através da transformada “zeta” de Fisher. Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística A vantagem desta transformação é que os valores de “ζ” estão distribuídos aproximadamente de acordo com uma normal de média: 1 ⎛1 +ρ ⎞ ⎟ µ ζ = ln ⎜⎜ 2 ⎝ 1 − ρ ⎟⎠ E desvio: 1 σζ = n −3 Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística A transformada “ζ” é dada por: 1 ⎛ 1 +r ⎞ ζ = ln ⎜ ⎟ 2 ⎝ 1 −r ⎠ O que equivale a considerar “r” como a tangente hiperbólica de “ζ” Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Esta transformação permite, realizar, testes de hipóteses e construir intervalos de confiança para o coeficiente de correlação, através de ζ e da distribuição normal. Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística 11 H 0: ρ = ρ0 H 1: ρ > ρ0 (teste unilateral/unicaudal à direita) ρ < ρ0 (teste unilateral/unicaudal à esquerda) ρ ≠ ρ0 (teste bilateral/bicaudal) . Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística O teste para a existência de correlação linear populacional entre duas variáveis X e Y é realizado por: 1 ⎛1 + ρ⎞ ⎟ ζ − ln ⎜⎜ ζ − µζ 2 ⎝ 1 − ρ ⎟⎠ = z= 1 σζ n −3 Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Onde zc é tal que: z > zc Φ(zc ) = 1− α (teste unilateral/unicaudal à direita) (teste unilateral/unicaudal à direita) z < zc Φ(zc ) = α (teste unilateral/unicaudal à esquerda) (teste unilateral/unicaudal à esquerda) |z| > zc (teste bilateral/bicaudal) . Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Φ(zc ) = α/2 ou Φ(zc ) = 1− α/2 (teste bilateral/bicaudal) . Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Suponha que uma amostra de n = 35, alunos forneceu um coeficiente de correlação amostral de r = 0,75, entre X = “número de horas de estudo” e Y = “nota em Probabilidade e Estatística”. Verifique se é possível afirmar que o “o número de horas de estudo” apresenta uma correlação de pelo menos 0,5 na população com a “nota em Probabilidade e Estatística”, a 1% de significância. Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística 12 Dados: n = 35 r = 0 ,75 α = 1% Hipóteses: H0: ρ = 0,5 H1: ρ > 0,5 A variá variável teste é: 1 ⎛1 +ρ⎞ ⎟ ζ − ln ⎜⎜ ζ − µζ 2 ⎝ 1 − ρ ⎟⎠ = z= 1 σζ n −3 Então: Trata-se de um teste unilateral à direita para o coeficiente de correlação. Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística A mé média vale: 1 ⎛ 1 + ρ ⎞ 1 ⎛ 1 + 0 ,5 ⎞ µζ = ln ⎜⎜ ⎟ = ln ⎜ ⎟ = 0 ,5493 2 ⎝ 1 − ρ ⎟⎠ 2 ⎝ 1 − 0 ,5 ⎠ E o desvio padrão vale: σζ = 1 1 1 = = = 0 ,1768 n −3 35 − 3 32 Prof. Lorí Viali, Dr. – PUCRS – 1 ⎛ 1 + 0 ,75 ⎞ ζ = ln ⎜ ⎟ = 0 ,9730 2 ⎝ 1 − 0 ,75 ⎠ FAMAT: Departamento de Estatística Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Padronizando, temtem-se: 1 ⎛1 + ρ ⎞ ⎟ ζ − ln ⎜⎜ ζ − µζ 2 ⎝ 1 − ρ ⎟⎠ z= = = 1 σζ n −3 = 0 ,9730 − 0 ,5493 = 2 ,40 0 ,1768 Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística DECISÃO e CONCLUSÃO: O valor crítico zc é tal que: P(Z > zc) = α = 1%. Ou Φ(zc) = 99%. Então zc = 2,33. Assim RC = [2,33; ∞) Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística Como z = 2,40 ∈ RC ou 2,40 > 2,33, Rejeito H0, isto é, a 1% de significância, pode-se afirmar que “o número de horas de estudo” apresenta pelo menos 0,50 de correlação com a “nota em Probabilidade e Estatística”. Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística 13 OPÇÃO: Trabalhar com a significância do resultado obtido (2,40), isto é, o valor2 ,40 α = 1% Região de Não Rejeição Prof. Lorí Viali, Dr. – PUCRS – RC = [ 2 ,33;+∞) FAMAT: Departamento de Estatística p. Para isto, deve-se calcular P(Z > 2,40), isto é, Φ(-2,40) = 0,82%. Como p = 0,82% < α = 1%. Rejeito H0. Prof. Lorí Viali, Dr. – PUCRS – FAMAT: Departamento de Estatística 14