1 Professor Mauricio Lutz REGRESSÃO LINEAR SIMPLES A correlação linear é uma correlação entre duas variáveis, cujo gráfico aproxima-se de uma linha. O gráfico cartesiano que representa essa linha é denominado diagrama de dispersão. Para poder avaliar melhor a correlação entre as variáveis, é interessante obter a equação da reta; essa reta é chamada de reta de regressão e a equação que a representa é a equação de regressão. O diagrama de dispersão é construído de acordo com os dados amostrais de n observações e a equação de regressão é dada pela expressão: Y = aX + b , onde a e b são os parâmetros. Vamos, então, calcular os valores dos parâmetros a e b com a ajuda das formulas: a= nå xi y i - (å xi )x(å y i ) nå xi2 - (å xi ) 2 e b = y - ax , Onde: n é o número de observações; æ x é a média dos valores xi ç x = ç è åx æ y é a média dos valores y i ç y = ç è ö ÷; n ÷ø i åy ö ÷. n ÷ø i Obs.: Como estamos fazendo uso de uma amostra para obtermos os valores dos parâmetros, o resultado, na realidade, é uma estimativa da verdadeira equação de regressão. Sendo assim escrevemos: ^ ^ Y = aX + b , onde o Y é o Y estimado. Exemplos: a) Determinar a reta de regressão linear, sabendo que existe uma forte correlação entre o peso total do lixo descartado, por dia, numa empresa com o peso do papel contido nesse lixo. Hotel H1 H2 H3 H4 H5 H6 H7 H8 H9 H10 Peso total 10,47 19,85 21,25 24,36 27,38 28,09 33,61 35,73 38,33 49,14 Peso do papel 2,43 5,12 6,88 6,22 8,84 8,76 7,54 8,47 9,55 11,43 Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 2 Professor Mauricio Lutz De acordo com os dados, fazemos a representação gráfica. Os pares ordenados formam o diagrama de dispersão. Para facilitar o cálculo construímos a seguinte tabela: Peso total ( xi ) Peso do papel ( y i ) xi . y i x i2 H1 10,47 2,43 25,44 109,62 H2 19,85 5,12 101,63 394,02 H3 21,25 6,88 146,20 451,56 H4 24,36 6,22 151,52 593,41 H5 27,38 8,84 242,04 749,66 H6 28,09 8,76 246,07 789,05 H7 33,61 7,54 253,42 1129,63 H8 35,73 8,47 302,63 1276,63 H9 38,33 9,55 366,05 1469,19 H10 49,14 11,43 561,67 2414,74 288,21 75,24 2396,68 9377,52 å Temos assim: a= a= nå xi y i - (å xi )x(å y i ) nå x - (å xi ) 2 i 2 = 10 x 2396,68 - 288,21x75,24 10 x9377,52 - (288,21) 2 23966,8 - 21684,92 2281,88 = = 0,2131 93775,2 - 83065 10710,2 Como y = 75,24 288,21 = 7,524 e x = = 28,821 vem: 10 10 b = y - a x = 7,524 - 0,2131x 28,821 = 7,524 - 6,1405 = 1,3835 Logo: ^ Y = 0,21X + 1,38 Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 3 Professor Mauricio Lutz Com base no conhecimento da equação da reta, pode-se interpolar e extrapolar valores. • Interpolação: a interpolação ocorre quando o valor considerado pertence ao intervalo da tabela, porém, não figura entre os dados coletados. Supondo-se o valor 15 kg para o peso total do lixo descartado, pode-se estimar o peso de papel contido nesse lixo. Uma vez que 15 kg não é um dado coletado e, conseqüentemente, não pertence à tabela de dados, utiliza-se a equação da reta para determinar o valor correspondente ao peso do papel. Para 15 kg de lixo descartado, estima-se que haja 4,58 kg de papel contido nesse lixo. • Extrapolação: a extrapolação ocorre quando o valor considerado não pertence ao intervalo da tabela, e também não figura entre os dados coletados. Suponha que o peso do lixo descartado seja de 60 kg. Esse valor não é um dado coletado e nem se encontra dentro do intervalo [10,47, 49,14]. Essa situação é semelhante à anterior e utiliza-se a equação de reta para determinar o peso do papel. Para 60 kg de lixo descartado, estima-se, por extrapolação, que haja 14,16 kg de papel contido nesse lixo. Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 4 Professor Mauricio Lutz b) Consideremos uma amostra aleatória, formada por dez dos 98 alunos de uma classe da faculdade A e pelas notas obtidas por eles em matemática e estatística: Notas Números Matemática ( xi ) Estatística ( 01 5,0 6,0 08 8,0 9,0 24 7,0 8,0 38 10,0 10,0 44 6,0 5,0 58 7,0 7,0 59 9,0 8,0 72 3,0 4,0 80 8,0 6,0 92 2,0 2,0 yi ) Vamos verificar a correlação primeiro fazendo um diagrama de dispersão: Correlação entre as notas de matemática e estatística Números Matemática ( xi ) Estatística ( yi ) xi . y i x i2 01 5,0 6,0 30 25 08 8,0 9,0 72 64 24 7,0 8,0 56 49 38 10,0 10,0 100 100 44 6,0 5,0 30 36 58 7,0 7,0 49 49 59 9,0 8,0 72 81 72 3,0 4,0 12 9 80 8,0 6,0 48 64 92 2,0 2,0 4 4 65 65 473 481 å Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br Notas 5 Professor Mauricio Lutz Temos assim: a= nå xi y i - (å xi )x(å y i ) nå xi2 - (å xi ) 2 Como y = = 10 x 473 - 65 x65 4730 - 4225 505 = = = 0,8632 4810 - 4225 585 10 x 481 - (65) 2 65 65 = 6,5 e x = = 6,5 vem: 10 10 b = y - a x = 6,5 - 0,8632 x6,5 = 6,5 - 5,6108 = 0,8892 ^ Logo: Y = 0,86 X + 0,89 Para traçarmos a reta no gráfico, basta determinar dois de seus pontos: ^ X = 0 Þ Y = 0,89 ^ X = 5 Þ Y = 0,86 x5 + 0,89 = 5,19 Assim temos: Coeficiente de determinação Trata-se de um indicador da qualidade do ajustamento. Dessa maneira, o coeficiente de determinação ou coeficiente de explicação é dado por R 2 2 , onde 0 £ R £ 1 , ou se multiplicarmos (100) = % temos 0 £ R 2 £ 100% O coeficiente de determinação (R2) é igual ao quadrado do coeficiente de correlação linear de Pearson (r). O R2 expressa a proporção da variação total que é explicada (divida) à reta de regressão de x sobre y. Utilizando os valores do exemplo anterior de correlação temos: R 2 = (0,9112) 2 = 0,8302 R 2 = 83,02% Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 6 Professor Mauricio Lutz Interpretamos esse resultado da seguinte maneira: o uso da variável – nota em matemática, X – , explica 83,02% das notas em estatística Y. Exercícios 1)Complete o esquema para o ajustamento de uma reta aos dados: xi 2 4 6 8 10 12 14 yi 30 25 22 18 15 11 10 Temos: xi yi xi . y i x i2 4 ........ ........ ........ ........ ........ 14 30 ........ ........ ........ ........ ........ 10 60 ........ ........ ........ ........ ........ 140 4 ........ ........ ........ ........ ........ 196 å =........ å =........ å =........ å =........ (........ x........) - (........ x........) ........ - ........ ........ = = = ........ ........ - ........ ........ (........ x........ ) - (........) 2 Logo: b = ........ - (........) ........ = ........ + ........ = ........ a= Donde: a = ........ e b = ........ ^ Isto é: Y = -........X + ........ 2) A tabela abaixo apresenta valores que mostram como o comprimento de uma barra de aço varia conforme a temperatura: Temperatura (°C) 10 15 20 25 30 Comprimento (mm) 1.003 1.005 1.010 1.011 1.014 Determine: a) O coeficiente de correlação; b) A reta ajustada a essa correlação; c) O coeficiente de determinação. d) O valor estimado do comprimento da barra para a temperatura de 18°C; e) O valor estimado do comprimento da barra para a temperatura de 35°C. Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 7 Professor Mauricio Lutz 3) A variação do valor do BTN (Bônus do Tesouro Nacional), relativamente a alguns meses de 1990, deu origem à tabela: Meses Abr. Mai. Jun. Jul. Ago. Set. Out. Nov. Valores (Cr$) 41,73 41,73 43,98 48,91 53,41 59,06 66,65 75,76 a) Calcule o grau de correlação. b) Estabeleça a equação de regressão de Y sobre X. c) Calcule o coeficiente de determinação. d) Estime o valor do BTN para o mês de dezembro. Sugestão: Substitua os meses, respectivamente, por 1, 2, ..., 8. 4) A partir da tabela: 1 2 3 4 5 6 70 50 yi a) Calcule o coeficiente de correlação; b) Determine a reta ajustada; c) Calcule o coeficiente de determinação; d) Estime Y para X=0. 40 30 20 10 xi 5) Certa empresa, estudando a variação de demanda de seu produto em relação a variação de preço de venda, obteve a tabela: 38 56 59 63 70 80 95 110 350 325 297 270 yi ) a) Determine o coeficiente de correlação; b) Estabeleça a equação da reta ajustada; c) Calcule o coeficiente de determinação; c) Estime Y para X=60 e X=120. 256 246 238 223 215 208 Preço ( xi ) 42 50 Demanda ( 6) Pretendendo-se estudar a relação entre as variáveis “consumo de energia elétrica” ( xi ) e “volume de produção nas empresas industriais” ( y i ), fez-se uma amostragem que inclui vinte empresas, computando-se os seguintes valores: åx i = 11,34 ; åy i = 20,70 ; åx 2 i = 12,16 ; Determine: a) O calculo do coeficiente de correlação; b) A equação de regressão de Y para X; Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br åy 2 i = 84,96 e åx y i i = 22,13 . 8 Professor Mauricio Lutz c) A equação de regressão de X para Y. 7) Vamos supor que exista uma relação linear entre as variáveis: X = despesas em propaganda e Y = vendas de certo produto. Considerando os dados abaixo: X 1,5 5,5 10,0 3,0 7,5 5,0 13,0 4,0 9,0 12,5 15,0 Y 120 190 240 140 180 150 280 110 210 220 310 Determine: a) Faça o diagrama de dispersão. b) Calcule o coeficiente de correlação de Pearson. c) Estabeleça a equação da reta ajustada. d) Calcular o valor de vendas para um gasto com propaganda de 4,5. e) Calcule o coeficiente de determinação e interprete-o. 8) Para uma empresa desenvolvimento manter-se competitiva, gastos de pesquisa e (P & D) são essenciais. Para determinar o nível ótimo de gastos em P & D e seu efeito sobre o valor da empresa, foi aplicada análise de regressão linear simples, onde: Y = razão entre preços e ganhos e X = razão entre gastos com P & D e vendas. Os dados das 20 empresas usadas no estudo são os seguintes: Empresas Y X Empresas Y X Empresas Y X Empresas 1 5,6 0,003 6 8,2 0,030 11 8,4 0,058 16 11,5 0,083 2 7,2 0,004 7 6,3 0,035 12 11,1 0,058 17 9,8 3 8,1 0,009 8 10,0 0,037 13 11,1 0,067 18 16,1 0,092 4 9,9 0,021 9 8,5 0,044 14 13,2 0,080 19 7,0 0,064 5 6,0 0,023 10 13,2 0,051 15 13,4 0,080 20 5,9 0,028 a) Construir o diagrama de dispersão. b) Calcule o coeficiente de correlação de Pearson. c) Estabelecer a equação da reta ajustada. d) Usar a equação obtida pra prever o valor de Y, quando X = $0,070. e) Calcule o coeficiente de determinação. Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br Y X 0,091 9 Professor Mauricio Lutz Resolução dos exercícios: 1)Complete o esquema para o ajustamento de uma reta aos dados: xi 2 4 6 8 10 12 14 yi 30 25 22 18 15 11 10 Temos: xi yi xi . y i x i2 2 3 6 8 10 12 14 30 25 22 18 15 11 10 60 75 132 144 150 132 140 4 9 36 64 100 144 196 å =55 å =131 å =833 å =553 Logo: (7 x833) - (55 x131) 5831 - 7205 - 1374 = = = -1,6241 3871 - 3025 846 (7 x553.) - (55) 2 b = 18,7143 - ( -1,6241)7,8578 = 18,7143 + 12,76089 = 31,4752 a= Donde: a = -1,6241 e b = 31,4752 ^ Isto é: Y = -1,6241X + 31,4752 2) A tabela abaixo apresenta valores que mostram como o comprimento de uma barra de aço varia conforme a temperatura: Temperatura (°C) 10 15 20 25 30 Comprimento (mm) 1.003 1.005 1.010 1.011 1.014 Determine: a) O coeficiente de correlação; b) A reta ajustada a essa correlação; c) O coeficiente de determinação. d) O valor estimado do comprimento da barra para a temperatura de 18°C; e) O valor estimado do comprimento da barra para a temperatura de 35°C. Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 10 Professor Mauricio Lutz xi yi xi . y i x i2 yi2 10 15 20 25 30 1003 1005 1010 1011 1014 10030 15075 20200 25275 30420 100 225 400 625 900 1006009 1010025 1020100 1022121 1028196 å =100 å =5043 å =101000 å =2250 å =5086451 a) n å xi y i - (å xi )( . å yi ) r= [nå x ][ - (å xi ) . n å y i2 - (å y i ) 2 2 i 2 ] [5x2250 - (100) ]x[5x5086451 - (5043) ] (505000 ) - (504300 ) r= (5 x101000 ) - (100 x5043) = [11250 - 10000 ]x[25432255 - 25431849 ] 2 = 700 1250 x 406 2 = 700 = 0,9826 712,3903 b) (5 x101000 ) - (100 x5043) 505000 - 504300 700 = = = 0,56 11250 - 10000 1250 (5 x 2250 ) - (100) 2 b = 1008,6 - 0,1217 x 20 = 1008,6 - 11,2 = 997,4 a= ^ Isto é: Y = 0,56 X + 997,4 c) R 2 = (0,9826) 2 = 0,9655 R 2 = 96,55% ^ d) Y = 0,56 x18 + 997,4 = 1007,48mm ^ e) Y = 0,56 x35 + 997,4 = 1017mm 3) A variação do valor do BTN (Bônus do Tesouro Nacional), relativamente a alguns meses de 1990, deu origem à tabela: Meses Abr. Mai. Jun. Jul. Ago. Set. Out. Nov. Valores (Cr$) 41,73 41,73 43,98 48,91 53,41 59,06 66,65 75,76 a) Calcule o grau de correlação. b) Estabeleça a equação de regressão de Y sobre X. c) Calcule o coeficiente de determinação. Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 11 Professor Mauricio Lutz d) Estime o valor do BTN para o mês de dezembro. Sugestão: Substitua os meses, respectivamente, por 1, 2, ..., 8. xi yi xi . y i x i2 yi2 1 2 3 4 5 6 7 8 41,73 41,73 43,98 48,91 53,41 59,06 66,65 75,76 41,73 83,46 131,94 195,64 267,05 354,36 466,55 606,08 1 4 9 16 25 36 49 64 1741,393 1741,393 1934,24 2392,188 2852,628 3488,084 4442,223 5739,578 å =204 å =24331,73 å =36 å =431,23 å =2146,81 a) r= r= n å x i y i - (å x i )( . å yi ) [nå x 2 i ][ - (å x i ) . n å y i2 - (å y i ) 2 2 = (8 x 2146,81) - (36 x 431,23) ] [8x204 - (36) ]x[8x24331,73 - (431,23) ] (17174,48) - (15524,28) [1632 - 1296 ]x[194653,8 - 185959,3] = 2 1650,2 336 x8694,496 2 = 1650,2 = 0,9655 1709,196 (8 x 2146,81) - (36 x 431,23) 17174,48 - 15524,28 1650,2 = = = 4,9113 1632 - 1296 336 (8 x 204 ) - (36) 2 b) b = 53,9038 - 4,9113 x 4,5 = 53,9038 - 22,1009 = 31,8029 a= ^ Isto é: Y = 4,9113 X + 31,8029 c) R 2 = (0,9655) 2 = 0,9322 R 2 = 93,22% d) Dezembro é igual a x=9 ^ Y = 4,9113x9 + 31,8029 = 76,0046 O valor para dezembro é de Cr$ 76,0046 Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 12 Professor Mauricio Lutz 4) A partir da tabela: xi 1 2 3 4 5 6 yi 70 50 40 30 20 10 a) Calcule o coeficiente de correlação; b) Determine a reta ajustada; c) Calcule o coeficiente de determinação; d) Estime Y para X=0 xi yi xi . y i x i2 yi2 1 2 3 4 5 6 70 50 40 30 20 10 70 100 120 120 100 60 1 4 9 16 25 36 4900 2500 1600 900 400 100 å =21 å =220 å =570 å =91 å =10400 a) r= r= n å xi y i - (å xi )( . å yi ) [nå x 2 i ][ - (å xi ) . n å y i2 - (å y i ) 2 (3420 ) - ( 4620 ) [546 - 441]x[62400 - 48400 ] 2 = (6 x570) - ( 21x 220) = ] [6 x91 - (21) ]x[6 x10400 - (220) ] - 1200 105 x14000 2 = - 1200 = 0,9897 1212,436 (6 x570) - ( 21x 220) 3420 - 4620 - 1200 = = = -11,4286 546 - 441 105 (6 x91) - (21) 2 b) b = 36,6667 - ( -11,4286 x3,5) = 36,6667 + 40 = 76,6667 a= ^ Isto é: Y = -11,4286 X + 76,6667 c) R 2 = (-0,9897) 2 = 0,9796 R 2 = 97,96% d) Para X=0 temos: Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 2 13 Professor Mauricio Lutz ^ Y = -11,4286 x0 + 76,6667 = 76,667 5) Certa empresa, estudando a variação de demanda de seu produto em relação a variação de preço de venda, obteve a tabela: Preço ( xi ) 38 42 50 56 59 63 70 80 95 110 Demanda ( y i ) 350 325 297 270 256 246 238 223 215 208 a) Determine o coeficiente de correlação; b) Estabeleça a equação da reta ajustada; c) Calcule o coeficiente de determinação; c) Estime Y para X=60 e X=120. xi yi xi . y i x i2 yi2 38 42 50 56 59 63 70 80 95 110 350 325 297 270 256 246 238 223 215 208 13300 13650 14850 15120 15104 15498 16660 17840 20425 22880 1444 1764 2500 3136 3481 3969 4900 6400 9025 12100 122500 105625 88209 72900 65536 60516 56644 49729 46225 43264 å =663 å =2628 å =165327 å =48719 å =711148 a) r= r= n å x i y i - (å xi )( . å yi ) [nå x 2 i ][ - (å x i ) . n å y i2 - (å y i ) 2 2 (10 x165327 ) - (663 x 2628) = ] [10 x48719 - (663) ]x[10 x711148 - (2628) ] (1653270 ) - (1742364 ) [487190 - 439569 ]x[7111480 - 6906384 ] 2 = - 89094 47621x 205096 2 = - 89094 = -0,9015 98827 ,5090 (10 x165327 ) - (663 x 2628) 1653270 - 1742364 - 89094 = = = -1,8709 487190 - 439569 47621 (10 x 48719 ) - (663) 2 b) b = 262,8 - ( -1,8709 x 66,3) = 262,8 + 124,0405 = 386,8405 a= ^ Isto é: Y = -1,8709 X + 386,8405 c) R 2 = (-0,9015) 2 = 0,8127 R 2 = 81,27% Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 14 Professor Mauricio Lutz d) Para X=60 temos: ^ Y = -1,8709 x60 + 386,8405 = 274,5867 Para X=120 temos: ^ Y = -1,8709 x120 + 386,8405 = 162,3328 6) Pretendendo-se estudar a relação entre as variáveis “consumo de energia elétrica” ( xi ) e “volume de produção nas empresas industriais” ( y i ), fez-se uma amostragem que inclui vinte empresas, computando-se os seguintes valores: åx i = 11,34 ; åy = 20,70 ; i åx 2 i = 12,16 ; åy 2 i = 84,96 e åx y i = 22,13 . i Determine: a) O calculo do coeficiente de correlação; b) A equação de regressão de Y para X; c) A equação de regressão de X para Y. a) r= r= n å x i y i - (å x i )( . å yi ) [nå x 2 i ][ - (å x i ) . n å y i2 - (å y i ) 2 2 ( 20 x 22,13) - (11,34 x 20,70) = ] [20 x12,16 - (11,34) ]x[20 x84,96 - (20,70) ] ( 442,6) - ( 234,738) [243,2 - 128,5956 ]x[1699,2 - 428,49] = 2 207,862 114,6044 x1270,71 = 2 207,862 = 0.5447 381,6136 ( 20 x 22,13) - (11,34 x 20,70) 442,6 - 234,738 207,862 = = = 1,8137 2 243,2 - 128,5956 114,6040 (20 x12,16 ) - (11,34) b) b = 1,035 - (1,8137 x0,567 ) = 1,035 - 1,0284 = 0,0066 a= ^ Isto é: Y = -1,8137 X + 0,0066 c) åy i = 11,34 ; åx i = 20,70 ; åy 2 i = 12,16 ; åx 2 i = 84,96 e åx y i i ( 20 x 22,13) - (11,34 x 20,70) 442,6 - 234,738 207,862 = = = 0,1636 1699,2 - 428,49 1270,71 (20 x84,96 ) - (20,70) 2 b = 0,567 - (0,1636 x1,035) = 0,567 - 0,1693 = 0,3977 a= Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br = 22,13 . 15 Professor Mauricio Lutz ^ Isto é: X = 0,1636Y + 0,3977 7) Vamos supor que exista uma relação linear entre as variáveis: X = despesas em propaganda e Y = vendas de certo produto. Considerando os dados abaixo: X 1,5 5,5 10,0 3,0 7,5 5,0 13,0 4,0 9,0 12,5 15,0 Y 120 190 240 140 180 150 280 110 210 220 310 Determine: a) Faça o diagrama de dispersão. b) Calcule o coeficiente de correlação de Pearson. c) Estabeleça a equação da reta ajustada. d) Calcular o valor de vendas para um gasto com propaganda de 4,5. e) Calcule o coeficiente de determinação e interprete-o. a) xi yi xi . y i x i2 yi2 1,5 5,5 10,0 3,0 7,5 5,0 13,0 4,0 9,0 12,5 15,0 120 190 240 140 180 150 280 110 210 220 310 180 1045 2400 420 1350 750 3640 440 1890 2750 4650 2,25 30,25 100 9 56,25 25 169 16 81 156,25 225 14400 36100 57600 19600 32400 22500 78400 12100 44100 48400 96100 å =86 å =2150 å =19515 å =870 å =461700 Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 16 Professor Mauricio Lutz b) r= r= n å x i y i - (å x i )( . å yi ) [nå x 2 i ][ - (å x i ) . n å y i2 - (å y i ) 2 ( 214665) - (184900 ) 2 = (11x19515) - (86 x 2150) ] [11x870 - (86) ]x[11x461700 - (2150 ) ] [9570 - 7396]x[5078700 - 4622500 ] = 2 29765 2174 x 456200 = 2 29765 = 0,9451 31492,52 (11x19515) - (86 x 2150) 214665 - 184900 29765 = = = 13,6914 9570 - 7396 2174 (11x870 ) - (86) 2 c) b = 195,4545 - 107,0415 = 88,4131 a= ^ Isto é: Y = 13,6914 X + 88,4131 d) Quando X=4,5 temos: ^ Y = 13,6914 X + 88,4131 = 13,6914 x 4,5 + 88,4131 = 150,0241 e) R 2 = (0,9451) 2 = 0,8932 R 2 = 89,32% 89,3% das vendas é explicada pela propaganda, os outros 10,7% é devido a outros fatores. Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 17 Professor Mauricio Lutz 8) Para uma empresa manter-se competitiva, gastos de pesquisa e desenvolvimento (P & D) são essenciais. Para determinar o nível ótimo de gastos em P & D e seu efeito sobre o valor da empresa, foi aplicada análise de regressão linear simples, onde: Y = razão entre preços e ganhos e X = razão entre gastos com P & D e vendas. Os dados das 20 empresas usadas no estudo são os seguintes: Empresas 1 2 3 4 5 Y 5,6 7,2 8,1 9,9 6,0 X 0,003 0,004 0,009 0,021 0,023 Empresas Y X 6 8,2 0,030 7 6,3 0,035 8 10,0 0,037 9 8,5 0,044 10 13,2 0,051 Empresas 11 12 13 14 15 Y 8,4 11,1 11,1 13,2 13,4 X 0,058 0,058 0,067 0,080 0,080 Empresas Y X 16 11,5 0,083 17 9,8 0,091 18 16,1 0,092 19 7,0 0,064 20 5,9 0,028 a) Construir o diagrama de dispersão. b) Calcule o coeficiente de correlação de Pearson. c) Estabelecer a equação da reta ajustada. d) Usar a equação obtida pra prever o valor de Y, quando X = $0,070. e) Calcule o coeficiente de determinação. a) xi yi xi . y i x i2 yi2 0,003 0,004 0,009 0,021 0,023 0,030 0,035 0,037 0,044 0,051 0,058 0,058 0,067 0,080 0,080 0,083 0,091 0,092 0,064 0,028 5,6 7,2 8,1 9,9 6,0 8,2 6,3 10,0 8,5 13,2 8,4 11,1 11,1 13,2 13,4 11,5 9,8 16,1 7,0 5,9 0,0168 0,0288 0,0729 0,2079 0,1380 0,2460 0,2205 0,3700 0,3740 0,6732 0,4872 0,6438 0,7437 1,0560 1,0720 0,9545 0,8918 1,4812 0,4480 0,1652 0,000009 0,000016 0,000081 0,000441 0,000529 0,000900 0,001225 0,001369 0,001936 0,002601 0,003364 0,003364 0,004489 0,006400 0,006400 0,006889 0,008281 0,008464 0,004096 0,000784 31,36 51,84 65,61 98,01 36 67,24 39,69 100 72,25 174,24 70,56 123,21 123,21 174,24 179,56 132,25 96,04 259,21 49 34,81 å =0,958 å =190,5 Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br å =10,2915 å =0,061638 å =1978,33 18 Professor Mauricio Lutz b) r= r= n å x i y i - (å x i )( . å yi ) [nå x 2 i ][ - (å x i ) . n å y i2 - (å y i ) 2 2 ( 20 x10,2915) - (0,958 x190,5) = ] [20 x0,061638 - (0,958) ]x[201978,33 - (190,5) ] ( 205,83) - (182,499 ) [1,23276 - 0,917764 ]x[39566,6 - 36290,25] 2 = 23,331 0,314996 x3276,25 2 = 23,331 = 0,7262 32,12533 ( 20 x10,2915) - (0,958 x190,5) 205,83 - 182,499 23,331 = = = 74,0676 2 1,23276 - 0,917764 0,314996 (20 x0,061638 ) - (0,958) c) b = 9,526 - 74,0676 x0,0479 = 9,526 - 3,547838 = 5,9772 a= ^ Isto é: Y = 74,0676 X + 5,9772 d) Quando X = $0,070 temos: ^ Y = 74,0676 X + 5,9772 = 74,0676 x0,070 + 5,9772 = 5,1847 + 5,9772 = 11,1619 e) R 2 = (0,7262) 2 = 0,5274 R 2 = 52,74% Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br