1 Professor Mauricio Lutz CORRELAÇÃO Em muitas situações, torna-se interessante e útil estabelecer uma relação entre duas ou mais variáveis. A matemática estabelece vários tipos de relações entre variáveis, por exemplo, as relações funcionais e as correlações. Relações Funcionais São relações matemáticas expressas por sentenças matemáticas, como por exemplo: • Área do retângulo (A=a.b) é a relação entre os lados do retângulo; • Densidade de massa (dm= m/v) é a relação entre a massa e o volume de um corpo; • Perímetro de uma circunferência (C=2πR) é a relação entre o comprimento da circunferência e o valor do raio. Relações Estatísticas e Correlações São relações estabelecidas após uma pesquisa. Com base nos resultados da pesquisa, são feitas comparações que eventualmente podem conduzir (ou não) à ligação entre as variáveis. Exemplo: relação entre a idade e a estatura de uma criança, ou a relação entre a classe social de uma pessoa e o número de viagens por ela realizado. No estudo estatístico, a relação entre duas ou mais variáveis denominase correlação. A utilidade e importância das correlações entre duas variáveis podem conduzir à descoberta de novos métodos, cujas estimativas são vitais em tomadas de decisões. Em outras palavras quando duas variáveis estão ligadas por uma relação estatística, dizemos que existe correlação entre elas. 1) Diagrama de dispersão O diagrama de dispersão é um gráfico cartesiano em que cada um dos eixos corresponde às variáveis correlacionadas. A variável dependente (Y) situa-se no eixo vertical e o eixo das abscissas é reservado para a variável independente (X). Os pares ordenados formam uma nuvem de pontos. A configuração geométrica do diagrama de dispersão pode estar associada a uma linha reta (correlação linear), uma linha curva (correlação curvilínea) ou, ainda, ter Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 2 Professor Mauricio Lutz os pontos dispersos de maneira que não definam nenhuma configuração linear; nesta última situação, não há correlação. 100 100 50 50 0 0 0 5 10 Correlação Linear 0 5 10 Correlação Curvilínea 2) Correlação Linear Correlação linear é uma correlação entre duas variáveis, cujo gráfico aproxima-se de uma linha. É uma linha de tendência, porque procura acompanhar a tendência da distribuição de pontos, que pode corresponder a uma reta ou a uma curva. Por outro lado, é, também, uma linha média, porque procura deixar a mesma quantidade de pontos abaixo e acima da linha. Correlação linear positiva Correlação linear negativa Não há correlação Para definir se a correlação entre as variáveis corresponde a uma linha reta ou a uma curva, pode-se utilizar modos qualitativos ou quantitativos. No modo qualitativo, vai imperar o “bom senso” do pesquisador para verificar qual o grau de intensidade na correlação entre as variáveis; isso significa o estabelecimento de uma relação numérica que medirá o nível da correlação. Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 3 Professor Mauricio Lutz 3) Coeficiente de Correlação Linear O instrumento empregado para a medida da correlação linear é o coeficiente de correlação. Este coeficiente deve indicar o grau de intensidade de correlação entre duas variáveis e, ainda, o sentido dessa correlação (positiva ou negativa). Uma das formas de medir o coeficiente de correlação linear foi desenvolvido por Pearson e recebe o nome de coeficiente de correlação de Pearson. O coeficiente de correlação de Pearson mede o grau de ajustamento dos valores em torno de uma reta. Coeficiente de Correlação de Pearson (r): r= nå xi y i - (å xi )( . å yi ) [nå x 2 i ][ - (å xi ) . nå y i2 - (å y i ) 2 2 ] onde temos: r é o coeficiente de Pearson; n é o número de observações; xi é a variável independente; yi é a variável dependente. O valor do coeficiente de correlação r tem a variação entre +1 e –1, ou seja, está limitado entre os valores do Intervalo[–1,+1]. • r = +1 (correlação positiva entre as variáveis); • r = –1 (correlação perfeita negativa entre as variáveis); • r = 0 (não há correlação entre as variáveis ou, ainda, a correlação não é linear, caso exista). Quanto mais próximo o valor de r estiver do valor “1”, mais forte a correlação linear. Quanto mais próximo o valor de r estiver do valor “0”, mais fraca a correlação linear. Em geral, multiplica-se o valor de r por 100; dessa forma, o resultado passa a ser expresso em porcentagem. Na prática, estabelecem-se critérios para verificar os diversos níveis do fraco ao forte, chegando até o perfeito: • 0 < |r| < 0,3 : a correlação é fraca e fica difícil estabelecer relação entre as variáveis. Em porcentagem: 0% < |r| < 30%; Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 4 Professor Mauricio Lutz • 0,3 ≤ |r| < 0,6 : a correlação é fraca, porém, podemos considerar a existência de relativa correlação entre as variáveis. Em porcentagem: 30% ≤ |r| < 60%; • 0,6 ≤ |r| < 1 : a correlação é de média para forte; a relação entre as variáveis é significativa, o que permite coerência com poucos conflitos na obtenção das conclusões. Em porcentagem: 60% ≤ |r| ≤ 100%. 4) Teste de hipótese para a existência de correlação Para aplicar o teste de hipótese para existência de correlação linear, é necessário que as variáveis populacionais (X, Y) tenham distribuição normal bivariada. Quando as amostras forem superiores a 30, a hipótese de normalidade das duas variáveis é razoavelmente atendida. O coeficiente de correlação linear da população (X, Y) é designado ρ (ler Rô). Se o teste indicar a rejeição da hipótese r = 0 , poderemos concluir que existe correlação entre as variáveis ao nível de significância admitido. Eis o procedimento para realizar o teste: (1) H0: r = 0 H1: r ¹ 0 (2) Fixar ∝ e escolher uma distribuição t de Student com j = n - 2 graus de liberdade. (3) Determinar as regiões de rejeição e aceitação para H0, com auxilio da tabela t de Student. (4) Calculo do valor da variável: t cal = (5) Conclusão: Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br r n-2 1- r2 5 Professor Mauricio Lutz Se t cal > t a ou t cal > -t a , rejeita-se H0, concluindo, com risco ∝, que há 2 2 correlação entre as variáveis. Se - t a £ t cal £ t a , não se pode rejeita-se H0, concluindo que há 2 2 correlação entre as variáveis. Exemplos: a) Uma pesquisa pretende verificar se há correlação significativa entre o peso total do lixo descartado, por dia, numa empresa com o peso do papel contido nesse lixo. Hotel H1 H2 H3 H4 H5 H6 H7 H8 H9 H10 Peso total 10,47 19,85 21,25 24,36 27,38 28,09 33,61 35,73 38,33 49,14 Peso do papel 2,43 5,12 6,88 6,22 8,84 8,76 7,54 8,47 9,55 11,43 De acordo com os dados, fazemos a representação gráfica. Os pares ordenados formam o diagrama de dispersão. Correlação entre o peso total do lixo descartado e o peso do papel contido nesse lixo Para se verificar o grau de correlação entre as variáveis, calcula-se o coeficiente de correlação linear pela fórmula do coeficiente de correlação de Pearson: r= Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br nå xi y i - (å xi )( . å yi ) [nå x 2 i ][ - (å xi ) . nå y i2 - (å y i ) 2 2 ] 6 Professor Mauricio Lutz Para facilitar o cálculo construímos a seguinte tabela: xi . y i x i2 2,43 25,44 109,62 5,90 5,12 101,63 394,02 26,21 21,25 6,88 146,20 451,56 47,33 H4 24,36 6,22 151,52 593,41 38,69 H5 27,38 8,84 242,04 749,66 78,15 H6 28,09 8,76 246,07 789,05 76,74 H7 33,61 7,54 253,42 1129,63 56,85 H8 35,73 8,47 302,63 1276,63 71,74 H9 38,33 9,55 366,05 1469,19 91,20 H10 49,14 11,43 561,67 2414,74 130,64 288,21 75,24 2396,68 9377,52 623,47 Peso total ( xi ) Peso do papel ( y i ) H1 10,47 H2 19,85 H3 å r= r= r= n å xi yi - (å xi )( . å yi ) [nå x 2 i ][ - (å xi ) . n å yi2 - (å yi ) 2 2 yi2 ] (10 x 2396,68) - ( 288,21x 75,24) [10 x9377,52 - (288,21) ]x[10 x623,47 - (75,24) ] 2 2 ( 23966,8) - ( 21684,9) 2281,83 = = 0,9206 [93775,2 - 83065]x[6234,7 - 5661,06] 2478,57 r = 0,9206 ou r = 92,06 % Observamos, assim: 0,6 ≤ r ≤ 1 . Esse resultado indica que há uma forte correlação entre as variáveis ou, ainda, que a correlação entre as duas variáveis é bastante significativa. Nesse caso, podemos concluir haver coerência na afirmação de que existe correlação entre o peso total do lixo descartado e o peso do papel contido nesse lixo. (1) Realizando o teste de hipótese com um ∝=5% temos: H0: r = 0 H1: r ¹ 0 (2) a = 5% e Graus de liberdade: j = n - 2 = 10 - 2 = 8 Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 7 Professor Mauricio Lutz (3) Regiões de rejeição e aceitação para H0. (4) Cálculo do valor da variável: t cal = r n-2 1- r2 = 0,9206 10 - 2 1 - (0,9206) 2 = 2,6039 = 6,6679 0,3905 (5) Conclusão: Como t cal > 2,3060 , rejeita-se H0, concluindo, com riso de 5%, que há correlação entre o peso total de lixo descartada com o peso total de papel contido neste lixo, ou ainda, existe uma correlação positiva entre X e Y, significa que as variáveis são diretamente proporcionais, portando quanto maior o lixo produzido maior será a quantidade de papel contida neste lixo. b) Consideremos uma amostra aleatória, formada por dez dos 98 alunos de uma classe da faculdade A e pelas notas obtidas por eles em matemática e estatística: Notas Números Matemática ( xi ) Estatística ( y i ) 01 5,0 6,0 08 8,0 9,0 24 7,0 8,0 38 10,0 10,0 44 6,0 5,0 58 7,0 7,0 59 9,0 8,0 72 3,0 4,0 80 8,0 6,0 92 2,0 2,0 Vamos verificar a correlação primeiro fazendo um diagrama de dispersão: Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 8 Professor Mauricio Lutz Correlação entre as notas de matemática e estatística Números Notas xi . y i x i2 yi2 Matemática ( xi ) Estatística ( y i ) 01 5,0 6,0 30 25 36 08 8,0 9,0 72 64 81 24 7,0 8,0 56 49 64 38 10,0 10,0 100 100 100 44 6,0 5,0 30 36 25 58 7,0 7,0 49 49 49 59 9,0 8,0 72 81 64 72 3,0 4,0 12 9 16 80 8,0 6,0 48 64 36 92 2,0 2,0 4 4 4 65 65 473 481 475 å r= r= r= n å xi y i - (å x i )( . å yi ) [nå x 2 i ][ - (å xi ) . n å y i2 - (å y i ) 2 2 ] (10 x 473) - (65 x 65) [10 x481 - (65) ]x[10 x475 - (65) ] 2 ( 4730 ) - ( 4225) [4810 - 4225]x[4750 - 4225] 2 = 505 585 x525 = 505 = 0,9112 554,18 Portanto r = 0,9112 ou r = 92,12% , o que resulta uma correlação positiva altamente significativa entre as duas variáveis. (1) Realizando o teste de hipótese com um ∝=5% temos: H0: r = 0 H1: r ¹ 0 Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 9 Professor Mauricio Lutz (2) a = 5% e Graus de liberdade: j = n - 2 = 10 - 2 = 8 (3) Regiões de rejeição e aceitação para H0. (4) Cálculo do valor da variável: t cal = r n-2 1- r2 = 0,9112 10 - 2 1 - (0,9112) 2 = 2,5773 = 6,2560 0,4120 (5) Conclusão: Como t cal > 2,3060 , rejeita-se H0, concluindo, com riso de 5%, que há correlação entre as notas de matemática e estatística, ou ainda, existe uma correlação positiva entre X e Y, significa que as variáveis são diretamente proporcionais, portando quanto maior a nota de matemática maior será a nota de estatística. Exercícios 1)Complete o esquema de cálculo do coeficiente de correlação para os valores das variáveis xi e y i : xi 4 6 8 10 12 yi 12 10 8 12 14 Temos: xi yi xi . y i x i2 yi2 4 ........ ........ ........ 12 12 ........ ........ ........ 14 48 ........ ........ ........ 168 16 ........ ........ ........ 144 144 ........ ........ ........ 196 å =........ å =........ å =........ å =........ å =........ Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 10 Professor Mauricio Lutz Logo: r= r= (........ x........) - (........ x........) [........ x........ - ........]x[........ x........ - ........] ........ - ........ [........ - ........]x[........ - ........] = ........ ........ x........ = ........ = ........ ........ Donde r = 0,42 . A correlação linear entre as variáveis x e y é positiva, porém fraca. 2) Correlacionar os valores de produção leiteira e o teor de gordura de animais bovinos da fazenda Pica Pau Amarelo. Produção (kg) Teor de Gordura (%) 10 6,0 12 5,7 14 5,3 17 5,2 19 5,0 22 4,7 25 4,5 3) Para os dados abaixo: a) Desenhe o diagrama de dispersão; b) Calcule o coeficiente de correlação de Pearson e interprete. c) Teste o coeficiente encontrado na letra b). Concentração Protombina no Plasma (x) Tempo de coagulação em segundos (y) 5 70 10 40 20 27 30 22 40 18 50 16 60 15 70 14 80 13 90 12 Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 11 Professor Mauricio Lutz 4) Uma amostra revelou o coeficiente de correlação entre o salário e o número de anos de escolaridade para um grupo de 60 pessoas é de 0,78. Teste a hipótese de existência de correlação entre essas variáveis, ao nível de 5%. 5) Sessenta e quatro estudantes foram submetidos a dois testes: raciocínio lógico e quantitativo e conhecimentos gerais. Dos escores obtidos, foram calculadas as somas: å X = 169 ; å Y = 327 ; å X 2 = 1450 ; åY 2 = 2304 ; å XY = 837 . a)Determine o coeficiente de correlação. b) Ao nível de significância de 5%, testar a existência de correlação. 6) A tabela a seguir expressa os pesos e as alturas de 30 crianças: Peso (kg) 30 32 24 30 26 35 25 23 35 31 29 28 25 29 30 Altura (cm) 145 150 125 157 127 140 132 107 155 145 140 142 130 135 138 Peso (kg) 31 32 33 25 26 28 29 30 31 35 34 33 32 28 30 Altura (cm) 140 150 157 144 145 147 150 152 150 160 149 150 129 130 140 Ao nível de 5%, podemos afirmar que há correlação entre os pesos e as alturas? 7) Um grupo de pessoas fez uma avaliação do peso aparente de alguns objetos. Com o peso real e a média dos pesos aparentes, dados pelo grupo, obteve-se a tabela: Peso Real 18 30 42 62 73 97 120 Peso Aparente 10 23 33 60 91 98 159 Calcule o índice de correlação. 8) Considere os resultados de dois testes, X e Y, obtidos por um grupo de alunos da escola A: xi 11 14 19 19 22 28 30 31 34 37 yi 13 14 18 15 22 17 24 22 24 25 a) Verifique, pelo diagrama, se existe correlação retilínea. b) Em caso afirmativo, calcule o coeficiente de correlação. c) Escreva em poucas linhas, as conclusões a que chegou sobre a relação entre essas variáveis. d) Ao nível de significância de 5%, testar a existência de correlação. Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 12 Professor Mauricio Lutz Gabarito 1)Complete o esquema de cálculo do coeficiente de correlação para os valores das variáveis xi e y i : xi 4 6 8 10 12 yi 12 10 8 12 14 Temos: xi yi xi . y i x i2 yi2 4 6 8 10 12 12 10 8 12 14 48 60 64 120 168 16 36 64 100 144 144 100 64 144 196 å =40 å =56 å =460 å =360 å =648 Logo: r= r= (5 x 460) - ( 40 x56) [5x360 - (40) ]x[5x648 - (56) ] 2 2 2300 - 2240 [1800 - 1600]x[3240 - 3136 ] = 60 200 x104 = 60 = 0,42 144,22 Donde r = 0,42 . A correlação linear entre as variáveis x e y é positiva, porém fraca. 2) Correlacionar os valores de produção leiteira e o teor de gordura de animais bovinos da fazenda Pica Pau Amarelo. Produção (kg) Teor de Gordura (%) xi . y i x i2 yi2 10 6,0 60 100 36 12 5,7 68,4 144 32,49 14 5,3 74,2 196 28,09 17 5,2 88,4 289 27,04 19 5,0 95 361 25 22 4,7 103,4 484 22,09 25 4,5 112,5 625 20,25 å =119 å =36,4 å =601,9 å =2199 å =190,96 Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 13 Professor Mauricio Lutz r= r= (7 x 601,9) - (119 x36,4) [7 x2199 - (119) ]x[7 x190,96 - (36,4) ] 2 2 4213,3 - 4331,6 [15393 - 14161]x[1336,72 - 1324,96] = - 118,3 1232 x11,76 = - 118,3 = -0,9828 120,37 Existe uma forte correlação negativa entre x e y, significa que as variáveis são inversamente proporcionais, ou seja, quanto mais leite produz a vaca menor o teor de gordura do leite. 3) Para os dados abaixo: a) Desenhe o diagrama de dispersão; b) Calcule o coeficiente de correlação de Pearson e interprete. c) Teste o coeficiente encontrado na letra b). Concentração Protombina no Tempo de coagulação Plasma (x) em segundos (y) 5 xi . y i x i2 yi2 70 350 25 4900 10 40 400 100 1600 20 27 540 400 729 30 22 660 900 484 40 18 720 1600 324 50 16 800 2500 256 60 15 900 3600 225 70 14 980 4900 196 80 13 1040 6400 169 90 12 1080 8100 144 å =455 å =247 a) Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br å =7470 å =28525 å =9027 14 Professor Mauricio Lutz b) r= r= (10 x7470 ) - ( 455 x 247 ) [10 x28525 - (455) ]x[10 x9027 - (247 ) ] 2 74700 - 112385 2 [285250 - 207025]x[90270 - 61000 ] = - 37685 78225 x 29261 = - 37685 = -0,7877 47842,89 Existe uma correlação negativa entre x e y, significa que as variáveis são inversamente proporcionais, ou seja, quanto maior a concentração de protombina menor é o tempo de coagulação. c) Realizando o teste de hipótese com um ∝=5% temos: (1) H0: r = 0 H1: r ¹ 0 (2) a = 5% e Graus de liberdade: j = n - 2 = 10 - 2 = 8 (3) Regiões de rejeição e aceitação para H0. (4) Cálculo do valor da variável: t cal = r n-2 1- r2 = - 0,7877 10 - 2 1 - (-0,7877) 2 = - 2,2279 = -3,6163 0,6162 (5) Conclusão: Como t cal > 2,3060 , rejeita-se H0, concluindo, com riso de 5%, que há correlação entre a concentração protombina no plasma e tempo de coagulação. 4) Uma amostra revelou o coeficiente de correlação entre o salário e o número de anos de escolaridade para um grupo de 60 pessoas é de 0,78. Teste a hipótese de existência de correlação entre essas variáveis, ao nível de 5%. Realizando o teste de hipótese com um ∝=5% temos: (1) H0: r = 0 H1: r ¹ 0 (2) a = 5% e Graus de liberdade: j = n - 2 = 60 - 2 = 58 Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 15 Professor Mauricio Lutz (3) Regiões de rejeição e aceitação para H0. (4) Cálculo do valor da variável: t cal = r n-2 1- r 2 = 0,78 60 - 2 1 - (0,78) 2 = 5,9403 = 9,4926 0,6258 (5) Conclusão: Como t cal > 2,0017 , rejeita-se H0, concluindo, com riso de 5%, que há correlação entre o salário e o número de anos de escolaridade. 5) Sessenta e quatro estudantes foram submetidos a dois testes: raciocínio lógico e quantitativo e conhecimentos gerais. Dos escores obtidos, foram calculadas as somas: å X = 169 ; å Y = 327 ; å X 2 = 1450 ; åY 2 = 2304 ; å XY = 837 . a)Determine o coeficiente de correlação. b) Ao nível de significância de 5%, testar a existência de correlação. a) (64 x837 ) - (169 x327 ) r= 2 2 64 x1450 - (169 ) x 64 x 2304 - (327 ) [ r= ][ 53568 - 55263 [92800 - 28561]x[147456 - 106929 ] ] = - 1695 64239 x 40527 r = -3,322% Realizando o teste de hipótese com um ∝=5% temos: (1) H0: r = 0 H1: r ¹ 0 (2) a = 5% e Graus de liberdade: j = n - 2 = 64 - 2 = 62 (3) Regiões de rejeição e aceitação para H0. Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br = - 1695 = -0,03322 51023,6607 16 Professor Mauricio Lutz (4) t cal = Cálculo r n-2 1- r2 = do - 0,03322 64 - 2 1 - (-0,03322) 2 valor da variável: - 0,26157 = -0,2617 0,99945 = (5) Conclusão: Como t cal < 2,0017 , aceita-se H0, concluindo, com riso de 5%, que não há correlação entre os testes raciocínio lógico e quantitativo e conhecimentos gerais. 6) A tabela a seguir expressa os pesos e as alturas de 30 crianças: Peso (kg) 30 32 24 30 26 35 25 23 35 31 29 28 25 29 30 Altura (cm) 145 150 125 157 127 140 132 107 155 145 140 142 130 135 138 Peso (kg) 31 32 33 25 26 28 29 30 31 35 34 33 32 28 30 Altura (cm) 140 150 157 144 145 147 150 152 150 160 149 150 129 130 140 Ao nível de 5%, podemos afirmar que há correlação entre os pesos e as alturas? Peso Altura (x) (y) xi . y i x i2 yi2 Peso (x) Altura (y) xi . y i x i2 yi2 30 145 4350 900 21025 31 140 4340 961 19600 32 150 4800 1024 22500 32 150 4800 1024 22500 24 125 3000 576 15625 33 157 5181 1089 24649 30 157 4710 900 24649 25 144 3600 625 20736 26 127 3302 676 16129 26 145 3770 676 21025 35 140 4900 1225 19600 28 147 4116 784 21609 25 132 3300 625 17424 29 150 4350 841 22500 23 107 2461 529 11449 30 152 4560 900 23104 35 155 5425 1225 24025 31 150 4650 961 22500 31 145 4495 961 21025 35 160 5600 1225 25600 29 140 4060 841 19600 34 149 5066 1156 22201 28 142 3976 784 20164 33 150 4950 1089 22500 25 130 3250 625 16900 33 129 4257 1089 16641 29 135 3915 841 18225 28 130 3640 784 16900 30 138 4140 900 19044 30 140 4200 900 19600 å =890 å =4261 å =127164 å =26736 å =609049 Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 17 Professor Mauricio Lutz Ao nível de significância de 5%, testar a existência de correlação. a) r= r= (30 x127164 ) - (890 x 4261) [30 x 26736 - (890 ) ]x[30 x609049 - (4261) ] 2 22630 9980 x11549 = 2 3814920 - 3792290 = [802080 - 792100 ]x[18271470 - 18156121] 22630 = 0,667 33929,08811 Realizando o teste de hipótese com um ∝=5% temos: (1) H0: r = 0 H1: r ¹ 0 (2) a = 5% e Graus de liberdade: j = n - 2 = 30 - 2 = 28 (3) Regiões de rejeição e aceitação para H0. (4) Cálculo do valor da variável: t cal = r n-2 1- r2 = 0,667 30 - 2 1 - (0,667) 2 = 3,5294 = 4,7371 0,7451 (5) Conclusão: Como t cal > 2,0484 , rejeita-se H0, concluindo, com riso de 5%, que há correlação linear entre os pesos e as alturas das 30 crianças avaliadas. 7) Um grupo de pessoas fez uma avaliação do peso aparente de alguns objetos. Com o peso real e a média dos pesos aparentes, dados pelo grupo, obteve-se a tabela: Peso Real 18 30 42 62 73 97 120 Peso Aparente 10 23 33 60 91 98 159 Calcule o índice de correlação. Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br 18 Professor Mauricio Lutz r= r= Peso real (x) Peso aparente (y) xi . y i x i2 yi2 18 10 180 324 100 30 23 690 900 529 42 33 1386 1764 1089 62 60 3720 3844 3600 73 91 6643 5329 8281 97 98 9506 9409 9604 120 159 19080 14400 25281 å =442 å =474 å =41205 å =35970 å =48484 (7 x 41205) - ( 442 x 474) [7 x35970 - (442 ) ]x[7 x48484 - (474 ) ] 2 78927 56426 x114712 = 2 = 288435 - 209508 [251790 - 195364 ]x[339288 - 224676 ] 78927 = 0,9810 8045,336 8) Considere os resultados de dois testes, X e Y, obtidos por um grupo de alunos da escola A: xi 11 14 19 19 22 28 30 31 34 37 yi 13 14 18 15 22 17 24 22 24 25 a) Verifique, pelo diagrama, se existe correlação retilínea. b) Em caso afirmativo, calcule o coeficiente de correlação. c) Escreva em poucas linhas, as conclusões a que chegou sobre a relação entre essas variáveis. d) Ao nível de significância de 5%, testar a existência de correlação. xi yi 11 14 xi . y i x i2 yi2 13 143 121 169 14 196 196 196 19 18 342 361 324 19 15 285 361 225 22 22 484 484 484 28 17 476 784 289 30 24 720 900 576 31 22 682 961 484 34 24 816 1156 576 37 25 925 1369 625 å =245 å =194 Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br å =5069 å =6693 å =3948 19 Professor Mauricio Lutz a) b) r= r= (10 x5069 ) - ( 245 x194) [10 x6693 - (245) ]x[10 x3948 - (194 ) ] 2 3160 6905 x1844 = 2 = 50690 - 47530 [66930 - 60025]x[9480 - 37636 ] 3160 = 0,8856 3568,308 c) Existe uma correlação positiva entre os testes x e y, significa que as variáveis são diretamente proporcionais. d) Realizando o teste de hipótese com um ∝=5% temos: (1) H0: r = 0 H1: r ¹ 0 (2) a = 5% e Graus de liberdade: j = n - 2 = 10 - 2 = 8 (3) Regiões de rejeição e aceitação para H0. (4) Cálculo do valor da variável: t cal = r n-2 1- r2 = 0,8856 10 - 2 1 - (0,8856) 2 = 2,5048 = 5,3924 0,4645 (5) Conclusão: Como t cal > 2,3060 , rejeita-se H0, concluindo, com riso de 5%, que há correlação entre os teste x e y. Instituto Federal farroupilha Campus Alegrete RS – 377 km 27 – Passo Novo Alegrete - RS Fone/Fax: (55) 3421-9600 www.al.iffarroupilha.edu.br