Estatística Aplicada ao Serviço Social Módulo 7: Correlação e Regressão Linear Simples Introdução Coeficientes de Correlação entre duas Variáveis Coeficiente de Correlação Linear Introdução. Regressão linear é encontrar uma de uma reta y = ax + b que mais se aproximar dos pontos conhecidos Correlação mede e avalia o grau de relação existente entre duas variáveis. Regressão Linear Para encontrarmos a equação da regressão linear temos que calcular os parâmetros a e b da equação y = ax + b cujos valores são dados pela expressão: a n.x.y x.y n.x ² ( x )² b y x a. n n Este método é conhecido dos “critério dos mínimos quadrados”. Exemplo: Escrever a equação da reta que aproxima o conjunto de pontos A(0;0), B(1;5), C(2;8) e D(3;9) usando o critério dos mínimos quadrados Solução: é aconselhável fazer um quadro de cálculo para melhor organização e entendimento. ponto x y x.y x² y² A 0 0 0 0 0 B 1 5 5 1 25 C 2 8 16 4 64 D 3 9 27 9 81 6 22 48 14 170 Total () Substituindo nas expressões de a e b temos: a 4.48 6.22 60 3 4.14 6² 20 b 22 9 3. 1 4 4 Portanto a equação que melhor se ajusta aos pontos é y = 3x + 1 Correlação linear (r) Para medirmos o grau de correlacionamento linear entre as variáveis, existe a expressão abaixo conhecida como “Coeficiente de Correlação Linear de Pearson” que será representado por “rxy” ou simplesmente pela letra “r” e sua expressão é: rxy n.x.y x.y (n.x² (x)²).(n.y² (y)²) Exemplo: Encontrar o correlação linear entre os pontos A(0;0), B(1;5), C(2;8) e D(3;9) usando o Coeficiente de Correlação Linear de Pearson Solução: é aconselhável fazer um quadro de cálculo para melhor organização e entendimento. Como os pontos são os mesmo do exemplo anterior vamos aproveitar os resultados ( a inclusão da coluna de y² no quadro do exemplo anterior é para será usada neste exemplo). 4 . 48 6 . 22 r xy ( 4 . 14 6 ²).( 4 . 170 22 ² ) 0,96 Poder explicativo do modelo R² Indica a qualidade do ajuste da reta da regressão linear aos valores de x e y. Se R²= 1 = 100% indica que a reta da regressão linear explica 100%das variações de Y. Se R² = 0,60 = 60%, isto significa 60% das variações de Y são explicadas por X e o restante 40% são explicadas por outras variáveis. O poder explicativo é calculado fazendo-se: R² = r²xy Exemplo: Determinar o poder explicativo entre os valores de x e y para os pontos e dê o significado para os pontos A(0;0), B(1;5), C(2;8) e D(3;9). Solução: Usando os resultados encontrados nos exemplo anteriores deste módulo temos: R² = 0,96² = 0,92 ou 92% Significado: 92% das variações de Y são explicadas por X. Podemos fazer uma representação gráfica para os pontos A(0;0), B(1;5), C(2;8) e D(3;9) tratados nos exemplo deste módulo. 12 y = 3x + 1 10 R = 0,92 2 8 6 4 2 0 0 2 4 Interpretação do coeficiente de correlação linear Correlação Linear Positiva A correlação será considerada positiva se valores crescentes de X estiverem associados a valores crescentes de Y, ou valores decrescentes de X estiverem associados a valores decrescentes da variável Y. No primeiro gráfico o valor de r está entre zero e +1, já no segundo r = 1 ( neste caso chamamos de correlação linear positiva perfeita pois todos os pontos estão alinhados) Correlação Negativa A correlação é considerada negativa quando valores crescentes da variável X estiverem associados a valores decrescentes da variável Y, ou valores decrescentes de X associados a valores crescentes da variável Y. No primeiro gráfico o valor de r está entre zero e -1, já no segundo r = -1 (neste caso chamamos de correlação linear negativa perfeita pois todos os pontos estão alinhados Correlação Nula Quando não houver relação entre as variáveis X e ou seja, quando as variações de X e Y ocorrerem independentemente não existe correlação entre elas (r = 0). Os diagramas mostram que a correlação será tanto mais forte quanto mais próximos estiver o resultado de ±1, e será tanto mais fraca quanto mais próximo resultado estiver de zero. Exercício Resolvido - 1 A sociabilidade pode ser expressa de diversas maneiras, inclusive fazendo-se muitos amigos e realizando-se encontros frequentes. Um pesquisador interrogou uma amostra de quatro alunos de uma faculdade sobre (X) quantos bons amigos eles têm e (Y) quantas vezes se encontraram no mês anterior. O resultado é apresentado pela tabela: Aluno A B C D X 2 1 5 3 Y 5 4 3 1 Determine a equação de regressão linear (Y = aX + b) para o resultado da pesquisa. Solução: Primeiramente vamos montar um quadro auxiliar de cálculo. Y x² Aluno X X.Y 5 4 A 2 10 4 1 B 1 4 3 25 C 5 15 1 9 D 3 3 13 39 Total 11 32 Calculando os parâmetros a e b da equação n.x.y x.y y x b a. n.x ² (x )² n n 4.32 11.13 15 3 a 0,429 4.39 11² 35 7 a b 13 3 11 31 . 4,429 4 7 4 7 Portanto a equação é Y = -0,429X + 4,429 ou Y = (-3X + 31)/7 Exercício Resolvido - 2 A sociabilidade pode ser expressa de diversas maneiras, inclusive fazendo-se muitos amigos e realizando-se encontros frequentes. Um pesquisador interrogou uma amostra de quatro alunos de uma faculdade sobre (X) quantos bons amigos eles têm e (Y) quantas vezes se encontraram no mês anterior. O resultado é apresentado pela tabela: Aluno A B C D X 2 1 5 3 Y 5 4 3 1 Determine o coeficiente de correlação linear de Pearson. Solução: Primeiramente vamos montar um quadro auxiliar de cálculo. Y x² Aluno X X.Y 5 4 A 2 10 4 1 B 1 4 3 25 C 5 15 1 9 D 3 3 13 39 Total 11 32 Calculando os parâmetros a e b da equação rxy rxy n.x.y x.y (n.x ² (x )²).(n.y ² (y )²) 4.32 13.11 ( 4.39 11 ²).(4.49 13²) 0,429 Y² 25 14 9 1 49 Exercício Resolvido - 3 Calcule o poder explicativo R² do exercício anterior e escreva significado Solução: R² = r²xy = (-0,429)² = 0,184 ou 18,4% A dependência entre os valores de x e y é de 18,4% Exercícios propostos Exercício 1 Preparando-se para um exame, alunos de uma turma estudaram mais que os outros. Relaciona-se a seguir as notas em um exame de 10 pontos e as horas de estudo Aluno A B C D E Horas (X) 4 1 8 5 7 Nota (Y) 5 2 9 6 8 Determine a equação de regressão linear (Y = aX + b) de acordo com resultados obtidos. Exercício 2 Preparando-se para um exame, alunos de uma turma estudaram mais que os outros. Relaciona-se a seguir as notas em um exame de 10 pontos e as horas de estudo Aluno A B C D E Horas (X) 4 1 8 5 7 Nota (Y) 5 2 9 6 8 Determine o coeficiente de correlação linear de Pearson. Exercício 3 Preparando-se para um exame, alunos de uma turma estudaram mais que os outros. Relaciona-se a seguir as notas em um exame de 10 pontos e as horas de estudo Aluno A B C D E Horas (X) 4 1 8 5 7 Nota (Y) 5 2 9 6 8 Determine o poder explicativo e escreva o seu significado. Exercício 4 A sociabilidade pode ser expressa de diversas maneiras, inclusive fazendo-se muitos amigos e realizando-se encontros frequentes. Um pesquisador interrogou uma amostra de quatro alunos de uma faculdade sobre (X) quantos bons amigos eles têm e (Y) quantas vezes se encontraram no mês anterior. O resultado é apresentado pela tabela: Aluno A B C D X 2 1 5 3 Y 5 4 3 1 A correlação entre os valor de X e Y é: a) negativa b) positiva c) nula d) maior 1 e) maior que 10 Referência bibliográfica: Bibliografia básica e complementar da disciplina