Estatística Aplicada ao Serviço Social
Módulo 7: Correlação e Regressão Linear Simples
Introdução
Coeficientes de Correlação entre duas Variáveis
Coeficiente de Correlação Linear
Introdução.
Regressão linear é encontrar uma de uma reta y = ax + b que mais se
aproximar dos pontos conhecidos
Correlação mede e avalia o grau de relação existente entre duas variáveis.
Regressão Linear
Para encontrarmos a equação da regressão linear temos que calcular os
parâmetros a e b da equação y = ax + b cujos valores são dados pela
expressão:
a
n.x.y  x.y
n.x ²  ( x )²
b
y
x
 a.
n
n
Este método é conhecido dos “critério dos mínimos quadrados”.
Exemplo: Escrever a equação da reta que aproxima o conjunto de pontos
A(0;0), B(1;5), C(2;8) e D(3;9) usando o critério dos mínimos quadrados
Solução: é aconselhável fazer um quadro de cálculo para melhor organização
e entendimento.
ponto
x
y
x.y
x²
y²
A
0
0
0
0
0
B
1
5
5
1
25
C
2
8
16
4
64
D
3
9
27
9
81
6
22
48
14
170
Total ()
Substituindo nas expressões de a e b temos:
a
4.48  6.22 60

3
4.14  6²
20
b
22
9
 3.  1
4
4
Portanto a equação que melhor se ajusta aos pontos é y = 3x + 1
Correlação linear (r)
Para medirmos o grau de correlacionamento linear entre as variáveis, existe a
expressão abaixo conhecida como “Coeficiente de Correlação Linear de
Pearson” que será representado por “rxy” ou simplesmente pela letra “r” e sua
expressão é:
rxy 
n.x.y  x.y
(n.x²  (x)²).(n.y²  (y)²)
Exemplo: Encontrar o correlação linear entre os pontos A(0;0), B(1;5), C(2;8) e
D(3;9) usando o Coeficiente de Correlação Linear de Pearson
Solução: é aconselhável fazer um quadro de cálculo para melhor organização
e entendimento. Como os pontos são os mesmo do exemplo anterior vamos
aproveitar os resultados ( a inclusão da coluna de y² no quadro do exemplo
anterior é para será usada neste exemplo).
4 . 48  6 . 22
r xy 
( 4 . 14  6 ²).( 4 . 170  22 ² )
 0,96
Poder explicativo do modelo R²
Indica a qualidade do ajuste da reta da regressão linear aos valores de x e y.
Se R²= 1 = 100% indica que a reta da regressão linear explica 100%das
variações de Y. Se R² = 0,60 = 60%, isto significa 60% das variações de Y são
explicadas por X e o restante 40% são explicadas por outras variáveis.
O poder explicativo é calculado fazendo-se:
R² = r²xy
Exemplo: Determinar o poder explicativo entre os valores de x e y para os
pontos e dê o significado para os pontos A(0;0), B(1;5), C(2;8) e D(3;9).
Solução: Usando os resultados encontrados nos exemplo anteriores deste
módulo temos:
R² = 0,96² = 0,92 ou 92%
Significado: 92% das variações de Y são explicadas por X.
Podemos fazer uma representação gráfica para os pontos A(0;0), B(1;5), C(2;8)
e D(3;9) tratados nos exemplo deste módulo.
12
y = 3x + 1
10
R = 0,92
2
8
6
4
2
0
0
2
4
Interpretação do coeficiente de correlação linear
Correlação Linear Positiva
A correlação será considerada positiva se valores crescentes de X estiverem
associados a valores crescentes de Y, ou valores decrescentes de X estiverem
associados a valores decrescentes da variável Y.
No primeiro gráfico o valor de r está entre zero e +1, já no segundo r = 1 ( neste
caso chamamos de correlação linear positiva perfeita pois todos os pontos
estão alinhados)
Correlação Negativa
A correlação é considerada negativa quando valores crescentes da variável X
estiverem associados a valores decrescentes da variável Y, ou valores
decrescentes de X associados a valores crescentes da variável Y.
No primeiro gráfico o valor de r está entre zero e -1, já no segundo r = -1 (neste
caso chamamos de correlação linear negativa perfeita pois todos os pontos
estão alinhados
Correlação Nula
Quando não houver relação entre as variáveis X e ou seja, quando as
variações de X e Y ocorrerem independentemente não existe correlação entre
elas (r = 0).
Os diagramas mostram que a correlação será tanto mais forte quanto mais
próximos estiver o resultado de ±1, e será tanto mais fraca quanto mais
próximo resultado estiver de zero.
Exercício Resolvido - 1
A sociabilidade pode ser expressa de diversas maneiras, inclusive fazendo-se
muitos amigos e realizando-se encontros frequentes. Um pesquisador
interrogou uma amostra de quatro alunos de uma faculdade sobre (X) quantos
bons amigos eles têm e (Y) quantas vezes se encontraram no mês anterior. O
resultado é apresentado pela tabela:
Aluno
A
B
C
D
X
2
1
5
3
Y
5
4
3
1
Determine a equação de regressão linear (Y = aX + b) para o resultado da
pesquisa.
Solução:
Primeiramente vamos montar um quadro auxiliar de cálculo.
Y
x²
Aluno
X
X.Y
5
4
A
2
10
4
1
B
1
4
3
25
C
5
15
1
9
D
3
3
13
39
Total
11
32
Calculando os parâmetros a e b da equação
n.x.y  x.y
y
x
b
 a.
n.x ²  (x )²
n
n
4.32  11.13  15
3
a

   0,429
4.39  11²
35
7
a
b
13 3 11 31
 . 
 4,429
4 7 4
7
Portanto a equação é Y = -0,429X + 4,429 ou Y = (-3X + 31)/7
Exercício Resolvido - 2
A sociabilidade pode ser expressa de diversas maneiras, inclusive fazendo-se
muitos amigos e realizando-se encontros frequentes. Um pesquisador
interrogou uma amostra de quatro alunos de uma faculdade sobre (X) quantos
bons amigos eles têm e (Y) quantas vezes se encontraram no mês anterior. O
resultado é apresentado pela tabela:
Aluno
A
B
C
D
X
2
1
5
3
Y
5
4
3
1
Determine o coeficiente de correlação linear de Pearson.
Solução:
Primeiramente vamos montar um quadro auxiliar de cálculo.
Y
x²
Aluno
X
X.Y
5
4
A
2
10
4
1
B
1
4
3
25
C
5
15
1
9
D
3
3
13
39
Total
11
32
Calculando os parâmetros a e b da equação
rxy 
rxy 
n.x.y  x.y
(n.x ²  (x )²).(n.y ²  (y )²)
4.32  13.11
( 4.39  11 ²).(4.49  13²)
 0,429
Y²
25
14
9
1
49
Exercício Resolvido - 3
Calcule o poder explicativo R² do exercício anterior e escreva significado
Solução:
R² = r²xy = (-0,429)² = 0,184 ou 18,4%
A dependência entre os valores de x e y é de 18,4%
Exercícios propostos
Exercício 1
Preparando-se para um exame, alunos de uma turma estudaram mais que os
outros. Relaciona-se a seguir as notas em um exame de 10 pontos e as horas
de estudo
Aluno
A
B
C
D
E
Horas (X)
4
1
8
5
7
Nota (Y)
5
2
9
6
8
Determine a equação de regressão linear (Y = aX + b) de acordo com
resultados obtidos.
Exercício 2
Preparando-se para um exame, alunos de uma turma estudaram mais que os
outros. Relaciona-se a seguir as notas em um exame de 10 pontos e as horas
de estudo
Aluno
A
B
C
D
E
Horas (X)
4
1
8
5
7
Nota (Y)
5
2
9
6
8
Determine o coeficiente de correlação linear de Pearson.
Exercício 3
Preparando-se para um exame, alunos de uma turma estudaram mais que os
outros. Relaciona-se a seguir as notas em um exame de 10 pontos e as horas
de estudo
Aluno
A
B
C
D
E
Horas (X)
4
1
8
5
7
Nota (Y)
5
2
9
6
8
Determine o poder explicativo e escreva o seu significado.
Exercício 4
A sociabilidade pode ser expressa de diversas maneiras, inclusive fazendo-se
muitos amigos e realizando-se encontros frequentes. Um pesquisador
interrogou uma amostra de quatro alunos de uma faculdade sobre (X) quantos
bons amigos eles têm e (Y) quantas vezes se encontraram no mês anterior. O
resultado é apresentado pela tabela:
Aluno
A
B
C
D
X
2
1
5
3
Y
5
4
3
1
A correlação entre os valor de X e Y é:
a) negativa
b) positiva
c) nula
d) maior 1
e) maior que 10
Referência bibliográfica: Bibliografia básica e complementar da disciplina
Download

Estatística Aplicada ao Serviço Social - Disciplinas On-line