1
Professor Mauricio Lutz
CORRELAÇÃO
Em muitas situações, torna-se interessante e útil estabelecer uma
relação entre duas ou mais variáveis. A matemática estabelece vários tipos de
relações entre variáveis, por exemplo, as relações funcionais e as correlações.
Relações Funcionais
São relações matemáticas expressas por sentenças matemáticas, como
por exemplo:
• Área do retângulo (A=a.b) é a relação entre os lados do retângulo;
• Densidade de massa (dm= m/v) é a relação entre a massa e o volume de um
corpo;
• Perímetro de uma circunferência (C=2πR) é a relação entre o comprimento da
circunferência e o valor do raio.
Relações Estatísticas e Correlações
São relações estabelecidas após uma pesquisa. Com base nos
resultados da pesquisa, são feitas comparações que eventualmente podem
conduzir (ou não) à ligação entre as variáveis.
Exemplo: relação entre a idade e a estatura de uma criança, ou a relação entre a
classe social de uma pessoa e o número de viagens por ela realizado.
No estudo estatístico, a relação entre duas ou mais variáveis denominase correlação. A utilidade e importância das correlações entre duas variáveis
podem conduzir à descoberta de novos métodos, cujas estimativas são vitais em
tomadas de decisões.
Em outras palavras quando duas variáveis estão ligadas por uma
relação estatística, dizemos que existe correlação entre elas.
1) Diagrama de dispersão
O diagrama de dispersão é um gráfico cartesiano em que cada um dos
eixos corresponde às variáveis correlacionadas. A variável dependente (Y) situa-se
no eixo vertical e o eixo das abscissas é reservado para a variável independente
(X). Os pares ordenados formam uma nuvem de pontos.
A configuração geométrica do diagrama de dispersão pode estar associada a uma
linha reta (correlação linear), uma linha curva (correlação curvilínea) ou, ainda, ter
Instituto Federal farroupilha Campus Alegrete
RS – 377 km 27 – Passo Novo
Alegrete - RS
Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
2
Professor Mauricio Lutz
os pontos dispersos de maneira que não definam nenhuma configuração linear;
nesta última situação, não há correlação.
100
100
50
50
0
0
0
5
10
Correlação Linear
0
5
10
Correlação Curvilínea
2) Correlação Linear
Correlação linear é uma correlação entre duas variáveis, cujo gráfico
aproxima-se de uma linha. É uma linha de tendência, porque procura acompanhar
a tendência da distribuição de pontos, que pode corresponder a uma reta ou a uma
curva. Por outro lado, é, também, uma linha média, porque procura deixar a mesma
quantidade de pontos abaixo e acima da linha.
Correlação linear positiva
Correlação linear negativa
Não há correlação
Para definir se a correlação entre as variáveis corresponde a uma linha
reta ou a uma curva, pode-se utilizar modos qualitativos ou quantitativos.
No modo qualitativo, vai imperar o “bom senso” do pesquisador para
verificar qual o grau de intensidade na correlação entre as variáveis; isso significa o
estabelecimento de uma relação numérica que medirá o nível da correlação.
Instituto Federal farroupilha Campus Alegrete
RS – 377 km 27 – Passo Novo
Alegrete - RS
Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
3
Professor Mauricio Lutz
3) Coeficiente de Correlação Linear
O instrumento empregado para a medida da correlação linear é o
coeficiente de correlação. Este coeficiente deve indicar o grau de intensidade de
correlação entre duas variáveis e, ainda, o sentido dessa correlação (positiva ou
negativa).
Uma das formas de medir o coeficiente de correlação linear foi
desenvolvido por Pearson e recebe o nome de coeficiente de correlação de
Pearson. O coeficiente de correlação de Pearson mede o grau de ajustamento dos
valores em torno de uma reta.
Coeficiente de Correlação de Pearson (r):
r=
nå xi y i - (å xi )(
. å yi )
[nå x
2
i
][
- (å xi ) . nå y i2 - (å y i )
2
2
]
onde temos:
r é o coeficiente de Pearson;
n é o número de observações;
xi é a variável independente;
yi é a variável dependente.
O valor do coeficiente de correlação r tem a variação entre +1 e –1, ou
seja, está limitado entre os valores do Intervalo[–1,+1].
• r = +1 (correlação positiva entre as variáveis);
• r = –1 (correlação perfeita negativa entre as variáveis);
• r = 0 (não há correlação entre as variáveis ou, ainda, a correlação não é linear,
caso exista).
Quanto mais próximo o valor de r estiver do valor “1”, mais forte a
correlação linear.
Quanto mais próximo o valor de r estiver do valor “0”, mais fraca a
correlação linear.
Em geral, multiplica-se o valor de r por 100; dessa forma, o resultado
passa a ser expresso em porcentagem. Na prática, estabelecem-se critérios para
verificar os diversos níveis do fraco ao forte, chegando até o perfeito:
• 0 < |r| < 0,3 : a correlação é fraca e fica difícil estabelecer relação entre as
variáveis. Em porcentagem: 0% < |r| < 30%;
Instituto Federal farroupilha Campus Alegrete
RS – 377 km 27 – Passo Novo
Alegrete - RS
Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
4
Professor Mauricio Lutz
• 0,3 ≤ |r| < 0,6 : a correlação é fraca, porém, podemos considerar a existência de
relativa correlação entre as variáveis. Em porcentagem: 30% ≤ |r| < 60%;
• 0,6 ≤ |r| < 1 : a correlação é de média para forte; a relação entre as variáveis é
significativa, o que permite coerência com poucos conflitos na obtenção das
conclusões. Em porcentagem: 60% ≤ |r| ≤ 100%.
4) Teste de hipótese para a existência de correlação
Para aplicar o teste de hipótese para existência de correlação linear, é
necessário que as variáveis populacionais (X, Y) tenham distribuição normal
bivariada. Quando as amostras forem superiores a 30, a hipótese de normalidade
das duas variáveis é razoavelmente atendida.
O coeficiente de correlação linear da população (X, Y) é designado ρ (ler
Rô). Se o teste indicar a rejeição da hipótese r = 0 , poderemos concluir que existe
correlação entre as variáveis ao nível de significância admitido. Eis o procedimento
para realizar o teste:
(1) H0: r = 0
H1: r ¹ 0
(2) Fixar ∝ e escolher uma distribuição t de Student com j = n - 2 graus
de liberdade.
(3) Determinar as regiões de rejeição e aceitação para H0, com auxilio
da tabela t de Student.
(4) Calculo do valor da variável: t cal =
(5) Conclusão:
Instituto Federal farroupilha Campus Alegrete
RS – 377 km 27 – Passo Novo
Alegrete - RS
Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
r n-2
1- r2
5
Professor Mauricio Lutz
Se t cal > t a ou t cal > -t a , rejeita-se H0, concluindo, com risco ∝, que há
2
2
correlação entre as variáveis.
Se - t a £ t cal £ t a , não se pode rejeita-se H0, concluindo que há
2
2
correlação entre as variáveis.
Exemplos: a) Uma pesquisa pretende verificar se há correlação significativa entre o
peso total do lixo descartado, por dia, numa empresa com o peso do papel contido
nesse lixo.
Hotel
H1
H2
H3
H4
H5
H6
H7
H8
H9
H10
Peso total
10,47
19,85
21,25
24,36
27,38
28,09
33,61
35,73
38,33
49,14
Peso do papel
2,43
5,12
6,88
6,22
8,84
8,76
7,54
8,47
9,55
11,43
De acordo com os dados, fazemos a representação gráfica. Os pares
ordenados formam o diagrama de dispersão.
Correlação entre o peso total do lixo descartado e o peso do papel contido nesse
lixo
Para se verificar o grau de correlação entre as variáveis, calcula-se o
coeficiente de correlação linear pela fórmula do coeficiente de correlação de
Pearson:
r=
Instituto Federal farroupilha Campus Alegrete
RS – 377 km 27 – Passo Novo
Alegrete - RS
Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
nå xi y i - (å xi )(
. å yi )
[nå x
2
i
][
- (å xi ) . nå y i2 - (å y i )
2
2
]
6
Professor Mauricio Lutz
Para facilitar o cálculo construímos a seguinte tabela:
xi . y i
x i2
2,43
25,44
109,62
5,90
5,12
101,63
394,02
26,21
21,25
6,88
146,20
451,56
47,33
H4
24,36
6,22
151,52
593,41
38,69
H5
27,38
8,84
242,04
749,66
78,15
H6
28,09
8,76
246,07
789,05
76,74
H7
33,61
7,54
253,42
1129,63
56,85
H8
35,73
8,47
302,63
1276,63
71,74
H9
38,33
9,55
366,05
1469,19
91,20
H10
49,14
11,43
561,67
2414,74
130,64
288,21
75,24
2396,68
9377,52
623,47
Peso total ( xi )
Peso do papel ( y i )
H1
10,47
H2
19,85
H3
å
r=
r=
r=
n å xi yi - (å xi )(
. å yi )
[nå x
2
i
][
- (å xi ) . n å yi2 - (å yi )
2
2
yi2
]
(10 x 2396,68) - ( 288,21x 75,24)
[10 x9377,52 - (288,21) ]x[10 x623,47 - (75,24) ]
2
2
( 23966,8) - ( 21684,9)
2281,83
=
= 0,9206
[93775,2 - 83065]x[6234,7 - 5661,06] 2478,57
r = 0,9206 ou r = 92,06 %
Observamos, assim: 0,6 ≤ r ≤ 1 . Esse resultado indica que há uma forte
correlação entre as variáveis ou, ainda, que a correlação entre as duas variáveis é
bastante
significativa. Nesse caso, podemos concluir haver coerência na afirmação de que
existe correlação entre o peso total do lixo descartado e o peso do papel contido
nesse lixo.
(1)
Realizando o teste de hipótese com um ∝=5% temos:
H0: r = 0
H1: r ¹ 0
(2) a = 5% e Graus de liberdade: j = n - 2 = 10 - 2 = 8
Instituto Federal farroupilha Campus Alegrete
RS – 377 km 27 – Passo Novo
Alegrete - RS
Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
7
Professor Mauricio Lutz
(3) Regiões de rejeição e aceitação para H0.
(4) Cálculo do valor da variável: t cal =
r n-2
1- r2
=
0,9206 10 - 2
1 - (0,9206) 2
=
2,6039
= 6,6679
0,3905
(5) Conclusão: Como t cal > 2,3060 , rejeita-se H0, concluindo, com riso de 5%, que
há correlação entre o peso total de lixo descartada com o peso total de papel
contido neste lixo, ou ainda, existe uma correlação positiva entre X e Y, significa
que as variáveis são diretamente proporcionais, portando quanto maior o lixo
produzido maior será a quantidade de papel contida neste lixo.
b) Consideremos uma amostra aleatória, formada por dez dos 98 alunos de uma
classe da faculdade A e pelas notas obtidas por eles em matemática e estatística:
Notas
Números
Matemática ( xi )
Estatística ( y i )
01
5,0
6,0
08
8,0
9,0
24
7,0
8,0
38
10,0
10,0
44
6,0
5,0
58
7,0
7,0
59
9,0
8,0
72
3,0
4,0
80
8,0
6,0
92
2,0
2,0
Vamos verificar a correlação primeiro fazendo um diagrama de
dispersão:
Instituto Federal farroupilha Campus Alegrete
RS – 377 km 27 – Passo Novo
Alegrete - RS
Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
8
Professor Mauricio Lutz
Correlação entre as notas de matemática e estatística
Números
Notas
xi . y i
x i2
yi2
Matemática ( xi )
Estatística ( y i )
01
5,0
6,0
30
25
36
08
8,0
9,0
72
64
81
24
7,0
8,0
56
49
64
38
10,0
10,0
100
100
100
44
6,0
5,0
30
36
25
58
7,0
7,0
49
49
49
59
9,0
8,0
72
81
64
72
3,0
4,0
12
9
16
80
8,0
6,0
48
64
36
92
2,0
2,0
4
4
4
65
65
473
481
475
å
r=
r=
r=
n å xi y i - (å x i )(
. å yi )
[nå x
2
i
][
- (å xi ) . n å y i2 - (å y i )
2
2
]
(10 x 473) - (65 x 65)
[10 x481 - (65) ]x[10 x475 - (65) ]
2
( 4730 ) - ( 4225)
[4810 - 4225]x[4750 - 4225]
2
=
505
585 x525
=
505
= 0,9112
554,18
Portanto r = 0,9112 ou r = 92,12% , o que resulta uma correlação positiva
altamente significativa entre as duas variáveis.
(1)
Realizando o teste de hipótese com um ∝=5% temos:
H0: r = 0
H1: r ¹ 0
Instituto Federal farroupilha Campus Alegrete
RS – 377 km 27 – Passo Novo
Alegrete - RS
Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
9
Professor Mauricio Lutz
(2) a = 5% e Graus de liberdade: j = n - 2 = 10 - 2 = 8
(3) Regiões de rejeição e aceitação para H0.
(4) Cálculo do valor da variável: t cal =
r n-2
1- r2
=
0,9112 10 - 2
1 - (0,9112) 2
=
2,5773
= 6,2560
0,4120
(5) Conclusão: Como t cal > 2,3060 , rejeita-se H0, concluindo, com riso de 5%, que
há correlação entre as notas de matemática e estatística, ou ainda, existe uma
correlação positiva entre X e Y, significa que as variáveis são diretamente
proporcionais, portando quanto maior a nota de matemática maior será a nota de
estatística.
Exercícios
1)Complete o esquema de cálculo do coeficiente de correlação para os valores das
variáveis xi e y i :
xi
4
6
8
10
12
yi
12
10
8
12
14
Temos:
xi
yi
xi . y i
x i2
yi2
4
........
........
........
12
12
........
........
........
14
48
........
........
........
168
16
........
........
........
144
144
........
........
........
196
å =........
å =........
å =........
å =........
å =........
Instituto Federal farroupilha Campus Alegrete
RS – 377 km 27 – Passo Novo
Alegrete - RS
Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
10
Professor Mauricio Lutz
Logo:
r=
r=
(........ x........) - (........ x........)
[........ x........ - ........]x[........ x........ - ........]
........ - ........
[........ - ........]x[........ - ........]
=
........
........ x........
=
........
= ........
........
Donde r = 0,42 . A correlação linear entre as variáveis x e y é positiva,
porém fraca.
2) Correlacionar os valores de produção leiteira e o teor de gordura de animais
bovinos da fazenda Pica Pau Amarelo.
Produção (kg)
Teor de Gordura (%)
10
6,0
12
5,7
14
5,3
17
5,2
19
5,0
22
4,7
25
4,5
3) Para os dados abaixo:
a) Desenhe o diagrama de dispersão;
b) Calcule o coeficiente de correlação de Pearson e interprete.
c) Teste o coeficiente encontrado na letra b).
Concentração Protombina no Plasma (x)
Tempo de coagulação em segundos (y)
5
70
10
40
20
27
30
22
40
18
50
16
60
15
70
14
80
13
90
12
Instituto Federal farroupilha Campus Alegrete
RS – 377 km 27 – Passo Novo
Alegrete - RS
Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
11
Professor Mauricio Lutz
4) Uma amostra revelou o coeficiente de correlação entre o salário e o número de
anos de escolaridade para um grupo de 60 pessoas é de 0,78. Teste a hipótese de
existência de correlação entre essas variáveis, ao nível de 5%.
5) Sessenta e quatro estudantes foram submetidos a dois testes: raciocínio lógico e
quantitativo e conhecimentos gerais. Dos escores obtidos, foram calculadas as
somas:
å X = 169 ; å Y = 327 ; å X
2
= 1450 ;
åY
2
= 2304 ;
å XY = 837 .
a)Determine o coeficiente de correlação.
b) Ao nível de significância de 5%, testar a existência de correlação.
6) A tabela a seguir expressa os pesos e as alturas de 30 crianças:
Peso (kg)
30
32
24
30
26
35
25
23
35
31
29
28
25
29
30
Altura (cm)
145
150
125
157
127
140
132
107
155
145
140
142
130
135
138
Peso (kg)
31
32
33
25
26
28
29
30
31
35
34
33
32
28
30
Altura (cm)
140
150
157
144
145
147
150
152
150
160
149
150
129
130
140
Ao nível de 5%, podemos afirmar que há correlação entre os pesos e as
alturas?
7) Um grupo de pessoas fez uma avaliação do peso aparente de alguns objetos.
Com o peso real e a média dos pesos aparentes, dados pelo grupo, obteve-se a
tabela:
Peso Real
18
30
42
62
73
97
120
Peso Aparente
10
23
33
60
91
98
159
Calcule o índice de correlação.
8) Considere os resultados de dois testes, X e Y, obtidos por um grupo de alunos
da escola A:
xi
11
14
19
19
22
28
30
31
34
37
yi
13
14
18
15
22
17
24
22
24
25
a) Verifique, pelo diagrama, se existe correlação retilínea.
b) Em caso afirmativo, calcule o coeficiente de correlação.
c) Escreva em poucas linhas, as conclusões a que chegou sobre a relação entre
essas variáveis.
d) Ao nível de significância de 5%, testar a existência de correlação.
Instituto Federal farroupilha Campus Alegrete
RS – 377 km 27 – Passo Novo
Alegrete - RS
Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
12
Professor Mauricio Lutz
Gabarito
1)Complete o esquema de cálculo do coeficiente de correlação para os valores das
variáveis xi e y i :
xi
4
6
8
10
12
yi
12
10
8
12
14
Temos:
xi
yi
xi . y i
x i2
yi2
4
6
8
10
12
12
10
8
12
14
48
60
64
120
168
16
36
64
100
144
144
100
64
144
196
å =40
å =56
å =460
å =360
å =648
Logo:
r=
r=
(5 x 460) - ( 40 x56)
[5x360 - (40) ]x[5x648 - (56) ]
2
2
2300 - 2240
[1800 - 1600]x[3240 - 3136 ]
=
60
200 x104
=
60
= 0,42
144,22
Donde r = 0,42 . A correlação linear entre as variáveis x e y é positiva,
porém fraca.
2) Correlacionar os valores de produção leiteira e o teor de gordura de animais
bovinos da fazenda Pica Pau Amarelo.
Produção (kg)
Teor de Gordura (%)
xi . y i
x i2
yi2
10
6,0
60
100
36
12
5,7
68,4
144
32,49
14
5,3
74,2
196
28,09
17
5,2
88,4
289
27,04
19
5,0
95
361
25
22
4,7
103,4
484
22,09
25
4,5
112,5
625
20,25
å =119
å =36,4
å =601,9
å =2199
å =190,96
Instituto Federal farroupilha Campus Alegrete
RS – 377 km 27 – Passo Novo
Alegrete - RS
Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
13
Professor Mauricio Lutz
r=
r=
(7 x 601,9) - (119 x36,4)
[7 x2199 - (119) ]x[7 x190,96 - (36,4) ]
2
2
4213,3 - 4331,6
[15393 - 14161]x[1336,72 - 1324,96]
=
- 118,3
1232 x11,76
=
- 118,3
= -0,9828
120,37
Existe uma forte correlação negativa entre x e y, significa que as
variáveis são inversamente proporcionais, ou seja, quanto mais leite produz a vaca
menor o teor de gordura do leite.
3) Para os dados abaixo:
a) Desenhe o diagrama de dispersão;
b) Calcule o coeficiente de correlação de Pearson e interprete.
c) Teste o coeficiente encontrado na letra b).
Concentração Protombina no
Tempo de coagulação
Plasma (x)
em segundos (y)
5
xi . y i
x i2
yi2
70
350
25
4900
10
40
400
100
1600
20
27
540
400
729
30
22
660
900
484
40
18
720
1600
324
50
16
800
2500
256
60
15
900
3600
225
70
14
980
4900
196
80
13
1040
6400
169
90
12
1080
8100
144
å =455
å =247
a)
Instituto Federal farroupilha Campus Alegrete
RS – 377 km 27 – Passo Novo
Alegrete - RS
Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
å =7470 å =28525 å =9027
14
Professor Mauricio Lutz
b)
r=
r=
(10 x7470 ) - ( 455 x 247 )
[10 x28525 - (455) ]x[10 x9027 - (247 ) ]
2
74700 - 112385
2
[285250 - 207025]x[90270 - 61000 ]
=
- 37685
78225 x 29261
=
- 37685
= -0,7877
47842,89
Existe uma correlação negativa entre x e y, significa que as variáveis são
inversamente proporcionais, ou seja, quanto maior a concentração de protombina
menor é o tempo de coagulação.
c) Realizando o teste de hipótese com um ∝=5% temos:
(1)
H0: r = 0
H1: r ¹ 0
(2) a = 5% e Graus de liberdade: j = n - 2 = 10 - 2 = 8
(3) Regiões de rejeição e aceitação para H0.
(4) Cálculo do valor da variável: t cal =
r n-2
1- r2
=
- 0,7877 10 - 2
1 - (-0,7877) 2
=
- 2,2279
= -3,6163
0,6162
(5) Conclusão: Como t cal > 2,3060 , rejeita-se H0, concluindo, com riso de 5%, que
há correlação entre a concentração protombina no plasma e tempo de coagulação.
4) Uma amostra revelou o coeficiente de correlação entre o salário e o número de
anos de escolaridade para um grupo de 60 pessoas é de 0,78. Teste a hipótese de
existência de correlação entre essas variáveis, ao nível de 5%.
Realizando o teste de hipótese com um ∝=5% temos:
(1)
H0: r = 0
H1: r ¹ 0
(2) a = 5% e Graus de liberdade: j = n - 2 = 60 - 2 = 58
Instituto Federal farroupilha Campus Alegrete
RS – 377 km 27 – Passo Novo
Alegrete - RS
Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
15
Professor Mauricio Lutz
(3) Regiões de rejeição e aceitação para H0.
(4) Cálculo do valor da variável: t cal =
r n-2
1- r
2
=
0,78 60 - 2
1 - (0,78)
2
=
5,9403
= 9,4926
0,6258
(5) Conclusão: Como t cal > 2,0017 , rejeita-se H0, concluindo, com riso de 5%, que
há correlação entre o salário e o número de anos de escolaridade.
5) Sessenta e quatro estudantes foram submetidos a dois testes: raciocínio lógico e
quantitativo e conhecimentos gerais. Dos escores obtidos, foram calculadas as
somas:
å X = 169 ; å Y = 327 ; å X
2
= 1450 ;
åY
2
= 2304 ;
å XY = 837 .
a)Determine o coeficiente de correlação.
b) Ao nível de significância de 5%, testar a existência de correlação.
a)
(64 x837 ) - (169 x327 )
r=
2
2
64 x1450 - (169 ) x 64 x 2304 - (327 )
[
r=
][
53568 - 55263
[92800 - 28561]x[147456 - 106929 ]
]
=
- 1695
64239 x 40527
r = -3,322%
Realizando o teste de hipótese com um ∝=5% temos:
(1)
H0: r = 0
H1: r ¹ 0
(2) a = 5% e Graus de liberdade: j = n - 2 = 64 - 2 = 62
(3) Regiões de rejeição e aceitação para H0.
Instituto Federal farroupilha Campus Alegrete
RS – 377 km 27 – Passo Novo
Alegrete - RS
Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
=
- 1695
= -0,03322
51023,6607
16
Professor Mauricio Lutz
(4)
t cal =
Cálculo
r n-2
1- r2
=
do
- 0,03322 64 - 2
1 - (-0,03322) 2
valor
da
variável:
- 0,26157
= -0,2617
0,99945
=
(5) Conclusão: Como t cal < 2,0017 , aceita-se H0, concluindo, com riso de 5%, que
não há correlação entre os testes raciocínio lógico e quantitativo e conhecimentos
gerais.
6) A tabela a seguir expressa os pesos e as alturas de 30 crianças:
Peso (kg)
30
32
24
30
26
35
25
23
35
31
29
28
25
29
30
Altura (cm)
145
150
125
157
127
140
132
107
155
145
140
142
130
135
138
Peso (kg)
31
32
33
25
26
28
29
30
31
35
34
33
32
28
30
Altura (cm)
140
150
157
144
145
147
150
152
150
160
149
150
129
130
140
Ao nível de 5%, podemos afirmar que há correlação entre os pesos e as
alturas?
Peso
Altura
(x)
(y)
xi . y i
x i2
yi2
Peso (x)
Altura (y)
xi . y i
x i2
yi2
30
145
4350
900
21025
31
140
4340
961
19600
32
150
4800
1024
22500
32
150
4800
1024
22500
24
125
3000
576
15625
33
157
5181
1089
24649
30
157
4710
900
24649
25
144
3600
625
20736
26
127
3302
676
16129
26
145
3770
676
21025
35
140
4900
1225
19600
28
147
4116
784
21609
25
132
3300
625
17424
29
150
4350
841
22500
23
107
2461
529
11449
30
152
4560
900
23104
35
155
5425
1225
24025
31
150
4650
961
22500
31
145
4495
961
21025
35
160
5600
1225
25600
29
140
4060
841
19600
34
149
5066
1156
22201
28
142
3976
784
20164
33
150
4950
1089
22500
25
130
3250
625
16900
33
129
4257
1089
16641
29
135
3915
841
18225
28
130
3640
784
16900
30
138
4140
900
19044
30
140
4200
900
19600
å =890 å =4261 å =127164 å =26736 å =609049
Instituto Federal farroupilha Campus Alegrete
RS – 377 km 27 – Passo Novo
Alegrete - RS
Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
17
Professor Mauricio Lutz
Ao nível de significância de 5%, testar a existência de correlação.
a)
r=
r=
(30 x127164 ) - (890 x 4261)
[30 x 26736 - (890 ) ]x[30 x609049 - (4261) ]
2
22630
9980 x11549
=
2
3814920 - 3792290
=
[802080 - 792100 ]x[18271470 - 18156121]
22630
= 0,667
33929,08811
Realizando o teste de hipótese com um ∝=5% temos:
(1)
H0: r = 0
H1: r ¹ 0
(2) a = 5% e Graus de liberdade: j = n - 2 = 30 - 2 = 28
(3) Regiões de rejeição e aceitação para H0.
(4) Cálculo do valor da variável: t cal =
r n-2
1- r2
=
0,667 30 - 2
1 - (0,667) 2
=
3,5294
= 4,7371
0,7451
(5) Conclusão: Como t cal > 2,0484 , rejeita-se H0, concluindo, com riso de 5%, que
há correlação linear entre os pesos e as alturas das 30 crianças avaliadas.
7) Um grupo de pessoas fez uma avaliação do peso aparente de alguns objetos.
Com o peso real e a média dos pesos aparentes, dados pelo grupo, obteve-se a
tabela:
Peso Real
18
30
42
62
73
97
120
Peso Aparente
10
23
33
60
91
98
159
Calcule o índice de correlação.
Instituto Federal farroupilha Campus Alegrete
RS – 377 km 27 – Passo Novo
Alegrete - RS
Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
18
Professor Mauricio Lutz
r=
r=
Peso real (x)
Peso aparente (y)
xi . y i
x i2
yi2
18
10
180
324
100
30
23
690
900
529
42
33
1386
1764
1089
62
60
3720
3844
3600
73
91
6643
5329
8281
97
98
9506
9409
9604
120
159
19080
14400
25281
å =442
å =474
å =41205 å =35970 å =48484
(7 x 41205) - ( 442 x 474)
[7 x35970 - (442 ) ]x[7 x48484 - (474 ) ]
2
78927
56426 x114712
=
2
=
288435 - 209508
[251790 - 195364 ]x[339288 - 224676 ]
78927
= 0,9810
8045,336
8) Considere os resultados de dois testes, X e Y, obtidos por um grupo de alunos
da escola A:
xi
11
14
19
19
22
28
30
31
34
37
yi
13
14
18
15
22
17
24
22
24
25
a) Verifique, pelo diagrama, se existe correlação retilínea.
b) Em caso afirmativo, calcule o coeficiente de correlação.
c) Escreva em poucas linhas, as conclusões a que chegou sobre a relação entre
essas variáveis.
d) Ao nível de significância de 5%, testar a existência de correlação.
xi
yi
11
14
xi . y i
x i2
yi2
13
143
121
169
14
196
196
196
19
18
342
361
324
19
15
285
361
225
22
22
484
484
484
28
17
476
784
289
30
24
720
900
576
31
22
682
961
484
34
24
816
1156
576
37
25
925
1369
625
å =245
å =194
Instituto Federal farroupilha Campus Alegrete
RS – 377 km 27 – Passo Novo
Alegrete - RS
Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
å =5069 å =6693 å =3948
19
Professor Mauricio Lutz
a)
b)
r=
r=
(10 x5069 ) - ( 245 x194)
[10 x6693 - (245) ]x[10 x3948 - (194 ) ]
2
3160
6905 x1844
=
2
=
50690 - 47530
[66930 - 60025]x[9480 - 37636 ]
3160
= 0,8856
3568,308
c) Existe uma correlação positiva entre os testes x e y, significa que as variáveis
são diretamente proporcionais.
d) Realizando o teste de hipótese com um ∝=5% temos:
(1)
H0: r = 0
H1: r ¹ 0
(2) a = 5% e Graus de liberdade: j = n - 2 = 10 - 2 = 8
(3) Regiões de rejeição e aceitação para H0.
(4) Cálculo do valor da variável: t cal =
r n-2
1- r2
=
0,8856 10 - 2
1 - (0,8856) 2
=
2,5048
= 5,3924
0,4645
(5) Conclusão: Como t cal > 2,3060 , rejeita-se H0, concluindo, com riso de 5%, que
há correlação entre os teste x e y.
Instituto Federal farroupilha Campus Alegrete
RS – 377 km 27 – Passo Novo
Alegrete - RS
Fone/Fax: (55) 3421-9600
www.al.iffarroupilha.edu.br
Download

CORRELAÇÃO Em muitas situações, torna-se