2.3. Equação da reta para o Modelo de Regressão Linear.
Para obter a equação da reta, inicialmente o professor decide testar dois de seus
melhores alunos e mostra os 10 pontos pedindo que cada um deles encontre uma reta
que passe por alguns destes pontos porque por todos já vimos que seria uma tarefa
impossível.
O primeiro aluno depois de refletir um pouco resolve escolher dois pontos quaisquer e
encontrar a equação da reta. Ele escolhe os seguintes pontos: (1,2) e (10,10).
Que equação ele encontrou? Faça as contas!!!
Observe graficamente como esta reta se posiciona em relação ao conjunto de pontos:
Gráfico 2.3.1: Dispersão com adição da reta y=(8/9)x +10/9
O segundo aluno observou uma sequencia de 4 pontos alinhados (4,5) (5,6) (6,7) e (8,9) e
decidiu apresentar essa reta. Que equação ele obteve? Faça as contas!!! Veja graficamente sua
reta posicionada entre os pontos.
Gráfico 2.3.2: Dispersão com adição da reta y=x +1
Já o professor, utilizando a ferramenta de regressão linear apresentou a seguinte reta:
Y=0.8743x + 1.2291 (Não é para fazer nenhuma conta agora!!! Apenas observe.)
Comandos do R para gerar os gráficos:
x<-c(4,10,5,5,4,1,10,5,8,6)
y<-c(5,9,5,6,3,2,10,7,9,7)
par(mfrow=c(1,3))
#primeiro gráfico
plot(x,y,main= "gráfico do aluno1")
lines(x,(8/9)*x+10/9)
#segundo gráfico
plot(x,y,main= "gráfico do aluno2")
lines(x,x+1)
#terceiro gráfico
plot(x,y,main="gráfico do professor")
abline(lm(y~x))
#os coeficiente da reta de regressão são:
lm(y~x)
Gráfico 2.3.3: Dispersão com adição da reta y=0.8743x + 1.2291
O método utilizado pelo professor para obter a reta, garante que esta reta apresenta a
menor soma do quadrado das distâncias dos pontos à qualquer outra reta. Vamos verificar
esta propriedade através do cálculo da soma das distâncias ao quadrado dos pontos a cada
uma destas retas. Lembrando que o quadrado da distância entre dois pontos pode ser obtida
pela diferença ao quadrado entre os pontos, ou seja, se os pontos são y1 e y2, o quadrado da
distância entre eles será
.
Por exemplo, o cálculo do quadrado da distância entre o ponto (x=4,y=5) e a reta
y=(8/10)x+9/10 será: (5 - (8/10)*4+9/10)2 = 0,111. Comparando com a fórmula acima observe
que y2 é o valor de y no par ordenado (4,5) e y1 é o valor de y correspondente a x=4 na
equação da reta, ou seja, 4,667. Logo a diferença entre y2 e y1 será de 1,667 que elevado ao
quadrado fornecerá o resultado 0,111. Esse procedimento deverá ser repetido para cada par
ordenado. Ao final somamos o quadrado das distâncias.Vamos realizar o cálculo da diferença
entre os pontos e cada uma das três retas. Veja os resultados na tabela a seguir:
X
y
4
5
10
9
5
5
5
6
4
3
1
2
10
10
5
7
8
9
6
7
Total
y=(8/9)x+10/9
distância quadrada
y=x+1
distância quadrada
y=0.8743x + 1.2291
distância quadrada
4,666666667
0,111111111
5
0
4,7227
0,07689529
10
1
11
4
9,9631
0,92756161
5,555555556
0,308641975
6
1
5,5961
0,35533521
5,555555556
0,197530864
6
0
5,5961
0,16313521
4,666666667
2,777777778
5
4
4,7227
2,96769529
2
0
2
0
2,1025
0,01050625
10
0
11
1
9,9631
0,00136161
5,555555556
2,086419753
6
1
5,5961
1,97093521
8,222222222
0,604938272
9
0
8,2163
0,61418569
6,444444444
0,308641975
7
0
6,4695
0,28143025
7,395061728
11
7,36904162
Observe que a soma do quadrado da distância entre os pontos e a reta proposta pelo aluno1
foi de 7,395 enquanto que a do aluno2 foi de 11. Conforme já havíamos anunciado, os cálculos
confirmam que a menor soma é a da reta do método utilizado pelo professor com valor 7,369.
Este método é conhecido como Método dos Mínimos Quadrados.
Download

2.3. Equação da reta para o Modelo de Regressão Linear. Para