2.3. Equação da reta para o Modelo de Regressão Linear. Para obter a equação da reta, inicialmente o professor decide testar dois de seus melhores alunos e mostra os 10 pontos pedindo que cada um deles encontre uma reta que passe por alguns destes pontos porque por todos já vimos que seria uma tarefa impossível. O primeiro aluno depois de refletir um pouco resolve escolher dois pontos quaisquer e encontrar a equação da reta. Ele escolhe os seguintes pontos: (1,2) e (10,10). Que equação ele encontrou? Faça as contas!!! Observe graficamente como esta reta se posiciona em relação ao conjunto de pontos: Gráfico 2.3.1: Dispersão com adição da reta y=(8/9)x +10/9 O segundo aluno observou uma sequencia de 4 pontos alinhados (4,5) (5,6) (6,7) e (8,9) e decidiu apresentar essa reta. Que equação ele obteve? Faça as contas!!! Veja graficamente sua reta posicionada entre os pontos. Gráfico 2.3.2: Dispersão com adição da reta y=x +1 Já o professor, utilizando a ferramenta de regressão linear apresentou a seguinte reta: Y=0.8743x + 1.2291 (Não é para fazer nenhuma conta agora!!! Apenas observe.) Comandos do R para gerar os gráficos: x<-c(4,10,5,5,4,1,10,5,8,6) y<-c(5,9,5,6,3,2,10,7,9,7) par(mfrow=c(1,3)) #primeiro gráfico plot(x,y,main= "gráfico do aluno1") lines(x,(8/9)*x+10/9) #segundo gráfico plot(x,y,main= "gráfico do aluno2") lines(x,x+1) #terceiro gráfico plot(x,y,main="gráfico do professor") abline(lm(y~x)) #os coeficiente da reta de regressão são: lm(y~x) Gráfico 2.3.3: Dispersão com adição da reta y=0.8743x + 1.2291 O método utilizado pelo professor para obter a reta, garante que esta reta apresenta a menor soma do quadrado das distâncias dos pontos à qualquer outra reta. Vamos verificar esta propriedade através do cálculo da soma das distâncias ao quadrado dos pontos a cada uma destas retas. Lembrando que o quadrado da distância entre dois pontos pode ser obtida pela diferença ao quadrado entre os pontos, ou seja, se os pontos são y1 e y2, o quadrado da distância entre eles será . Por exemplo, o cálculo do quadrado da distância entre o ponto (x=4,y=5) e a reta y=(8/10)x+9/10 será: (5 - (8/10)*4+9/10)2 = 0,111. Comparando com a fórmula acima observe que y2 é o valor de y no par ordenado (4,5) e y1 é o valor de y correspondente a x=4 na equação da reta, ou seja, 4,667. Logo a diferença entre y2 e y1 será de 1,667 que elevado ao quadrado fornecerá o resultado 0,111. Esse procedimento deverá ser repetido para cada par ordenado. Ao final somamos o quadrado das distâncias.Vamos realizar o cálculo da diferença entre os pontos e cada uma das três retas. Veja os resultados na tabela a seguir: X y 4 5 10 9 5 5 5 6 4 3 1 2 10 10 5 7 8 9 6 7 Total y=(8/9)x+10/9 distância quadrada y=x+1 distância quadrada y=0.8743x + 1.2291 distância quadrada 4,666666667 0,111111111 5 0 4,7227 0,07689529 10 1 11 4 9,9631 0,92756161 5,555555556 0,308641975 6 1 5,5961 0,35533521 5,555555556 0,197530864 6 0 5,5961 0,16313521 4,666666667 2,777777778 5 4 4,7227 2,96769529 2 0 2 0 2,1025 0,01050625 10 0 11 1 9,9631 0,00136161 5,555555556 2,086419753 6 1 5,5961 1,97093521 8,222222222 0,604938272 9 0 8,2163 0,61418569 6,444444444 0,308641975 7 0 6,4695 0,28143025 7,395061728 11 7,36904162 Observe que a soma do quadrado da distância entre os pontos e a reta proposta pelo aluno1 foi de 7,395 enquanto que a do aluno2 foi de 11. Conforme já havíamos anunciado, os cálculos confirmam que a menor soma é a da reta do método utilizado pelo professor com valor 7,369. Este método é conhecido como Método dos Mínimos Quadrados.