Regressão Linear
Múltipla
Variáveis Binárias
Relações Não-Lineares
Regressão Linear Múltipla
yc = a + bx1 + cx2 + … mxn + ui
ou
yc = b0 + b1x1 + b2x2 + … bnxn + ui
2
Regressão Linear Múltipla
EXEMPLO
REGRESSÃO DE LCRED (Y) EM FUNÇÃO DE
LDEP (X1), LAPL (X2), LTVM (X3)
obs.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
banco
1
2
3
4
5
7
15
22
23
24
38
51
65
87
lcrd
23,81
23,03
22,86
21,99
23,20
20,84
21,65
21,95
22,11
22,01
22,23
23,85
21,44
21,62
ldep
24,38
23,98
23,24
22,10
23,03
21,12
22,44
21,71
22,44
21,52
22,41
25,14
21,83
23,06
lapl
23,04
22,57
22,41
22,34
22,30
18,56
21,78
22,38
21,40
20,84
21,23
23,63
20,35
21,34
ltvm
22,89
23,39
21,75
22,48
22,49
21,25
23,24
21,82
21,99
21,24
21,51
24,79
21,50
22,76
3
Regressão Linear Múltipla

Análise do ajuste
Estatística de regressão
R múltiplo
R-Quadrado
R-quadrado ajustado
Erro padrão
Observações
0,9468
0,8964
0,8653
0,3292
14
4
Regressão Linear Múltipla

Interseção
ldep
lapl
ltvm
Avaliação da significância estatística
de cada coeficiente
Coeficientes
8,414
0,698
0,327
-0,406
Erro
padrão Stat t
2,060 4,085
0,164 4,255
0,118 2,783
0,167 -2,425
valor-P
0,0022
0,0017
0,0193
0,0357
95%
95%
Inferior Superior
inferiores superiores
90,0%
90,0%
3,825
13,004
4,681
12,148
0,333
1,064
0,401
0,996
0,065
0,589
0,114
0,540
-0,779
-0,033
-0,709
-0,103
5
Regressão Linear Múltipla

Avaliação da significância estatística
global do modelo
H0: todos os coeficientes são iguais a zero simultaneamente
H1: pelo menos um coeficiente é diferente de zero
OU
H 0 : r2 = 0
H 1 : r2 > 0
6
Regressão Linear Múltipla

Avaliação da significância estatística
global do modelo

A significância econômica acontecerá
com a rejeição da Hipótese Nula
ANOVA
gl
Regressão
Resíduo
Total
3
10
13
SQ
9,371
1,083
10,454
MQ
F
F de significação
3,124 28,8318
3,09265E-05
0,108
7
Regressão Linear Múltipla

Relação da estatística F com R2
Variação Explicada Variação da Regressão

R 
Variação Total
Variação até à Média
Variação Explicada
Variação da Regressão
F

Variação Não Explicada Variação dos Resíduos
2
/  k 1
R
F
2
1

 R  / nk 
2
8
Regressão Linear Múltipla
 Para análise da utilidade das Regressões
Múltiplas substitui-se r2 por r2 ajustado
 Ao adicionar novas variáveis independentes, r2 nunca
diminuirá, aumentando em alguns casos
 O coeficiente de determinação ajustado r2 compensa
esse aumento natural de explicação de r2 ao aumentar o
número de variáveis independentes
9
Coeficiente r2ajustado
r ajustado  1  1  r
2


  n  1 


 nk 
onde:




2
(n - k) = graus de liberdade
n
= número de observações
k
= número de coeficientes estimados (variáveis
utilizadas)
Objetivo:

medir a qualidade de ajuste da reta de regressão,
penalizando o acréscimo de variáveis
10
Variáveis Dummy

Variáveis Independentes Binárias



Qualitativas, usadas para indicar a presença ou ausência de
determinado fenômeno
Assumem apenas o valor 0 ou 1
Exemplo

Existência ou não de piscinas numa regressão do preço de
casas
Xi = 1, se a casa tem piscina
Xi = 0, se a casa não tem
11
Variáveis Dummy
 Podem ser usadas também para avaliar qualitativamente
algumas situações com mais de 2 alternativas possíveis
 Exemplo
 A qualidade da condição do piso da casa boa, média ou ruim
 Usam-se p – 1 variáveis, sendo p o número de
possibilidades
12
Variáveis Dummy
Xi =
Xi + 1 =
1, se o piso está em boas condições
0, se não
1, se o piso está em condições médias
0, se não
Deixa-se de fora a possibilidade de as condições serem ruins.
Esta ocorre quando Xi = 0 e Xi + 1 = 0
Ou seja, o piso está em condições ruins quando não está em
boas condições (xi = 0) nem em condições médias (xi + 1 = 0)
13
Variáveis Dummy



O método dos mínimos quadrados não tem respostas
se informam-se p variáveis (no exemplo, 3) ao invés de
(p – 1) variáveis
Também é inadequado informar-se apenas uma
variável, que poderia assumir os valores 1(boa), 2
(média) e 3(ruim).
Neste caso, se entenderia que a condição 3 (ruim) é 3
vezes tão ruim quanto a condição boa (1)
14
Variáveis Dummy

Podem ser utilizadas de três formas



aditiva, ou seja, alterando o intercepto
multiplicativa, ou seja, alterando o coeficiente angular
mista, ou seja, alterando o intercepto e o coeficiente
15
Variáveis Dummy

Y
aditiva, como no exemplo:
Yc = a + b1.X + b2.D
Se D = 0:
Yc = a + b1.X
Se D = 1:
Yc = (a+b2) + b1.X
X
16
Variáveis Dummy

Y
multiplicativa, como no exemplo
Yc = a + b1.X + b3.D.X
Se D = 0:
Yc = a + b1.X
Se D = 1:
Yc = a + (b1+b3).X
X
17
Variáveis Dummy

Y
mista, como no exemplo
Yc = a + b1.X + b2.D + b3.D.X
Se D = 0:
Yc = a + b1.X
Se D = 1:
Yc = (a+b2) + (b1+b3).X
X
18
Regressão Não Linear




Muitos processos econômicos são mais bem explicados por
funções não lineares
Ocorre quando a relação entre Y e a variável X não é linear
Podemos verificar se a relação é ou não linear analisando o gráfico
de dispersão x,y
Em um estudo de modelos lineares, a relação não linear pode
também ser identificada pela análise dos resíduos.
Y
Função quadrática:
Yc = a + bX + cX2
X
19
Regressão Não Linear
É possível expressar relações não lineares usando modelos lineares
 Regressão Polinomial
a) Regressão Polinomial de 2ª Ordem
 Função: Yc = a + bX + cX2
 Neste caso, a função é não linear porque inclui a variável não linear X2
 No entanto, todos os coeficientes (a, b e c) são lineares.
 Não aparecem como exponencial nem multiplicadores uns dos outros.
 Neste caso, podemos expressar o modelo por uma expressão linear,
definindo uma nova variável como o quadrado de X
 Basta incluir uma nova coluna nos dados com o quadrado de X e incluir
esta nova variável no modelo.

20
Regressão Não Linear
b) Regressão Polinomial de 3ª Ordem
a) Função: Yc = a + bX + cX2 + dX3
b) Novamente, todos os coeficientes são lineares.
c) Para transformá-la numa função linear, basta incluir 2 novas colunas
nos dados:
1) uma com o quadrado de X (x2)
2) outra com o cubo de X (x3) e incluir essas novas variáveis no
modelo.
c) Regressões não lineares que suportem transformações em
expressão linear mais complexa não são escopo da disciplina
21
Regressão Não Linear
d)
Função Exponencial
Yc = a.ebx na função linear → ln Yc = ln a + bx
1. Transformar as observações yi em ln yi
2. Calcular os coeficientes da reta de regressão
denominados como: intercepto h e declividade
k, e o coeficiente de determinação r2
3. Calcular os coeficientes a e b, fazendo:
•
•
a = eh (ln a = h)
b=k
22
Regressão Não Linear
Transformação de Variáveis com Logaritmos
Tipo
Linear
Equação
Ý = a + bx
Transformaçã Variável x Variável y
o
Ý = a + bx
x
y
Exponencial Ý = a.ebx
ln ý = ln a + bx
x
ln y
Logarítmica
Ý = a + b. ln x
Ý = a + b. ln x
ln x
y
Potência
Ý = a.xb
ln ý=ln a + b. ln x
ln x
ln y
23
Regressão Não Linear
Importante!
Não
são comparáveis, diretamente, os coeficientes de
determinação r2 de regressões em que a mesma
variável dependente esteja expressa em diferentes
apresentações, ou seja, y e a transformada lny
Tipo
Linear
Equação
Ý = a + bx
Transformação
Ý = a + bx
Variável x
Variável y
Exponencial Ý = a.ebx
ln Ý = ln a + bx
x
x
Logarítmica
Ý = a + b. ln x
Ý = a + b. ln x
ln x
y
ln y
y
Potência
Ý = a.xb
ln Ý=ln a + b. ln x
ln x
ln y
24
Regressão Não Linear
Usando a Função Tendência do Excel
para Regressões Não Lineares
1) Construa gráfico de dispersão x-y para os
dados originais do problema
2) Clique em qualquer dos pontos do gráfico de
dispersão apresentado
25
Regressão Não Linear

Com o botão direito do mouse, clique
em Adicionar Linha de Tendência



Selecione Opções



polinomial
ordem 2
exibir função no gráfico
exibir r2 no gráfico
OK
26
Download

Document