Regressão Linear Múltipla Variáveis Binárias Relações Não-Lineares Regressão Linear Múltipla yc = a + bx1 + cx2 + … mxn + ui ou yc = b0 + b1x1 + b2x2 + … bnxn + ui 2 Regressão Linear Múltipla EXEMPLO REGRESSÃO DE LCRED (Y) EM FUNÇÃO DE LDEP (X1), LAPL (X2), LTVM (X3) obs. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 banco 1 2 3 4 5 7 15 22 23 24 38 51 65 87 lcrd 23,81 23,03 22,86 21,99 23,20 20,84 21,65 21,95 22,11 22,01 22,23 23,85 21,44 21,62 ldep 24,38 23,98 23,24 22,10 23,03 21,12 22,44 21,71 22,44 21,52 22,41 25,14 21,83 23,06 lapl 23,04 22,57 22,41 22,34 22,30 18,56 21,78 22,38 21,40 20,84 21,23 23,63 20,35 21,34 ltvm 22,89 23,39 21,75 22,48 22,49 21,25 23,24 21,82 21,99 21,24 21,51 24,79 21,50 22,76 3 Regressão Linear Múltipla Análise do ajuste Estatística de regressão R múltiplo R-Quadrado R-quadrado ajustado Erro padrão Observações 0,9468 0,8964 0,8653 0,3292 14 4 Regressão Linear Múltipla Interseção ldep lapl ltvm Avaliação da significância estatística de cada coeficiente Coeficientes 8,414 0,698 0,327 -0,406 Erro padrão Stat t 2,060 4,085 0,164 4,255 0,118 2,783 0,167 -2,425 valor-P 0,0022 0,0017 0,0193 0,0357 95% 95% Inferior Superior inferiores superiores 90,0% 90,0% 3,825 13,004 4,681 12,148 0,333 1,064 0,401 0,996 0,065 0,589 0,114 0,540 -0,779 -0,033 -0,709 -0,103 5 Regressão Linear Múltipla Avaliação da significância estatística global do modelo H0: todos os coeficientes são iguais a zero simultaneamente H1: pelo menos um coeficiente é diferente de zero OU H 0 : r2 = 0 H 1 : r2 > 0 6 Regressão Linear Múltipla Avaliação da significância estatística global do modelo A significância econômica acontecerá com a rejeição da Hipótese Nula ANOVA gl Regressão Resíduo Total 3 10 13 SQ 9,371 1,083 10,454 MQ F F de significação 3,124 28,8318 3,09265E-05 0,108 7 Regressão Linear Múltipla Relação da estatística F com R2 Variação Explicada Variação da Regressão R Variação Total Variação até à Média Variação Explicada Variação da Regressão F Variação Não Explicada Variação dos Resíduos 2 / k 1 R F 2 1 R / nk 2 8 Regressão Linear Múltipla Para análise da utilidade das Regressões Múltiplas substitui-se r2 por r2 ajustado Ao adicionar novas variáveis independentes, r2 nunca diminuirá, aumentando em alguns casos O coeficiente de determinação ajustado r2 compensa esse aumento natural de explicação de r2 ao aumentar o número de variáveis independentes 9 Coeficiente r2ajustado r ajustado 1 1 r 2 n 1 nk onde: 2 (n - k) = graus de liberdade n = número de observações k = número de coeficientes estimados (variáveis utilizadas) Objetivo: medir a qualidade de ajuste da reta de regressão, penalizando o acréscimo de variáveis 10 Variáveis Dummy Variáveis Independentes Binárias Qualitativas, usadas para indicar a presença ou ausência de determinado fenômeno Assumem apenas o valor 0 ou 1 Exemplo Existência ou não de piscinas numa regressão do preço de casas Xi = 1, se a casa tem piscina Xi = 0, se a casa não tem 11 Variáveis Dummy Podem ser usadas também para avaliar qualitativamente algumas situações com mais de 2 alternativas possíveis Exemplo A qualidade da condição do piso da casa boa, média ou ruim Usam-se p – 1 variáveis, sendo p o número de possibilidades 12 Variáveis Dummy Xi = Xi + 1 = 1, se o piso está em boas condições 0, se não 1, se o piso está em condições médias 0, se não Deixa-se de fora a possibilidade de as condições serem ruins. Esta ocorre quando Xi = 0 e Xi + 1 = 0 Ou seja, o piso está em condições ruins quando não está em boas condições (xi = 0) nem em condições médias (xi + 1 = 0) 13 Variáveis Dummy O método dos mínimos quadrados não tem respostas se informam-se p variáveis (no exemplo, 3) ao invés de (p – 1) variáveis Também é inadequado informar-se apenas uma variável, que poderia assumir os valores 1(boa), 2 (média) e 3(ruim). Neste caso, se entenderia que a condição 3 (ruim) é 3 vezes tão ruim quanto a condição boa (1) 14 Variáveis Dummy Podem ser utilizadas de três formas aditiva, ou seja, alterando o intercepto multiplicativa, ou seja, alterando o coeficiente angular mista, ou seja, alterando o intercepto e o coeficiente 15 Variáveis Dummy Y aditiva, como no exemplo: Yc = a + b1.X + b2.D Se D = 0: Yc = a + b1.X Se D = 1: Yc = (a+b2) + b1.X X 16 Variáveis Dummy Y multiplicativa, como no exemplo Yc = a + b1.X + b3.D.X Se D = 0: Yc = a + b1.X Se D = 1: Yc = a + (b1+b3).X X 17 Variáveis Dummy Y mista, como no exemplo Yc = a + b1.X + b2.D + b3.D.X Se D = 0: Yc = a + b1.X Se D = 1: Yc = (a+b2) + (b1+b3).X X 18 Regressão Não Linear Muitos processos econômicos são mais bem explicados por funções não lineares Ocorre quando a relação entre Y e a variável X não é linear Podemos verificar se a relação é ou não linear analisando o gráfico de dispersão x,y Em um estudo de modelos lineares, a relação não linear pode também ser identificada pela análise dos resíduos. Y Função quadrática: Yc = a + bX + cX2 X 19 Regressão Não Linear É possível expressar relações não lineares usando modelos lineares Regressão Polinomial a) Regressão Polinomial de 2ª Ordem Função: Yc = a + bX + cX2 Neste caso, a função é não linear porque inclui a variável não linear X2 No entanto, todos os coeficientes (a, b e c) são lineares. Não aparecem como exponencial nem multiplicadores uns dos outros. Neste caso, podemos expressar o modelo por uma expressão linear, definindo uma nova variável como o quadrado de X Basta incluir uma nova coluna nos dados com o quadrado de X e incluir esta nova variável no modelo. 20 Regressão Não Linear b) Regressão Polinomial de 3ª Ordem a) Função: Yc = a + bX + cX2 + dX3 b) Novamente, todos os coeficientes são lineares. c) Para transformá-la numa função linear, basta incluir 2 novas colunas nos dados: 1) uma com o quadrado de X (x2) 2) outra com o cubo de X (x3) e incluir essas novas variáveis no modelo. c) Regressões não lineares que suportem transformações em expressão linear mais complexa não são escopo da disciplina 21 Regressão Não Linear d) Função Exponencial Yc = a.ebx na função linear → ln Yc = ln a + bx 1. Transformar as observações yi em ln yi 2. Calcular os coeficientes da reta de regressão denominados como: intercepto h e declividade k, e o coeficiente de determinação r2 3. Calcular os coeficientes a e b, fazendo: • • a = eh (ln a = h) b=k 22 Regressão Não Linear Transformação de Variáveis com Logaritmos Tipo Linear Equação Ý = a + bx Transformaçã Variável x Variável y o Ý = a + bx x y Exponencial Ý = a.ebx ln ý = ln a + bx x ln y Logarítmica Ý = a + b. ln x Ý = a + b. ln x ln x y Potência Ý = a.xb ln ý=ln a + b. ln x ln x ln y 23 Regressão Não Linear Importante! Não são comparáveis, diretamente, os coeficientes de determinação r2 de regressões em que a mesma variável dependente esteja expressa em diferentes apresentações, ou seja, y e a transformada lny Tipo Linear Equação Ý = a + bx Transformação Ý = a + bx Variável x Variável y Exponencial Ý = a.ebx ln Ý = ln a + bx x x Logarítmica Ý = a + b. ln x Ý = a + b. ln x ln x y ln y y Potência Ý = a.xb ln Ý=ln a + b. ln x ln x ln y 24 Regressão Não Linear Usando a Função Tendência do Excel para Regressões Não Lineares 1) Construa gráfico de dispersão x-y para os dados originais do problema 2) Clique em qualquer dos pontos do gráfico de dispersão apresentado 25 Regressão Não Linear Com o botão direito do mouse, clique em Adicionar Linha de Tendência Selecione Opções polinomial ordem 2 exibir função no gráfico exibir r2 no gráfico OK 26