MB751– Modelos de Previsão Prof. Carlos H. C. Ribeiro [email protected] www.comp.ita.br/~carlos tel. (012) 3947 5895 sala 106 IEC Aula 2 Introdução a modelos de regressão Estimadores e suas propriedades Modelos de regressão a duas variáveis (cont.) Teorema Gauss-Markov 2 Regressão linear a duas variáveis Duas variáveis: Uma variável independente X Uma variável dependente Y Uma relação (desconhecida, mas assumida linear) entre as variáveis (Y depende de X) Um conjunto de observações de valores de X e respectivos valores de Y (amostras). Objetivo: achar uma função linear que melhor se ajuste aos dados X, Y disponíveis 3 Revisitando o exemplo 1 Y (nota média do vestibular) 8.0 6.0 7.0 4.0 6.0 7.0 5.0 5.0 X (salário mensal dos pais em R$1.000,00) 21 15 15 9 12 18 6 12 nota média no vestibular Relação nota X renda 10,0 8,0 6,0 4,0 2,0 0,0 0 5 10 15 20 25 salário mensal dos pais 4 Revisitando o exemplo 1: possíveis ajustes (1) Possibilidade 1: unir o ponto de menor valor de X ao ponto de maior valor de X Relação nota X renda nota média no vestibular 10,0 8,0 Qual é o problema com este método? 6,0 4,0 2,0 0,0 0 5 10 15 20 25 salário mensal dos pais 5 Revisitando o exemplo 1: possíveis ajustes (2) Possibilidade 2: achar uma boa reta no “olhômetro” Relação nota X renda nota média no vestibular 10,0 8,0 Qual é o problema com este método? 6,0 4,0 2,0 0,0 0 5 10 15 20 25 salário mensal dos pais 6 Revisitando o exemplo 1: possíveis ajustes (3) Possibilidade 3: achar uma reta que zera a soma dos erros Relação nota X renda nota média no vestibular 10,0 8,0 + + 6,0 + - - Qual é o problema com este método? - 4,0 - - 2,0 0,0 0 5 10 15 20 25 salário mensal dos pais 7 Revisitando o exemplo 1: possíveis ajustes (4) Possibilidade 4: Achar a reta que fornece o menor erro quadrático (erro2) em relação aos dados. Vantagens: Penaliza de modo igual erros “para menos” e erros “para mais” Penaliza mais erros grandes do que erros pequenos Existe um procedimento computacional para achar esta reta: o método dos mínimos quadrados 8 Regressão linear: mínimos quadrados Objetivo: achar a relação linear de dependência de Y em relação a X através da equação da reta Yˆ bX i a que a soma: N no. de dados Y i Yˆi tal 2 i 1 dado ponto da reta é mínima. 9 Regressão linear: mínimos quadrados Yˆ bX i a N X iYi X i Yi b i i N X i 2 i i X i i 2 Y a i b i N Xi Y bX i N 10 Exemplo 2: revisitando o exemplo 1 Exemplo 2 11 Exercício 1 Você é um secretário do BC de um certo país. Seu assessor lhe passa os seguintes dados históricos, relativos à quantidade de dinheiro disponível e renda nacional, em milhões de US$: Ano Qtde dinheiro Renda nacional 1993 2,0 5,0 1994 2,5 5,5 1995 3,2 1996 a) Represente os pontos em um diagrama de dispersão. 6,0 b) Estime e plote a regressão linear. 3,6 7,0 c) 1997 3,3 7,2 1998 4,0 7,7 1999 4,2 8,4 2000 4,6 9,0 Se você tivesse controle sobre a quant. de dinheiro disponível e desejasse uma renda nacional de US$ 12.000.000,00 em 2003, em que nível você posicionaria a quant. de dinheiro? Explique. 2001 4,8 9,7 2001 5,0 10,0 Exercício 1 12 Conceitos básicos de Estatística Já vistos em outro curso. Recomenda-se revisar os conceitos de: Variável aleatória Valor esperado e variância Distribuições conjuntas de probabilidade Covariância Independência Distribuições de probabilidade mais importantes: Normal, 2, t, F 13 Estimadores Estimação = definir valor de uma grandeza com base em N amostras desta. Exemplo 1a: Qual é a idade média dos alunos de MB751? Grandeza a estimar: idade média da turma. Um estimador deve prover um valor aproximado com base em um conjunto restrito de amostras. Para o valor médio de uma distribuição, um estimador “razoável” deve ser a média da amostra. Exemplo 1b: Qual é a variância das idades dos alunos de MB751? Grandeza a estimar: variância 2 das idades da turma. Um estimador deve prover um valor aproximado com base em um conjunto restrito de amostras. Para a variância de uma distribuição, um estimador “razoável” deveria ser a variância da amostra. Exemplo 3 14 Características desejáveis dos estimadores (1) Note que o próprio valor retornado por um estimador depende da amostra, ou seja: é uma variável aleatória! Preciso então definir algumas características desejáveis do estimador: 1. Não-tendenciosidade: O valor esperado do estimador deve ser igual ao valor da grandeza: A média da amostra é estimador não-tendencioso da média da população: N 1 X N ˆ X E ˆ X X i i 1 A variância da amostra não é estimador não-tendencioso da variância da população: ˆ 2 X 1 N N X i X X 2 E ˆ X X 2 2 i 1 Mas: ˆ 2 X 1 N 1 N X i 2 E ˆ X X 2 2 i 1 15 Características desejáveis dos estimadores (2) 2. Eficiência: Um estimador não-tendencioso é dito absolutamente eficiente se, para um dado tamanho da amostra, sua variância for menor que a de qualquer outro estimador não-tendencioso: Normalmente, um estimador pode ou não ser absolutamente eficiente, dependendo da distribuição. O que usamos mais é o conceito de eficiência relativa: um estimador nãotendencioso é dito relativamente mais eficiente do que outro se sua variância for menor. 16 Exemplo Seja o estimador para a média de uma distribuição: M 1 2 X1 3X 2 5 ou seja, ou seja, M1 sorteia dois elementos da amostra (X1 e X2) e calcula uma média ponderada destes. M1 é não-tendencioso? 2 X 1 3 X 2 2 E X 1 3E X 2 2 3 E M 1 E 5 5 5 Seja o estimador para a média de uma distribuição: M 2 N X i i 1 N 1 ou seja, M2 é um professor rigoroso: soma N notas e divide por N+1 para calcular uma nota final... M2 é não-tendencioso? N Xi E M 2 E i 1 N 1 N EX i i 1 N 1 N N 1 OBS : A tendenciosidade (ou viés) é E M 2 17 N N 1 Características desejáveis dos estimadores (3) 3. Erro quadrático médio mínimo (MMSE): Um bom compromisso entre nãotendenciosidade e eficiência! MMSE ˆ E ˆ 2 Var ˆ tendenciosidade ˆ 2 18 Exemplo 4 Sejam os estimadores para a média de uma distribuição: M1 2 X1 3X 2 M2 5 X1 X 2 3 Qual dos dois é melhor, pelo critério MMSE? E M 1 2 X 1 3 X 2 4 var X 1 9 var X 2 13 2 varM 1 var 5 25 25 MMSE M 1 2 13 2 25 13 2 25 2 E M 2 2 3 2 2 1 2 2 2 2 MMSE M 2 9 9 9 3 X X 2 var X 1 var X 2 2 2 var M 2 var 1 3 9 9 Exemplo 4 19 Características desejáveis dos estimadores (4) 4. Consistência: Um estimador é consistente se, a medida que a amostra cresce, o valor estimado vai convergindo para o valor verdadeiro. lim varˆ 0 lim E ˆ N N 20 Voltando ao nosso modelo... Para um dado valor de X, é possível que exista mais de um valor de Y. Exemplo: Padrão de consumo de um indivíduo que recebe R$ 30.000,00/ano. Possíveis causas de variação da parcela associada a alimentação: Mudanças de hábito espontâneas (e.g. dieta) Mudanças de hábito forçada (e.g. menos tempo para almoço devido à demanda profissional) Sazonalidade (chocolates na Páscoa, panetone no Natal, etc.) 21 O modelo Uma reta no plano X-Y: Yi X i Modelando a variação: Yi X i i Y: variável aleatória X: fixa ou não-estocástica (conhecida) : erro aleatório (baseado em uma distribuição de probabilidade) 22 O modelo: por que um “erro aleatório”? Em modelos matemáticos, o erro aleatório é sempre usado para modelar a ignorância. Em Econometria, a ignorância relaciona-se com: Simplificação excessiva, e.g. considerar preço como único determinante de uma demanda, ignorando causas secundárias (gostos, renda da população, etc.). Erros não-modelados na obtenção e medida dos dados Para cada valor de X, uma distribuição de probabilidade para . Logo: uma distribuição de probabilidade para Y. 23 Modelo estocástico: representação gráfica Yi X i i Para cada valor de X, uma distribuição de probabilidade para . Y Logo: uma distribuição de probabilidade para Y. Y3 Y2 Y1 X1 . . X2 X3 . Y X X 24 24 Formulação homoscedástica do modelo de regressão linear a duas variáveis Yi X i i Y: variável aleatória X: fixa ou não-estocástica (conhecida) : erro aleatório (baseado em uma distribuição de probabilidade) com: Valor esperado nulo e variância constante, independentemente das observações: E[i] = 0, Var[i] = 2 Erros de observações sucessivas não são correlacionados: E[i j] = 0 Distribuição normal 25 Heteroscedasticidade e autocorrelação do erro Yi X i i Heteroscedasticidade: erro com variância variável, dependente das observações: E[i] = 0, Var[i] = i2 Autocorrelação: erros de observações sucessivas correlacionadas: E[i j] 0 Ilustração de alguns exemplos 26 O modelo estocástico e a regressão linear Vimos um procedimento para achar a melhor reta que modela uma relação linear entre variáveis X e Y: Mínimos Quadrados. Mas agora, a relação é probabilística: para um dado X, posso ter mais de um Y. Exemplo 5 A reta agora pode variar. O que fazer? 27 Teorema Gauss-Markov Yˆ bˆX i aˆ O “^” sobre a e b indica que estes agora devem ser estimadores de a e b. E o que quero, como sempre são bons estimadores: não-tendenciosos e eficientes. A boa notícia é o TEOREMA GAUSS-MARKOV: o método dos mínimos quadrados produz estimadores de a e b que são BLUE: best linear unbiased estimator. 28 Linear na variável independente (X) N X Y X Y b i i i N i i i X 2 i Y i i X i 2 X i i a b i i i N N BLUE O mais eficiente (menor variância) Estimador Não-tendencioso E bˆ b Eaˆ a 29 Atividade 1 (Manhã) Um estudo sobre empresas objetiva determinar a variação dos custos operacionais em função do tamanho destas. Três análise foram conduzidas independentemente, sendo produzidos os resultados ilustrados nas tabelas abaixo: Estudo 1 a) Custos (em US$1000,00) Empresa 1 Empresa 2 Empresa 3 Empresa 4 Empresa 5 3,0 4,5 7,0 11,0 15,0 Empresa 1 Empresa 2 Empresa 3 Empresa 4 Empresa 5 3,2 4,0 9,0 14,0 20,0 Estudo 2 Custos (em US$1000,00) Estudo 3 Custos (em US$1000,00) Empresa 1 Empresa 2 Empresa 3 Empresa 4 Empresa 5 2,9 5,0 5,5 8,0 26,0 a) Represente os pontos em um diagrama de dispersão. Existe heteroscedasticidade? Justifique. b) Estime e plote a regressão linear para cada análise realizada. c) Calcule a média e variância das estimativas para os coeficientes a e b da regressão. 30