BIO 11443-Métodos Quantitativos Aplicados à Ecologia Prof. Adriano Sanches Melo - Dep. Ecologia – UFRGS [email protected] Página do curso: www.ecologia.ufrgs.br/~adrimelo/mq/ 04 de abril de 2006 -- O que é um modelo? Modelos matemáticos: y = b*x Exemplo: Faturamento em loja de sorvete Cada sorvete = 2 reais Se vendeu 3 sorvetes, faturamento = 6 reais Se vendeu 7 sorvetes, faturamento = 14 reais Se vendeu 13 sorvetes, faturamento = 26 reais Generalizando: Y = 2*X Modelos estatísticos: y = b*x + e Cada sorvete = em média 2 reais (depende do freguês!) Se vendeu 3 sorvetes, faturamento = em média 6 reais Se vendeu 7 sorvetes, faturamento = em média 14 reais Se vendeu 13 sorvetes, faturamento = em média 26 reais Generalizando: Y = 2*X + e Modelos estatísticos: y = b*x + e --Variáveis dependentes e independentes (respostas) (preditoras) Exemplos 5 6 7 A equação da reta Y = a + b*X a = intercepto b = coeficiente de inclinação ou coeficiente angular 3 4 1 0 1 2 Y b a 0 1 2 3 4 X 5 6 7 8 Exemplos: Valor pago (Y) = Tarifa*Número de unidades de produto (X) Valor pago (Y) = Taxa de entrada + Tarifa* Distância em km (X) O modelo de regressão Yi = 0 + 1Xi + i onde: Yi é o valor da variável resposta na observação i; 0 and 1 são parâmetros; Xi é um valor conhecido da variável explanatória; i termo relacionado ao erro, e que possui média E{i}=0 e variância 2{i} = 2; i e j não são correlacionados fazendo com que sua covariância seja zero (i.e. {i , j }=0 para todos i, j; ij). i = 1, 2, ..., n. Distribuição de probabilidades de Y Curva da Regressão 0 50 100 150 Heterogeneidade do habitat (X) E{Y} = 12 + 0.2X E{Yi} = 32 i = -3 Yi = 29 0 50 100 150 Heterogeneidade do habitat (X) --O modelo é simples, pois possui apenas 1 variável explanatória. --O modelo é linear nos parâmetros, pois nenhum parâmetro aparece como expoente, nem é multiplicado ou dividido por outro parâmetro. --O modelo é linear na variável explanatória, pois esta variável aparece apenas na primeira potência. O critério de Quadrados Mínimos (Least Squares) Definição de Q = ( Yi - [ 0 + 1Xi ] )2 Exemplo com média de uma população (aula anterior) Exemplo “regressão” com apenas a constante (= média; idem exemplo acima) Exemplo com regressão com apenas um coeficiente de regressão Como encontrar b0 e b1 ? 1. Por iteração (tentativa e erro) 2. De forma analítica b1 X X Y Y X X i i 2 i 1 b0 Yi b1 X i Y b1 X n 40 Riqueza de espécies 30 Q = 274.7 Y1=10 X1=20 Y2=28 X2=70 Y3=32 X3=120 20 10 Y = 23.3 + 0.0*X 0 40 Q = 32.7 30 b1 X X Y Y X X i 2 i 20 b0 Y b1 X 10 0 i Y = 7.933 + 0.22*X 0 50 100 150 Heterogeneidade do habitat SS Total (SST) = SS Regressão (SSR) + SS Resíduo (SSE) Yi Y Yˆi Y Yi Yˆi SST Yi Y 2 SSE Y Yˆ SSR Yˆi Y 2 2 i SSTotal (SST) = SSRegressão (SSR) + SSResíduo (SSE) ˆ ˆ Yi Y Yi Y Yi Yi SST SSR SSE Yi Yˆ Yˆ Y Y Yi Y Média = Y Estimado = Yˆ X O que acontece com Yi Yˆ quando os pontos, mantendo a mesma média, se aproximam da reta? Yi Yˆ Yˆ Y Y Yi Y Média = Y Estimado = Yˆ X O que acontece com igual à média? Yi Yˆ quando a reta de ajuste é Yi Yˆ Yˆ Y Y Yi Y Média = Y Estimado = Yˆ X Coeficiente de determinação Coeficiente de Correlação SSR R SST 2 r R 2 Um sinal de + ou – é anexado ao valor de acordo com a inclinação da reta Relação entre b1 e r: o coeficiente angular é o coeficiente de correlação ‘reescalado’ em relação aos desvios padrão de Y e X sy b1 r sx SSTotal (SST) = SSRegressão (SSR) + SSResíduo (SSE) ˆ ˆ Yi Y Yi Y Yi Yi SST SSR SST Yi Y 2 SSE Y Yˆ SSR Yˆi Y 2 2 i SSE Y Y MST Var 2 i n 1 SSR MSR 1 SSE MSE n2 SS Total (SST) = SS Regressão (SSR) + SS Resíduo (SSE) Yi Y Yˆi Y Yi Yˆi SST Yi Y 2 SSE Y Yˆ SSR Yˆi Y 2 2 i Quadrados Médios (MS) = variância = SS/df , onde df = n-1 Soma de Quadrados dos Resíduos (SSE) Quadrados Médios dos Resíduos (MSE) = SSE/df, onde df = n-2 Soma de Quadrados da Regressão (SSR) Quadrados Médios da Regressão (MSR) = SSR/df , onde df = 1