Luiz Carlos Terra Análise de Regressão Em mercadologia é importante conhecer as ferramentas existentes para estimação dos valores de vendas, de preços de produtos ou de custos de produção. A análise de regressão representa um instrumento valioso para a realização dessa tarefa. Nessa aula, você terá uma importante base teórica para o entendimento dessa técnica. (Luiz Carlos Terra) Análise de Regressão 1 Objetivo Em mercadologia é importante conhecer as ferramentas existentes para estimação dos valores de vendas, de preços de produtos ou de custos de produção. A análise de regressão representa um instrumento valioso para a realização dessa tarefa. Nessa aula, você terá uma importante base teórica para o entendimento dessa técnica. Tópicos: 1 - Regressão linear simples. 2 - Diagrama de dispersão. 3 - Ajustamento da reta. 4 - Exercício resolvido. 5 - Saiba mais. 6 - Bibliografia. 1 – Regressão Linear Simples Regressão Linear Simples: Quando você estudou as medidas de posição ou de dispersão, o conjunto de dados era composto por apenas uma variável. Vimos na aula anterior que é possível verificar se existe associação entre duas ou mais variáveis, calculando o coeficiente de correlação. Agora mostraremos através da análise de regressão, como constroem-se modelos estatísticos de relações entre essas variáveis, possibilitando a previsibilidade de valores. Assim, estabelecendo um valor para a variável independente, é possível estimar o valor para a variável dependente. Na REGRESSÃO, assim como foi explicado na teoria da correlação, a variável y é chamada de variável dependente e a variável x, de variável independente. Sendo y uma variável que nos interessa estudar e cujo comportamento futuro desejamos prever, é fácil identificarmos uma série de variáveis xi (x1, x2, x3,... xn) que influenciam o comportamento de y, a variável dependente do modelo yi.(y1, Y2, Y3 ,...Yn). O modelo a ser estudado é o de regressão linear simples, representado pela fórmula da equação de reta: y = a + bx. É uma regressão linear por que supõe-se o ajustamento dos pontos de encontro das duas variáveis em torno de uma reta. Ao mesmo tempo, esse modelo é também uma regressão linear simples, pois embora a regressão possa envolver mais de uma variável, abordaremos um caso com duas variáveis apenas. Quando tratar-se do estudo da relação entre mais de duas variáveis, a regressão será chamada de regressão múltipla e embora os cálculos sejam mais complexos, o raciocínio é o mesmo. 2 Análise de Regressão 2 - Diagrama de Dispersão Suponhamos que dispomos dos seguintes dados: a renda média familiar da população de várias cidades e a quantidade de carros zero quilômetro vendidos pela principal loja da cidade em um mês. Assim, observe o gráfico abaixo: Renda ($1.000) 5 10 20 8 4 6 12 15 Cidade A B C D E F G H Carros 0 km vendidos (em unidades) 27 46 73 40 30 28 46 59 Uma forma de verificar se há relação entre a renda e as vendas de carros é colocar os dados em um gráfico, denominado diagrama de dispersão, onde a renda é medida ao longo do eixo horizontal e as vendas de carros, medidas ao longo do eixo vertical. O cruzamento das duas observações é marcado com um ponto, conforme mostrado a seguir: Vendas em função de renda Vendas 80 60 40 20 0 0 10 20 30 Renda Observa-se nesse gráfico que há uma tendência de crescimento linear entre as variáveis, ou seja, quanto mais elevada a renda, maior será o consumo do produto. O coeficiente de correlação confirma essa tendência, pois seu índice é de 0, 98; ou seja, bem próximo de um, o que significa uma forte relação positiva entre a renda e as vendas. Quanto mais cresce a renda da população dessas cidades, maior é a procura por carros zero quilômetro. Análise de Regressão 3 3 - Ajustamento da Reta (Método dos Mínimos Quadrados) Pela equação da reta y = a + bx, é necessário identificar qual é a verdadeira reta que passa pelos pontos de cruzamento das observações. Para isso, é necessário calcular os valores de a e b, que são os coeficientes de determinação dessa reta, sendo a o coeficiente linear, ou seja, o ponto em que a reta corta o eixo dos y e b; o coeficiente angular. Essa será a reta que passa o mais próximo possível dos pontos observados no diagrama de dispersão, tornando mínima a distância entre os pontos observados e ela. O método que minimiza as discrepâncias entre os pontos e a reta, sendo o melhor para a determinação dos parâmetros a e b é o método dos mínimos quadrados, que torna possível calcular esse parâmetros com a aplicação das seguintes fórmulas: Onde: n = tamanho da amostra. = média dos xi. = média dos yi. Com os parâmetros a e b definidos, a reta de regressão que se ajusta aos dados é representada por: Y = 14,58 + 2,90 X; onde, calculando pela fórmula acima, descobre-se que 2,90 equivale ao b calculado; 14,58 ao a, X é a renda observada e Y é o número de carros vendidos. Com essa equação da reta de regressão, é possível fazer a projeção de valores para outras cidades, verificando a possibilidade de estabelecer novas lojas de carros nelas. Por exemplo, se existe a informação de que em determinada cidade a renda média mensal da população é de $ 25.000, pode-se estimar que haverá uma demanda por aproximadamente 87 carros novos. 4 Análise de Regressão O cálculo para estimar esse valor foi feito com base na equação da reta de regressão, assim: Y = 14,58 + 2,90 x 25, onde 14,58 e 2,90 são os parâmetros calculados para identificação da reta, 25 é a observação da renda dessa cidade ($ 25.000,) e Y é o valor que se quer estimar. Logo, Y = 14,58 + 72,50 = 87,08. Vale lembrar também que a complexidade dos cálculos para identificação dos parâmetros da reta é superada pela possibilidade de calculá-los através de calculadoras eletrônicas ou ainda, pelo excel. Em SAIBA MAIS, estarão os passos para os cálculos dos coeficientes da reta de regressão pela HP12C e pelo excel. 4 - Exercício Resolvido Utilizando os dados abaixo: a) Construa o diagrama de dispersão. b) Ajuste uma reta aos dados pelo método de mínimos quadrados. Trace-a no diagrama de dispersão. c) Qual é o custo para 16 unidades do artigo? Quantidade (x) Custos (y) 10 11 12 13 14 15 100 112 119 130 139 142 Solução: a) Diagrama de dispersão Custos Diagrama de dispersão 160 140 120 100 80 60 40 20 0 0 5 10 15 20 Quantidades Análise de Regressão 5 b) Ajustamento da reta Nesse item, precisamos avaliar a e b. É conveniente a construção da tabela: ∑ 6 X 10 11 12 13 14 15 75 Y 100 112 119 130 139 142 742 Xy 1000 1232 1428 1690 1946 2130 94 26 X2 100 121 144 169 196 225 955 Análise de Regressão 140 _____ y= 15,79 + 8,63x Custos 130 120 110 100 10 11 12 13 14 Quantidades c) Custo para 16 unidades Como x = quantidade e y = custo, basta calcularmos o valor de y quando x = 16. Assim: y = 15,79 + 8,63. (16) y = 153,87 Logo o custo para dezesseis unidades será de R$ 153,87. Cálculo dos parâmetros a e b, pela HP-12C. - Após a introdução dos dados Y – ENTER e X -∑+, para cálculo do coeficiente de correlação (lembre-se: introduzidos X e Y, tecla azul seguida de tecla 2 e tecla x<>y = - r -.), digitam-se na sequência as seguintes teclas: - Tecla 0, tecla g, tecla 2 = o valor que aparece é o valor de a. - Tecla STO, tecla 0, tecla 0, tecla g, tecla 1, tecla CHS, tecla RCL, tecla 0. - Tecla x<>y; tecla ¸ = o valor que aparece é o valor de b. saiba mais Cálculo pelo Excel: - Primeiro passo – colocar os valores de X e Y em duas colunas. - Segundo passo – escolha as funções: inclinação para conhecer o valor de b e a função intercepção para conhecer o valor de a. Em – val, conhecidos- digita-se a primeira e a última célula tanto dos valores de Y quanto dos valores de X, separadas por dois pontos. Análise de Regressão 7 Anotações: bibliografia _________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________ Spiegel, Murray R. _________________________________________________________________________________________________________________________________________________ Estatística – Ed. _________________________________________________________________________________________________________________________________________________ McGraw-Hill – 1993 _________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________ Lopes, Paulo Afonso – _________________________________________________________________________________________________________________________________________________ Probabilidade e _________________________________________________________________________________________________________________________________________________ estatística – Ed. _________________________________________________________________________________________________________________________________________________ Reichmann e Affonso _________________________________________________________________________________________________________________________________________________ Editores. _________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________ Stevenson, William J. _________________________________________________________________________________________________________________________________________________ Estatística aplicada à _________________________________________________________________________________________________________________________________________________ administração – Editora Harbra _________________________________________________________________________________________________________________________________________________ Complementar. _________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________ Braule, Ricardo – _________________________________________________________________________________________________________________________________________________ Estatística aplicada _________________________________________________________________________________________________________________________________________________ com excel – Editora _________________________________________________________________________________________________________________________________________________ Campus. _________________________________________________________________________________________________________________________________________________ ______________________________________________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ _______________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ 8 Análise de Regressão