Métodos Quantitativos Aplicados ao AGRONEGOCIOProf.Waldenir S.F.Britto-Disciplina de Agronegocio FACAPE1
Muitos dos procedimentos empregados nos processos de gestão de custos e
formação de preços são compreendidos de forma melhor, mediante a aplicação de
técnicas de métodos quantitativos, especialmente de estatísticas e de pesquisa
operacional.
A estatística, que tem sua origem epistemológica no latim status – que provem
de Estados, das informações coletadas em prol da melhor gestão do Estado - , fornece
importante subsídio aos processos de gestão empresarial. Aplicada a custos, permite,
por exemplo, analisar as magnitudes dos gastos fixos e variáveis.
Este capítulo possui o objetivo de discutir os principais tópicos da estatística
relacionados aos processos de compreensão dos custos, especialmente as análises de
regressão e correlação, com ênfase no uso do método dos mínimos quadrados. Para
tornar a leitora mais branca e facilitar a fixação dos tópicos apresentados, são propostos
inúmeros exercícios, todos com suas respectivas respostas.
Alunos ou leitores que não desejam efetuar aplicações mais significativas de
métodos quantitativos em custos podem abdicar da leitura deste capítulo, sem prejuízo
da compreensão dos demais capítulos.
CONCEITOS INICIAIS DE REGRESSÃO E CORRELAÇÃO
A análise de regressão e correlação tem como objetivo estimar numericamente o
grau de relação que possa ser identificado entre populações de duas ou mais variáveis, a
partir da determinação obtida com base em amostras selecionadas dessas populações
focalizadas. A regressão e correlação possibilitam comprovar numericamente se é
adequada a postulação lógica realizada sobre a existência de relação entre as populações
de duas ou mais variáveis.
O termo regressão foi originalmente apresentado por Sir Francis Galton. Em um
famoso ensaio, Galton verificou que, embora houvesse a tendência de pais altos terem
filhos altos e pais baixos terem filhos baixos, altura média de filhos de pais de
determinada altura tendia a descolar-se ou regredir até a altura média da população. Ou
seja, a altura dos filhos de pais extraordinariamente altos e baixos tende a mover-se para
a altura média da população.
A lei da regressão universal de Galton foi confirmada por outro matemático,
Karl Pearson, que coletou mais de 1.000 registros das alturas média dos filhos de um
grupo de pais altos era inferior à altura de seus pais, e que a altura média dos filhos de
um grupo de pais baixos era superior à altura de seus pais. Dessa forma, tanto os filhos
altos como baixos regrediram em direção à altura média de todos os homens. Na
palavra de Galton, tal fato consistiria em uma regressão à mediocridade.
De forma mais recente, a análise de regressão ocupa-se do estudo da
dependência de uma variável dependente, em relação a uma ou mais variáveis, as
variáveis explicativas, com o objetivo de estimar ou prever a média (da população) ou
valor médio da dependente em função dos valores conhecidos ou fixas (em amostragem
repetida) das explicativas.
1
Baseado em BRUNI, Adriano Leal, & FAMÁ, Rubens. Gestão de custos e formação de preços. Ed. Atlas. 3.ª edição. São Paulo.
SP
1
Nos processos de gestão de custos e preços, análise de regressão e correlação
possibilita uma série de insights úteis no processo de geração de informações e tomada
de decisões. Pode-se, por exemplo, analisar o comportamento volumétrico dos custos –
identificando custos fixos e variáveis – sem, necessariamente, ser preciso efetuar uma
classificação de cada gasto.
Outra aplicação interessante consiste na utilização conjunta das técnicas de
regressão e correlação nas análises relativas aos orçamentos, como, por exemplo,
estimativa de vendas, custos e preços futuros.
A seguir estão apresentados os conceitos teóricos associados às análises de
regressão e correlação e uma série de aplicações das técnicas na compreensão de custos
e preços.
ANÁLISE DE REGRESSÃO
Definição
A análise de regressão fornece uma função matemática que descreve as relações
entre duas ou mais variáveis. A natureza da relação é caracterizada por essa função ou
equação de regressão.
Essa equação pode ser usada para estimar ou predizer valores futuros de uma
variável, com base em valores conhecidos ou supostos, de uma ou mais variáveis
relacionadas. A análise de regressão é útil em administração, economia, agricultura,
pesquisa médica etc.
Modelos matemáticos versus modelos estatísticos
Para poder explicar os modelos desenvolvidos para análise de regressão, torna-se
importante diferenciar os modelos matemáticos e os modelos estatísticos.
Um modelo matemático descreve uma relação entre diferentes variáveis. Poe
exemplo, um modelo matemático que descreve a relação entre duas variáveis, do tipo y
= f (x), ou y =y a + b . x, pode-ser apresentado graficamente pela figura seguinte.
Os valores de x estão diretamente associados aos valores de y – que são
inteiramente explicados pelos valores x. Para ilustrar, considere o comportamento das
variáveis apresentadas na tabela seguinte.
y
8
7
6
5
4
3
1
2
3
4
5
x
2
x
0
1
2
3
4
5
y
3
4
5
6
7
8
Considerando apenas dois pontos assinalados e empregando um sistema simples
de equações, com duas incógnitas, x e y, e duas equações, seria possível determinar o
comportamento da relação: y = a + b . x. Ou, y = 3 + 1 . x.
Um modelo estatístico costuma envolver a determinação do melhor modelo exato ou
preciso. Aceita-se que, uma relação do tipo y = a + b . x, possam existir outras variáveis
que interfiram nos valores de Y. O modelo matemático pode ser representado por y = a
+ b . x + e. onde e consiste em um erro associado ao processo de determinação dos
valores de y com base em x. Veja a figura seguinte.
y
e5
e6
e3
e4
e1
e2
x
O processo de estimação do modelo deve ser feito de forma a diminuir ao máximo
possível os valores dos erros encontrados.
Regressão linear simples
A análise de regressão linear simples tem por objetivo obter a equação
matemática da reta que representa o melhor relacionamento numérico linear entre o
conjunto de pares de dados, em amostras selecionadas dos dois conjuntos de variáveis.
A equação da reta obtida pode ser apresentada como:
Y = a + b. x
De modo geral, as variáveis x e y, por convenção, são definidas do seguinte modo:
·
·
y = variável dependente, explicita;
x = variável independente, explicita.
É importante destacar que a análise simples de regressão linear apenas se
preocupa em determinar a forma numérica de associação entre x e y. Não estabelece
3
nenhuma relação de causa. Os cuidados associados à análise de regressão e correlação
serão apresentados com maior profundidade a seguir.
O modelo linear obtido caracteriza a relação entre o conjunto de pares de
valores, na amostra analisada. Pode ser utilizada para estimar valores de uma variável
com base em valores estipulados para a outra variável, dentro dos limites da amplitude
dos valore estipulados para a outra variável, e dentro dos limites da amplitude dos
valores da amostra, como também para predizer valores de uma variável, com base no
conhecimento de quais serão os valores da amostra. O modelo linear obtido consiste em
uma estimativa da reta de ajuste para as duas populações.
No processo de determinação da equação de regressão linear simples, objetiva-se
elaborar a equação geral da reta,com modelo: y = a + b.x. Assim, devem ser
determinadas as duas constantes:
a = o valor de yi, quando xi = 0, ou incerpto da reta no eixo y
b = o valor do coeficiente angular, que indica a inclinação da reta
No processo de valores das constantes a e b, costuma-se aplicar o método dos
mínimos quadrados, desenvolvidos originalmente por Legendre e aperfeiçoados pelas
idéias e trabalhos de Galton e Pearson. O método permite obter o valor das duas
constantes a e b, determinando a reta estimada, ou equação de regressão. Uma dedução
algébrica do modelo está apresentada no anexo deste capitulo.
A aplicada do método dos mínimos quadrados gera três características
importantes relacionadas com a reta de regressão obtida:
a) é mínima a soma dos quadrados dos desvios para a reta de regressão, menor que a
de qualquer outra reta de ajuste;
b) é igual a zero a soma algébrica dos desvios verticais entre o valor da ordenada de
cada ponto da amostra analisada e a correspondente ordenada da reta estimada;
c) a reta estimada passa pelo ponto de coordenadas (x, y), que correspondem à
medida dos pares da amostra.
A reta estimada de regressão é y = a + bx, onde:
y = valor calculado na reta de regressão para os valores de x
a = ordenado do intercepto da reta no eixo y
b = coeficiente angular da reta de regressão
O método dos mínimos quadrados determina que a e b devem ser obtidos de modo que:
Sg-bSc
a = ¾¾¾¾¾
n
n(Scg) - (Sc Sg)
b = ¾¾¾¾¾¾¾
n(Sc²) - (Sc)²
Há algumas hipóteses a serem consideradas na aplicação do método dos
mínimos quadrados:
a) Para cada valor de x haverá possíveis valores para y.
4
b) A variável y é aleatória
c) Para cada valor de x há uma distribuição condicional de y que é normal.
d) Os desvios-padrões de todas as distribuições condicionais são iguais.
Para ilustrar a aplicação do método dos mínimos quadrados, veja o exemplo das
Indústrias Guanabara Ltda., que analisaram a relação entre gastos com publicidade e
vendas nos últimos anos. Os dados coletados (todos em mil reais) estão apresentados na
tabela seguinte.
Gastos com puplicidade (x,
em mil reias)
3
4
8
12
14
41
Vendas
(y, em mil reias)
7
14
15
28
32
96
Representando em gráfico a relação entre x e y, exibida na figura seguinte, notase a inexistência de uma relação linear exata. A disposição dos pontos, porém sugere o
fato de se aceitar a construção de uma estimativa linear, que minimize os erros dos
ajustes.
35
30
25
20
15
10
5
0
3
4
8
12
14
G a stos c om p ublic ida de , e m mil re a is
O método dos mínimos quadrados permite efetuar esse ajuste. Para aplicar o
método, é necessários obter as somas Sx, Sy, Sx² e Sxy. Para facilitar a obtenção das
somas, foi construída a seguinte tabela:
Gastos com puplicidade (x,
em mil reias)
3
4
8
12
14
41
Sx = 41
Vendas
(y, em mil reias)
7
16
15
28
32
96
Sy = 96
x²
y²
9
196
64
144
196
Sx² = 429
xy
49
56
225
784
1.024
Sy² = 2.278
21
120
336
448
Sxy = 981
5
Para ajustar uma reta aos dois pontos, obtiveram os valores de a e b, na equação
do tipo y = a + b . x. Considerando que o número de par de dados analisados foi igual a
5 (n = 5) e aplicando as fórmulas:
n(Scg) - (Sc Sg)
5(981) - (41 .96) 969
b = ¾¾¾¾¾¾¾ = ¾¾¾¾¾¾¾ = ¾¾ = 2,0884
n(Sc²) - (Sc)²
5(429) - (41)²
464
Sg-bSc
95 - 2,0884 . 41
10,3756
a = ¾¾¾¾ = ¾¾¾¾¾¾¾ = ¾¾¾¾ = 2,0751
n
5
5
Com base nos valores obtidos para a e b, é possível determinar que a reta que
melhor ajusta os pontos é do tipo: y = 2,0751 + 2,0884x. A reta de ajuste pode ser vista
no diagrama de dispersão apresentado a seguir.
y = 2,0754 + 2,0884x
35
30
25
20
15
10
5
0
3
4
8
12
14
G a stos c om p ublic ida de , e m mil re a is
ANÁLISE DE CORRELAÇÃO
A análise de correlação determina um número que expressa uma medida
numérica do grau de relação encontrada. Esse tipo de análise é muito útil em trabalhos
exploratórios em áreas como educação e psicologia, quando se procura determinar as
variáveis potencialmente importantes.
Denomina-se simples a análise de correlação ou de regressão linear que envolve
apenas duas variáveis. Nesse caso, a amostra é formada por um conjunto de pares de
valores. O resultado da análise de correlação linear é expresso na forma de um
coeficiente de correlação – número que quantifica o grau de relação linear obtido para
os pares de valores de duas variáveis que formam a amostra analisada.
O grau de relação numérica linear entre duas variáveis contínuas é feito por um
coeficiente de correlação linear simples denominado “r de Pearson”. São hipóteses
fundamentais para que a obtenção do coeficiente seja válida:
· As duas variáveis envolvidas são aleatórias e contínuas;
· A distribuição de freqüência conjunta para os pares de valores das duas
variáveis é uma distribuição normal.
O procedimento envolve os seguintes passos:
1º Passo: Colocar em ordem crescente os valores de uma das variáveis na
amostra e colocá-os ao longo de um dos eixos das abscissas. Como os valores de x e y
são estabelecidos, a ordenação de y será determinada pela ordenação de x e vice-versa.
2º Passo: Colocar os valores de y no eixo das ordenadas.
6
3º Passo: Construir o diagrama de dispersão, que é a representação dos pares de
valores da amostra no plano dos eixos ortogonais. O diagrama permite concluir
antecipadamente se é adequado prosseguir para o cálculo r.
4º Passo: Calcular r, pela expressão:
²
S xy S x . S y
n
r =
S x²
Sx
n
n
n
²
.
n
S y²
Sy
n
n
²
Onde n = número de pares de valores na amostra analisada.
Como o valor encontrado para r foi próximo de 1, o grau de ajuste das retas ao
ponto pode ser considerado muito bom.
Entre as propriedades do coeficiente de correlação r pode-se destacar o fato de
que seu valor é um número adimensional. É um estimador do correspondente
parâmetro”p” para a população.
r = coeficiente de correlação linear simples para amostra;
p =coeficiente de correlação linear simples para população.
Seu sinal pode ser positivo ou negativo e sua faixa de variação está
compreendida entre –1 e 1. O coeficiente de correlação indica o grau da relação
numérica linear obtida, ou grau de ajuste de uma reta ao conjunto dos pontos da
amostra.
Faixa de variação de r: -1 ≤ r ≥ 1
· quanto mais próximo r estiver de + 1, mais próximos estarão os pontos
de ajuste integral a uma reta crescente;
· quanto mais próximo r estiver de – 1, mais próximos estarão os pontos
de ajuste integral a uma reta decrescente;
· se r = 0, não foi identificada relação numérica linear para os pares de
valores de amostra analisada.
A depender do valor do coeficiente de correlação, diferente será a classificação
da correlação. Veja os exemplos seguintes.
Correlação linear positiva
A correlação é positiva se os valores crescentes ou decrescentes x
e y estiverem ligados. Ou seja, quando y cresce, x cresce também e vice-versa.
Nos modelos de correlação linear positiva, o valor do coeficiente de correlação
de Pearson, r é positivo: 0 < r < 1
Correlação linear perfeita positiva
A correlação linear perfeita positiva apenas ocorre quando os valores
de x e y estão perfeitamente alinhados. Nessa situação, o valor do coeficiente de
correlação de Pearson, r,
é igual à unidade de: r = 1.
7
Correlação negativa
A correlação negativa é percebida quando valores crescentes de x ou
y estão associados a valores decrescentes de y ou x, respectivamente. Ou seja,
quando y cresce, x decresce e vice-versa. O valor do coeficiente de correlação
de Pearson, r é negativo: -1 < r < 0
Correlação perfeita negativa
A correlação perfeita negativa quando os valores de x e y estiveram
perfeitamente alinhados, mas em sentido contrário. Nessa situação, o valor
do coeficiente de correlação de Pearson, r, é igual a menos um: r = -1.
Correlação nula
A correlação nula é percebida quando não há relação entre x
e y. As variáveis ocorrem independentemente. Nessa situação, o valor
do coeficiente de correlação de Pearson, r, é nulo: r = 0.
Para ilustrar, em relação ao exemplo da Indústria Guanabara, o cálculo do
coeficiente de correlação pode ser feito mediante o emprego da equação anterior:
equação anterior.
S xy S x . S y
n
r =
r =
S x²
Sx
n
n
1.502,3376
1.613,9776
n
²
.
²
n
=
S y²
Sy
n
n
²
41 . 96 ²
5
5
981
5
429
5
41
5
²
. 2.278
5
96
5
²
= 0,9648
O coeficiente de determinação, r²
O coeficiente de determinação, ou simplesmente r², além de expressar o
quadrado do coeficiente de correlação de Pearson, representa, também, a relação entre a
variação explicada pelo modelo e a variação total. Algebricamente, o valor de r² pode
ser apresentado como:
Variação explicada
r² = --------------------------Variação total
8
Substituindo os valores da variação explicada – variação explicada pelo modelo,
resultado da soma das diferenças dos valores reais e preditos de y – e da variação total –
_
n
S ( ^yi - y ) ²
i=1
r² =
_
n
S ( yi - y ) ²
calculada em relação à média -, pode-se apresentar a equação:
i=1
A interpretação do valor pode ser feita com o auxílio do gráfico seguinte.
Quanto maior o valor de r, maior o percentual da variação explicada em relação à
variação total.
y
Variação não
explicada
e
Variação
explicada
_
y
_
y
Variação
Total
y
_
x
x
O coeficiente de determinação expressa quanto da variação em relação à média é
explicada pelo modelo linear construído. Os valores de r² podem variar de 0 a 1.
Quando a média de r² é exatamente igual a 1, tal fato significa que a qualidade do ajuste
é excelente – toda a variação em relação à média é explicada pelo modelo, todos os
pontos analisados da mostra estão exatamente sobre a reta de regressão (ajuste integral).
Quando o valor de r² é igual a 0, tal fato indica que a qualidade do ajuste linear é
péssima, não havendo relação numérica linear para os pontos da amostra analisada.
Quando r² é igual a 0,8, este fato indica que 80% das variações totais são explicadas
pela reta de regressão.
Substituindo as fórmulas para r², tem-se que:
S xy S x . S y
r² =
_ _
(xy - x . y)²
(x² - x²) - (y² . y²)
n
ou r² =
S x²
Sx
n
n
n
²
.
²
n
S y²
Sy
n
n
²
De modo geral, para valores de r² iguais ou superiores a 0,60, diz-se que o ajuste
linear apresenta boa qualidade.
9
MODELOS NÃO LINEARES
As maiores parte dos modelos construídos para a análise de regressão e correlação são
modelos estritamente lineares. Em muitas situações, porém, existia a necessidade e
construção de modelos não lineares. Veja o exemplo dos dados fornecidos a seguir.
Vendas pela Internet no Brasil
Ano
Vendas
1
2
3
4
5
6
7
3
17
60
250
1.100
2.900
5.200
Caso se desejasse ajustar um modelo linear, a equação de ajuste e o diagrama de
dispersão dos pontos e da equação poderiam ser vistos na figura seguinte. Nota que os
pontos não se situam próximo de uma reta e, à medida que os valores de anos e vendas
aumentaram, maior o afastamento em relação à reta. Possivelmente, o melhor ajuste
linear aos pontos não ocorre sob a forma de reta, mas por um modelo de potência ou
polinômio.
6000
y = 799,89x - 1,838,1
R² = 7,7543
Vendas
5000
4000
3000
2000
1000
0
1
2
3
4
5
6
7
Anos
Um modelo de potência tem forma y = a . xª. Para poder aplicar o método dos
mínimos quadrados e ajustar os pontos à equação, determinando os valores logaritmos,
com base decimal ou neperianos. Com aplicação de logaritmos, é possível converter a
equação anterior para a forma de reta.
Algebricamente:
^
Se y = a . xb = Ln (y) = Ln (a . xb)
Ln (y) = Ln (a) + Ln(xb) = Ln (a) + b . Ln (x)
O modelo obtido pode ser representado por uma equação linear simples, do tipo:
Onde:
y* = Ln (y)
a* = Ln (a)
x* = Ln (x)
10
Calculando os logaritmos neperianos para os anos e vendas da tabela anterior, é possível compor a
seguinte tabela:
Ano
Vendas
Ln (Ano)
Ln (Vendas)
1
3
0,000
1,099
2
17
0,693
2,833
3
60
1,099
4,094
4
250
1,386
5,521
5
1.100
1,609
7,003
6
2.900
1,792
7,972
7
5.200
1,946
8,556
Após elaborar o diagrama de dispersão para os logaritmos neperianos e ajustar o
modelo linear pelo método dos mínimos quadrados, é possível obter os resultados
apresentados no gráfico seguinte. Os pontos dos logaritmos neperianos situam-se muito
próximos da reta de ajuste: o valo9r de r² foi igual a 0,9652, o que é aproximadamente
igual a 1.
y = 3,9674x + 0,4653
R² = 0,9652
10,000
8,000
6,000
4,000
2,000
0,000
0,000
0,693
1,099
1,386
1,609
1,792
1,946
Ln (Anos)
Com base nos coeficientes do modelo linear obtido para o logaritmo neperiano
dos dados, pode-se convertê-los nos coeficientes do modelo original sem transformação.
O coeficiente b não sofre alteração; seu valor no modelo de potência é igual ao modelo
linear transformado, no caso b = 3,9647. O coeficiente linear foi obtido pela
6000
5000
4000
y = 1,5925x 3,9674
R² = 0,9652
3000
2000
1000
0
1
2
3
4
5
6
7
Anos
transformação: a* = Ln (a). Assim, a = ea*. Logo, o valor de a é igual a e0,4653 = 1,5925.
O modelo de potência obtido é igual a: y = 1,5925 . 3,9674x.
Note que, embora o modelo de potência tenha fornecido melhor ajuste que o modelo
linear, primeiro ainda não é o ideal: à medida que os pontos afastam-se da origem,
maior o distanciamento entre o modelo de potência do ajuste e os pontos do diagrama.
Por meio de transformações algébricas, outros modelos não lineares poderiam ser
empregados. Veja o Quadro 17.1
11
Quadro 17.1 Modelos não lineares e respectivas transformações.
Função não linear
(I) y = ax
(II) y = a + bx + cx²
(III) y = a +b(1/x)
(IV) y=ae bx+cx²
Transformação
y* = a* + bx*
y = a +bx + cx*
y = a + bx*
y = a* + bx + cx*
CUIDADOS NECESSÁRIOS
CORRELAÇÃO
NA
Variáveis transformadas
y* = Ln(y); a* = Ln(a); x* = Ln(x)
x* = x²
x* = 1/x
y* = Ln(y); a* = Ln(a); x* = x²
ANÁLISE
DE
REGRESSÃO
E
A aplicação da análise de regressão e correlação implica a validade de algumas
hipóteses fundamentais para os modelos. Entre alguns dos principais cuidados a serem
tomados na aplicação das técnicas, podem ser destacados:
* multicolinearidade: indica que os coeficientes e testes calculados podem conduzir a
conclusões erradas, caso as variáveis exógenas, independentes, apresentam altas
correlações cruzadas. Supondo que a multicolinearidade seja estável, os valores
estimados ou preditos serão não tendenciosos. O maior problema, porém, existira em
relação ao valor do coeficiente de determinação, r², que pode ser alto, mesmo que os
coeficientes sejam estaticamente significantes;
* co-integração: aplica-se quando os dados estão distribuídos ao longo do tempo.
Quando as variáveis estão relacionadas com valores anteriores, com tendência ao longo
do tempo, associações espúrias podem levar a altos valores de r², sem que exista,
necessariamente, associação entre variáveis;
* heterocedasticidade: os modelos de regressão e correlação exigem que as variâncias
dos resíduos sejam constantes ou homocedásticas. Quando as variâncias não são
uniformes, existe a heterocedasticidade. Para modelos simples, bivariados, de regressão
linear, a heterocedasticidade pode ser facilmente percebida no diagrama de dispersão.
Quando, porém a análise envolve mais que duas variáveis, devem ser aplicadas testes
específicos;
* tendenciosidade pela omissão ou inclusão de variável: os resultados podem ser
viciados e inúteis, caso não sejam incluídas variáveis significativas ou sejam incluídas
variáveis sem relação racional com a variável estudada. Os efeitos da tendenciosidade
dependem da extensão com que variáveis, erradamente omitidas ou incluídas na análise,
estão relacionadas com a variável em estudo. A omissão de variáveis relevantes pode
conduzir a estimativa de coeficientes errados e testes de significância não confiáveis. A
inclusão de variáveis não importantes pode ocasionar testes conservadores de
significância, com baixa probabilidade de serem encontradas significativas para a
nulidade dos coeficientes, embora as estimativas dos coeficientes obtidos sejam não
tendenciosas;
* tendenciosas para equação simultânea: quando a variação da variável endógena
puder ser determinada pela interação simultânea de outras variáveis. Nessa situação, o
pesquisador deve estar consciente não apenas dos procedimentos de estimação, mas
também da necessidade da posse de dados suficiente para identificar todos os
parâmetros estruturais;
12
* estabilidade: consiste na suposição de que os coeficientes obtidos após as análises de
regressão e correlação são os mesmos em todo o período analisado. Geralmente, para se
testar a estabilidade, é comum a divisão do período analisado em duas partes e sua
posterior comparação;
* intervalo/razão: deve-se assumir a premissa de que a variável dependente é medida
na escala de intervalos ou razão. Se a variável dependente for nominal, devem ser
empregados modelos probit ou logit. Para empregar variáveis independentes não
numéricas (não intervalares ou razão), deve-se convertê-las para variáveis binárias
(dummy);
* autocorrelação: os resíduos das regressões devem estar dispersos aleatoriamente ao
longo da regressão. A existência de padrões nos resíduos indica a existência de
autocorrelação – que pode ser ocasionada em função da imposição de modelo linear a
uma relação linear ou da omissão de variáveis relevantes. Uma forma disponível para a
existência de autocorrelções consiste no teste de Durbin-Watson. Autocorrelções podem
indicar testes de significância sem validade e valores indevidamente altos de r²;
*linearidade: as relações precisam ser linearizadas para a posterior aplicação do
método dos mínimos quadrados. Transformações algébricas, como a aplicação de
logaritmos, podem permitir a linearização das relações;
* defasagens: os efeitos das variáveis independentes podem ter conseqüências sobre
múltiplos períodos. A depender das variáveis analisadas, o pesquisador pode construir
modelos defasados e testar sua propriedade;
EXERCÍCIOS PROPOSTOS
Exercício 1
A Empresa Chuvisco de Prata Ltda. Estudava os custos produtivos de seu
processo fabril. Gostaria de analisar a relação volumétrica entre os custos e sua
produção. Os dados dos últimos anos estão apresentados a seguir. Com base nos
números fornecidos e em um modelo de ajuste linear pelo método dos mínimos
quadrados, pede-se para: (a) encontrar a equação que ajusta os custos e a produção da
empresa; (b) determinar quais os custos fixos da empresa; (c) determinar qual o custo
variável unitário médio da empresa; (d) com base no coeficiente de determinação
obtido, expressar a qualidade do ajuste linear.
Ano
Produção
ton
Custos $
1995
150
1996
200
290.000 350.000
1997
180
1998
120
1999
250
2000
310
360.000
210.000
450.000
600.000
13
Exercício 2
A Saracoteando Ltda. Apresentou os seguintes custos de produção nos últimos
oito meses.
Mês
Custos (em $ 1.000,00)
1
22,00
2
25,00
3
27,00
4
29,00
5
32,00
6
34,00
7
36,00
8
40,00
Com base em um modelo de ajuste linear e no método dos mínimos quadrados,
pede-se estimar a projeção dos custos para o 10º mês.
Exercício 3
Os lucros anuais e a produção das indústrias Bate-Estaca Ltda. Estão
apresentados no quadro seguinte. Com base nos dados fornecidos, estime o ponto de
equilíbrio contábil em quantidades da empresas. Empregue um ajuste via modelo linear
e método dos mínimos quadrados.
Produção (unidades)
Lucro (em $)
150
90,00
60
-250,00
90
-150,00
140
70,00
250
550,00
310
750,00
130
30,00
0
-
Exercício 4
A gerência industrial da Fábrica Guarabira Ltda. Estudava as variações nos
custos de manutenção industrial de sua linha de produção. Duas variáveis estavam,
sendo analisadas de forma isolada: o volume produzido e o número de lotes
processados. Pede-se para determinar qual variável apresenta-se com maior associação
em relação aos gastos com manutenção. Deve ser empregado u ajuste por meio de
modelo linear e métodos dos mínimos quadrados.
Volume produzido (um.)
10
15
30
20
5
Número de lotes processados
8
7
1
4
3
Gastos com manutenção ($)
13,00
17,00
28,00
20,00
50
6
9,00
45,00
exercício 5
Os gastos e as receitas das Fábricas Escopetas Ltda. Estão apresentados na tabela
seguinte. Sabendo que o preço de vendas da empresa é igual a $14,00, pede-se para
calcular a margem de contribuição unitária da empresa.
Deve-se ser empregado um ajuste por meio de modelo linear e método dos mínimos
quadrados.
Receitas totais
80,00
90,00
120,00
70,00
100,00
85,00
Gastos Totais
96,00
105,00
130,00
90,00
120,00
100,00
14
Exercício 6
Um pesquisador obteve os seguintes dados de 21 indivíduos da espécie de ave X, onde
os pares de números representam respectivamente a largura da base do bico (cm) e o
volume médio dos itens alimentares (cm3): 126,00/151,00; 134,00/75,00; 22,50/13,50;
241,50/188,50;
233,00/154,00;
183,50/144,50;
19,50/22,00;
244,50/126,00;
32,00/49,50; 268,00/132,50; 276,00/167,00; 30,50/46,00; 299,00/136,50; 96,50/41,00;
180,00/226,50; 176,50/146,00; 190,50/101,50; 170,50/153,50; 185,50/116,00;
202,00/173,00; 27,00/341,00
Utilizando os dados fornecidos acima, descreva o modelo linear para explicar a
associação entre as variáveis ( Largura da base do bico e o volume médio dos itens
alimentares). A equação explica a relação entre as duas variáveis? Justifique.
Exercício 7
Os seguintes dados representam, para 12 indivíduos da espécie W de planta, a altura do
tronco e o número de ramos, respectivamente: 2,13 15,50; 1,21 11,10; 11,00 62,60; 6,00
35,40; 5,60 24,90; 6,91 28,10; 2,97 15,00; 3,35 23,20; 10,39 42,00; 1,10 10,00; 4,36
20,00; 8,00 47,50.
Utilizando os dados fornecidos acima, descreva o modelo linear para explicar a
associação entre a altura do tronco e o número de ramos na espécie W.
A equação explica a relação entre as duas variáveis? Justifique.
Exercício 8
uma empresa fabricante de frutas em caldas deseja avaliar o comportamento do teor de
açucares das frutas com o passar dos dias. Coletou os seguintes valores:
dias
conc. Acucar
1
17,5
2
19,8
5
26,9
8
31,2
12
37,4
16
44,6
20
52,4
24
56,7
Utilizando os dados fornecidos acima, descreva o modelo linear para explicar a
associação entre teor de açucares das frutas com o passar dos dias. Qual é a previsão
para 30 dias do teor de açucar??A equação explica a relação entre as duas variáveis?
Justifique.
15
Respostas:
1 questão:
Resposta: (a) A equação obtida foi igual a y = 1935,8x, 8x – 13719, R² = 0,9778; (b)
Os custos fixos correspondem ao coeficiente linear da equação; no caso , custos fixos
são estimados em aproximadamente $ 13.719,00; (c) O custo variável correspondente
ao coeficiente linear da equação; no caso, os custos variáveis unitários são estimados
em cerca de $ 1.935,80 por tonelada; (d) Como o valor do coeficiente de determinação
foi elevado, R² = 0,9978, a qualidade do ajuste linear pode ser considerada excelente.
2 questão:
Resposta: O ajuste por meio do método dos mínimos quadrados permite obter a
seguinte equação: y = 2,4405x + 19,643, com R² = 0,9931, e onde y representa os
custos e x, o mês. Substituindo o valor do 10º mês (x = 10), é possível estimar custos
aproximadamente iguais a $ 44,05 mil para o décimo mês.
3 questão:
y = 4,1109x – 507,9, com R² = 0,9977, sendo y = lucro e x = produção.pe=124
unidades
4 questão:
Resposta: Analisando a relação entre volume produzido (x) e gastos com manutenção
(y), a equação resultante é igual a y = 0.795x + 4,775, com R² = 0,9985. Analisando a
relação entre número de lotes processados (x) e gastos com manutenção (y), a equação
resultante é igual a y = -0,2871x + 23,388, com R² = 0,0034. Logo, com base nos
valores dos coeficientes de determinação encontrados, a variável que mostra uma forte
associação com os gastos com manutenção é a variável volume produzido.
5 questão:
Resposta: A equação obtida pelo ajuste por meio do método dos mínimos quadrado
revelou o modelo à y = 0.8586x + 28,841 com R² = 0,9659. O custo variável unitário
representa 0,8586 do preço de venda.Com o preço de venda é igual a $14,00, o custo
variável unitário em unidades monetárias é igual a $12,02 (0,8586 x 14). A margem de
contribuição representa a diferença entre o preço e o custos variável unitário, ou
$14,00 - $12,02 = $1,98.
16
Formulas:
a = å y - bå x
n
b = n(å xy) - (å xå y )
n(å x ) - (å x )
2
2
ANALISE DE CORRELAÇÃO
æ æ å xy å x å y ö
.
çç
÷
n
n ø
èè n
r=
éå x æ å x ö ù éå y æ å y ö ù
ê n - ç n ÷ ú.ê n - ç n ÷ ú
è
ø ûë
è
ø û
ë
2
2
2
2
2
COEFICIENTE DE DETERMINAÇÃO
R2 =
17
Orientações para cálculo de Regressão e Correlação na HP 12C Professor: Luis Magno
Menezes Disciplina: Contabilidade Gerencial
A análise de regressão/correlação é facilitada na HP 12C mediante duas funções principais:
·
·
[g] [x, r] – interpola ou extrapola o valor de x com base em outros valores de x e y
armazenados no modo somatório. Também calcula o coeficiente da valor de correlação
r.
[g] [y, r] – interpola ou extrapola o valor de y com base em outros valores de x e y
armazenados no modo somatório. Também calcula o coeficiente da valor de correlação
r.
Exemplo:
Ano
1990 1991 1992 1993 1994 1995
Vendas 58,00 66,00 72,00 77,00 81,00 85,00
Solução:
Iº PASSO
Passo Teclas
01
F[E]
02
58 [enter]
1990 [E+]
03
Descrição
Limpa os registros estatísticos
Digita-se o primeiro par de dados que deve ser acrescentado aos registros
estatísticos. Note que as vendas estão no registrador Y e o ano no
registrador X.
Entra o segundo par de dados
66 [enter]
1991 [E+]
04
72 [enter] Entra o terceiro par de dados
1992 [E+]
05
77 [enter] Entra o quarto par de dados
1993 [E+]
06
81 [enter] Entra o quinto par de dados
1994 [E+]
07
85 [enter] Entra o sexto par de dados
1995 [E+]
* E = Sinal de somatória na HP
IIº PASSO
Para encontrar o modelo de ajuste linear (y = a + b.x):
1. Para achar o coeficiente a: Se x=0; y = a + b.(0), então y = a
Após alimentar os pares na HP 12C, basta teclar: 0 [g] [y,r] à Visor –10.458.6190
2. Para achar o coeficiente b: Se y=0; 0 = a + b.x, então b = -a/x.
Para achar o valor de x na HP 12C basta teclar: 0 [g] [x,r] à Visor 1.978,6577
Temos que dividir o primeiro valor pelo segundo já que b = -a/x, então temos que b = 5,2857
Substituindo os valores de a e b na equação linear:
Y = a + b.x
Y = -10.458,6190 + 5.2857.x
3. Para encontrar o valor de r², basta teclar:
[g] [y,r] [x<>y] à visor 0,9900, esse é o valor de r, para elevar ao quadrado basta teclar [2] [y
elevado a x]. O valor de r² é igual a 0,9801.
4. Para estimar vendas previstas no ano de 1996:
Entra com o ano desejado à [1996]; tecla [g] [y,r] à visor 91,6667
5. Para saber o ano em quer as vendas serão superiores a 125.
Entra com as vendas desejadas à [125]; tecla [g] [x,r] à visor 2005,3063
18
Download

Resumo_2_Regressao