1/37
Modelagem
Estatística
Regressão
Regressão
Estudo da forma do relacionamento entre
variáveis quantitativas.
Exemplos:
–
–
–
–
–
–
Peso e altura.
Renda familiar e número de filhos.
Renda e consumo.
Volume de produção e custos.
Risco e rentabilidade de ações.
Gastos com prevenção de defeitos e falhas nos
produtos.
2/37
3/37
Regressão - Objetivos
Predizer
(estimar)
uma
variável
dependente (Y) em função de uma
variável independente (X).
Conhecer o quanto variações de X
podem afetar Y.
4/37
Exemplos
Variável independente,
Variável dependente,
X
Y
Temperatura do forno (0C)
Resistência mecânica da cerâmica
(MPa)
Quantidade de aditivo (%)
Octanagem da gasolina
Renda (R$)
Consumo (R$)
Memória
RAM
computador (Gb)
do
Área construída do imóvel
(m2)
Tempo de resposta do sistema (s)
Preço do imóvel (R$)
5/37
Exemplo de Regressão
A Agência Meteorológica Japonesa
ganhou o prêmio IgNobel de Física (1994)
por causa de um estudo de sete anos
verificando se terremotos são causados
por peixes (catfish) balançando seus
rabos.
6/37
Exemplo 11.2:
Resultados de n = 6
ensaios experimentais:
X = % de aditivo
Y = Índice de octanagem
da gasolina
X
1
2
3
4
5
6
Y
80,5
81,6
82,1
83,7
83,9
85,0
7/37
Exemplo 11.2:
índice de octanagem
86,0
85,0
84,0
83,0
82,0
81,0
80,0
0
1
2
3
4
5
quantidade de aditivo (%)
6
7
8/37
Regressão - Modelo
Predito por X, seY = gundo uma função
yi .x i e i
Parâmetros
+ Efeito aleatório
Regressão
Linear
Simples
9/37
Modelo de regressão
linear simples
Em termos das variáveis: EY X
Em termos dos dados: Yi = + xi + i
Suposições:
– os termos de erro (1, 2, ..., n) são variáveis aleatórias
independentes;
– E{i} = 0;
– V{i} = 2; e
– i tem distribuição normal (i = 1, 2, ..., n).
Pressupostos
10/37
yi .x i e i
Para qualquer valor de xi, os erros (ei) são
independentes e variam aleatoriamente
segundo uma distribuição (normal) com
média zero e variância constante.
11/37
Método dos Mínimos
Quadrados
reta de regressão estimada:
Y
yi
y^i
ponto i
^
y = a +b.x
ei
xi
X
O método dos mínimos quadrados seleciona os valores de a
e b de tal forma que o
somatório
dos
quadrados dos erros
(ei2) é minimizado.
12/37
Método dos mínimos
quadrados para estimar e
Minimizar em relação a e :
S i2 Yi xi
2
S
0
yi
i
S
0
xi
13/37
Método dos mínimos
quadrados para estimar e
Resultado das derivadas parciais:
n. xi yi xi yi
Estimativa de : b =
2
n. xi2 xi
Estimativa de :
a=
y i b xi
n
Reta de regressão construída com os dados:
yˆ a bx
14/37
Exemplo
idade
tempo de reação
a certo estímulo
i
xi
yi
i
xi
yi
1
2
3
4
5
6
7
8
9
10
20
20
20
20
25
25
25
25
30
30
96
92
106
100
98
104
110
101
116
106
11
12
13
14
15
16
17
18
19
20
30
30
35
35
35
35
40
40
40
40
109
100
112
105
118
108
113
112
127
117
15/37
Regressão Linear Simples
diagrama de dispersão
Y
107,5
X
70
10
30
16/37
Regressão Linear Simples
Y
reta de regressão
estimada
^
y = 80,5 + 0,9x
107,5
X
70
10
30
17/37
Teste para o Parâmetro
Ho: = o H1: = o
Distribuição de referência: t de Student, com
(n-2) graus de liberdade.
Estatística:
Sa =
t=
(a - o)
Valor especificado
pelo pesquisador
Sa
(yi - a - bxi)2 ( 1
X2
)
+
n-2
n
(xi - X )2
18/37
Teste para o Parâmetro
Ho: = o H1: = o
Distribuição de referência: t de Student, com
(n-2) graus de liberdade.
Estatística:
Sb =
t=
(b - o)
Sb
(yi - a - bxi)2
(n - 2) [ (xi - X )2 ]
Valor especificado
pelo pesquisador
19/37
Qualidade do ajuste
Ajustou-se uma equação de regressão
entre X e Y. E a qualidade do ajuste?
– análise de variância do modelo
– análise dos resíduos
20/37
Reta de regressão e
resíduos
Valores preditos:
yˆ i a bxi
yi
Resíduos:
yˆi
ei
ei y i yˆ i
xi
yˆ a bx
21/37
Análise de variância do
modelo
Desvio em relação à
média aritmética:
di yi y
Desvio em relação à
reta de regressão
(resíduo da regressão):
ei yi yˆi
yi
ei di
y
xi
yˆ a bx
22/37
Somas de quadrados
yi y
2
=
yˆ i y
2
+
yi yˆ i
2
SQT
SQR
SQE
variação total
variação
explicada
pela equação de
regressão
variação não
explicada
23/37
Somas de quadrados
SQT yi y
2
y
2
yi2
i
n
SQE yi yˆ i yi2 a yi b xi yi
2
SQR SQT SQE
Coeficiente de determinação:
SQR
SQE
R
1
SQT
SQT
2
24/37
Medida da qualidade do
ajuste:
Coeficiente de determinação (R2)
Variação
explicada
R2 =
0
Variação
total
R2
1
=
(y^i - y)2
(yi - y)2
Matematicamente,
R2
é o
quadrado do Coef. de Correlação
de Pearson.
25/37
Teste de significância do
modelo
EY . X
H0 : = 0
e H 1: 0
Distribuição de referência para a
razão f : distribuição F com gl = 1 no
numerador e gl = n – 2 no
denominador.
26/37
Análise da Variância
fonte de
somas de
quadrados
variação quadrados GL médios
razão nível de
F
probab.
Regressão 810,000
Residuo
563,000
25,897
Total
1
18
1373,000
r2 = 0,59
810,0000
31,2778
,000077
27/37
Regressão Linear Simples
Y
reta de regressão
estimada
^
y = 80,5 + 0,9x
107,5
r2 = 0,59
X
70
10
30
28/37
Suposições do modelo
Modelo: Yi = + xi + i
– os termos de erro (1,
2, ..., n) são
variáveis aleatórias
independentes;
– E{i} = 0;
– V{i} = 2; e
– i tem distribuição
normal (i = 1, 2, ..., n).
y
E{Y}= +x
x
29/37
Exercício
Analisar cada conjunto de dados (X,Y)
X1
10
8
13
9
11
14
6
4
12
7
5
Y1
8,04
6,95
7,58
8,81
8,33
9,96
7,24
4,26
10,84
4,82
5,68
X2
10
8
13
9
11
14
6
4
12
7
5
Y2
9,14
8,14
8,74
8,77
9,26
8,1
6,13
3,1
9,13
7,26
4,74
X3
10
8
13
9
11
14
6
4
12
7
5
Y3
7,46
6,77
12,74
7,11
7,81
8,84
6,08
5,39
8,15
6,42
5,73
X4
8
8
8
8
8
8
8
19
8
8
8
Y4
6,58
5,76
7,71
8,84
8,47
7,04
5,25
12,5
5,56
7,91
6,89
30/37
Análise dos resíduos:
um diagnóstico das suposições
do modelo
Valores preditos:
yˆ i a bxi
Resíduos:
ei y i yˆ i
yi
yˆi
ei
xi
yˆ a bx
31/37
Análise dos resíduos
e
y
x
x
Gráfico dos dados:
(xi, yi)
Gráfico dos resíduos:
(xi, ei)
As suposições do modelo parecem satisfeitas?
32/37
Análise dos resíduos
y
resíduo
0
x
x
Gráfico dos dados:
(xi, yi)
Gráfico dos resíduos:
(xi, ei)
As suposições do modelo parecem satisfeitas?
33/37
Análise dos resíduos
y
e
0
x
x
Gráfico dos dados:
(xi, yi)
Gráfico dos resíduos:
(xi, ei)
As suposições do modelo parecem satisfeitas?
34/37
Análise dos resíduos
resíduo
0
x
Gráfico dos resíduos: (xi, ei)
As suposições do modelo parecem satisfeitas?
35/37
Análise dos resíduos
y
e
0
x
x
Gráfico dos dados:
(xi, yi)
Gráfico dos resíduos:
(xi, ei)
As suposições do modelo parecem satisfeitas?
36/37
Regressão
Modelos Linearizáveis
y
y
x
y = + log(x)
log(x)
y = + .log(x)
37/37
Regressão
Modelos Linearizáveis
y
log(y)
x
y = .x
x
log(y) = log( + log(.x