Regressão Logística
Modelos de regressão não linear são usados, em geral, em duas
situações: casos em que as variáveis respostas são qualitativas e
os erros não são normalmente distribuídos.
O modelo de regressão não linear logístico binário é utilizado
quando a variável resposta é qualitativa com dois resultados
possíveis, por exemplo, sobrepeso de crianças (tem sobrepeso ou
não tem sobrepeso).
Este modelo pode ser estendido quando a variável resposta
qualitativa tem mais do que duas categorias; por exemplo, a
pressão sanguínea pode ser classificada como alta, normal e
baixa.
Modelos de regressão com variáveis respostas
binárias
Em muitos estudos a variável resposta tem duas possibilidades e, assim, pode
ser representada pela variável indicadora, recebendo os valores 0 (zero) e 1
(um).
Exemplos:
1) o objetivo da análise é verificar a proporção de óbitos neonatais com
função da mãe ter diabetes mellitus tipo 1. A variável resposta tem duas
possibilidades: a criança morreu ou não. Estes resultados podem ser
codificados como 1 e 0 (de acordo com o interesse).
2) Num estudo sobre a participação das esposas no mercado de trabalho,
como função da idade da esposa, número de filhos e rendimento do marido, a
variável resposta Y foi definida do seguinte modo: a mulher participa no
mercado de trabalho ou não. Novamente, estas respostas podem ser
codificadas como 1 e 0, respectivamente.
Exemplo:
Bebês, ao nascer, abaixo de 1750 gramas estão confinados em uma
UTI neonatal. Em uma amostra de 223 bebês, 76 apresentaram
diagnóstico com displasia broncopulmonar (BPD).
A probabilidade de uma criança, nessas condições ter BPD é
 
Análise gráfica:
76
 0,341
223
MODELO GERAL
Conceitos
Modelo de Regressão Múltipla
y  0  1x1  2 x 2 
 p x p  
Objetivo: Estimar o valor médio da resposta, considerando algumas
variáveis explicativas
E(Yi )  0  1x1  2 x 2 
Pressuposição: Distribuição Normal
 p x p
Interpretação da função de resposta quando a
variável resposta é binária
Vamos considerar o modelo de regressão linear simples:
Yi   0  1 X i   i
1
Yi  
0
A resposta esperada é dada por:
E(Yi )  0  1Xi
MODELO GERAL
E( Yi )  0  1Xi
FUNÇÃO LOGÍSTICA
Modelo inicial:
p  0  1x
sendo x o peso ao nascer. Para que 0 < p < 1, então o modelo é dado por
0 1x
e
p
0 1x
1 e
e3,99120,0043 x
pˆ 
1  e3,99120,0043 x
Para encontrar a probabilidade de que uma criança que pesa 750 gramas
no nascimento desenvolva BPD, substitui-se o valor x=750 na função.
e3,99120,0043 (750)
pˆ 
 0,6827
3,99120,0043 ( 750 )
1 e
DADOS CATEGORIZADOS
Fator: o peso de nascimento do bebê (0 |-- 950, 950 |-- 1350, 1350 |-- 1750)
Variável resposta: o bebê está ou não está doente
Peso ao nascer
(gramas)
0 |-- 950
950 | -- 1350
1350 | -- 1750
Tamanho da
amostra
68
80
75
223
Quantidade
com BP D
49
18
9
76
p
0,721
0,225
0,120
0,341
Modelo para o conjunto de dados
0 1X1 2X 2
e
p
0 1X1 2X 2
1 e
1,992 2,940X1 0,756X 2
e
p
1,992 2,940X1 0,756X 2
1 e
X1 representa o peso de 0 a 950 gramas e X2 o peso de 950 a 1350 gramas
Através desta função posso afirmar que o peso está relacionado com a
presença de BPD?
Regressão logística
0 1X1 2X 2
e
p
0 1X1 2X 2
1 e
Interpretamos
eb1,..., ebk
como uma razão de
chances (odds ratio)
Regressão logística
1,992 2,940X1 0,756X 2
e
p
1,992 2,940X1 0,756X 2
1 e
X1 representa o peso de 0 a 950 gramas e X2 o peso de 950 a 1350 gramas
Se:
eb1 =1, então a chance de x1 apresentar y=1 é a mesma que x3
eb1 >1, então a chance de x1 apresentar y=1 é maior que x3
eb1 <1, então a chance de x1 apresentar y=1 é menor que x3
Analisando a relação entre duas variáveis
Variables in the Equation
B
Step
a
1
PESO
PESO(1)
PESO(2)
Constant
2.940
.756
-1.992
S.E.
.446
.445
.355
Wald
53.748
43.364
2.885
31.441
df
2
1
1
1
Sig .
.000
.000
.089
.000
a. Variable(s) entered on step 1: PESO.
O que significa a primeira linha da tabela, referente a PESO ?
Qual a interpretação da significância de PESO (1) e PESO (2) ?
Exp(B)
18.912
2.129
.136
Analisando a razão de chances (OR)
he Equation
df
2
1
1
1
Sig.
,000
,000
,089
,000
Exp(B)
18,912
2,129
,136
95,0% C.I.for EXP(B)
Lower
Upper
7,884
,890
45,368
5,092
Interpretação: A chance de uma criança com peso entre 0 e 950 gramas
ter a presença da BPD é 18,9 vezes maior do que uma criança com peso
entre 1350 e 1750 gramas
Download

Logística