Regressão Logística Modelos de regressão não linear são usados, em geral, em duas situações: casos em que as variáveis respostas são qualitativas e os erros não são normalmente distribuídos. O modelo de regressão não linear logístico binário é utilizado quando a variável resposta é qualitativa com dois resultados possíveis, por exemplo, sobrepeso de crianças (tem sobrepeso ou não tem sobrepeso). Este modelo pode ser estendido quando a variável resposta qualitativa tem mais do que duas categorias; por exemplo, a pressão sanguínea pode ser classificada como alta, normal e baixa. Modelos de regressão com variáveis respostas binárias Em muitos estudos a variável resposta tem duas possibilidades e, assim, pode ser representada pela variável indicadora, recebendo os valores 0 (zero) e 1 (um). Exemplos: 1) o objetivo da análise é verificar a proporção de óbitos neonatais com função da mãe ter diabetes mellitus tipo 1. A variável resposta tem duas possibilidades: a criança morreu ou não. Estes resultados podem ser codificados como 1 e 0 (de acordo com o interesse). 2) Num estudo sobre a participação das esposas no mercado de trabalho, como função da idade da esposa, número de filhos e rendimento do marido, a variável resposta Y foi definida do seguinte modo: a mulher participa no mercado de trabalho ou não. Novamente, estas respostas podem ser codificadas como 1 e 0, respectivamente. Exemplo: Bebês, ao nascer, abaixo de 1750 gramas estão confinados em uma UTI neonatal. Em uma amostra de 223 bebês, 76 apresentaram diagnóstico com displasia broncopulmonar (BPD). A probabilidade de uma criança, nessas condições ter BPD é Análise gráfica: 76 0,341 223 MODELO GERAL Conceitos Modelo de Regressão Múltipla y 0 1x1 2 x 2 p x p Objetivo: Estimar o valor médio da resposta, considerando algumas variáveis explicativas E(Yi ) 0 1x1 2 x 2 Pressuposição: Distribuição Normal p x p Interpretação da função de resposta quando a variável resposta é binária Vamos considerar o modelo de regressão linear simples: Yi 0 1 X i i 1 Yi 0 A resposta esperada é dada por: E(Yi ) 0 1Xi MODELO GERAL E( Yi ) 0 1Xi FUNÇÃO LOGÍSTICA Modelo inicial: p 0 1x sendo x o peso ao nascer. Para que 0 < p < 1, então o modelo é dado por 0 1x e p 0 1x 1 e e3,99120,0043 x pˆ 1 e3,99120,0043 x Para encontrar a probabilidade de que uma criança que pesa 750 gramas no nascimento desenvolva BPD, substitui-se o valor x=750 na função. e3,99120,0043 (750) pˆ 0,6827 3,99120,0043 ( 750 ) 1 e DADOS CATEGORIZADOS Fator: o peso de nascimento do bebê (0 |-- 950, 950 |-- 1350, 1350 |-- 1750) Variável resposta: o bebê está ou não está doente Peso ao nascer (gramas) 0 |-- 950 950 | -- 1350 1350 | -- 1750 Tamanho da amostra 68 80 75 223 Quantidade com BP D 49 18 9 76 p 0,721 0,225 0,120 0,341 Modelo para o conjunto de dados 0 1X1 2X 2 e p 0 1X1 2X 2 1 e 1,992 2,940X1 0,756X 2 e p 1,992 2,940X1 0,756X 2 1 e X1 representa o peso de 0 a 950 gramas e X2 o peso de 950 a 1350 gramas Através desta função posso afirmar que o peso está relacionado com a presença de BPD? Regressão logística 0 1X1 2X 2 e p 0 1X1 2X 2 1 e Interpretamos eb1,..., ebk como uma razão de chances (odds ratio) Regressão logística 1,992 2,940X1 0,756X 2 e p 1,992 2,940X1 0,756X 2 1 e X1 representa o peso de 0 a 950 gramas e X2 o peso de 950 a 1350 gramas Se: eb1 =1, então a chance de x1 apresentar y=1 é a mesma que x3 eb1 >1, então a chance de x1 apresentar y=1 é maior que x3 eb1 <1, então a chance de x1 apresentar y=1 é menor que x3 Analisando a relação entre duas variáveis Variables in the Equation B Step a 1 PESO PESO(1) PESO(2) Constant 2.940 .756 -1.992 S.E. .446 .445 .355 Wald 53.748 43.364 2.885 31.441 df 2 1 1 1 Sig . .000 .000 .089 .000 a. Variable(s) entered on step 1: PESO. O que significa a primeira linha da tabela, referente a PESO ? Qual a interpretação da significância de PESO (1) e PESO (2) ? Exp(B) 18.912 2.129 .136 Analisando a razão de chances (OR) he Equation df 2 1 1 1 Sig. ,000 ,000 ,089 ,000 Exp(B) 18,912 2,129 ,136 95,0% C.I.for EXP(B) Lower Upper 7,884 ,890 45,368 5,092 Interpretação: A chance de uma criança com peso entre 0 e 950 gramas ter a presença da BPD é 18,9 vezes maior do que uma criança com peso entre 1350 e 1750 gramas