Universidade Federal do Rio de Janeiro NESC- Mestrado em Epidemiologia e Bioestatística Disciplina: Análise de Regressão em Saúde Análise de Sobrevida Análise de sobrevida Definições: Tipo de estudo estudos de coorte ou ensaios clínicos Variável resposta tempo transcorrido entre a entrada do indivíduo no estudo e a ocorrência de um evento a ser relacionado com a exposição ou tratamento. Evento (falha ) pode ser doença, morte, cura etc. Tempo de sobrevida: Medido para cada indivíduo, desde sua entrada no estudo até a ocorrência do "evento" (falha). Indivíduos podem entrar no estudo em qualquer período durante o tempo do estudo. Tania Guillén de Torres Rejane Sobrino Pinheiro Tempo pode ser medido em qualquer unidade dias, semanas, meses, etc. Análise de sobrevida Nesta seção serão apresentadas técnicas de analise de tempos de sobrevida para o caso de um único desfecho de interesse. Exemplos de aplicação: Tempo de remissão, em semanas, para pacientes com Leucemia. Tempo até a ocorrência do evento Métodos especiais de análise Distribuição dos tempos não é gaussiana Tempo, em anos, até a ocorrência de doença coronariana, numa corte de indivíduos sem doença. Tempo, em anos, até a morte numa população de idosos (>60 anos) Tempo (meses) até morte em pacientes transplantados. Dados com censura Observação: É possível avaliar simultaneamente a ocorrência de vários desfechos num único desenho de estudo, por exemplo mortes por Câncer em mulheres (Ca. de colo uterino, Ca. Mama, etc.). Podem ser abordados como um problema de Riscos Competitivos, porem este tópico não faz parte da disciplina. Dado censurado: Censura Indivíduo não sofre o "evento" durante o período de estudo, de modo que o tempo exato de sobrevida não é conhecido. Pacientes de Leucemia em remissão Censura devida a: O indivíduo não experimenta o evento antes do fim do estudo (estudo termina antes da ocorrência do evento) Perda de follow-up (seguimento) durante o período do estudo Saída do estudo por causa de óbito (por outra causa), ou por outra razão (reação adversa à droga) Início do estudo × Fim do estudo Tempo de sobrevida censurado, observado no estudo Indivíduos podem entrar no estudo em qualquer instante depois do início do estudo e pode ser censurado em qualquer instante de tempo durante o estudo. Dados censurados Tempo de sobrevida verdadeiro Exemplo: Leucemia Comparar os tempos de remissão, de um grupo de pacientes com leucemia tratados com a droga 6-mercaptopurine com os tempos de remissão de um grupo controle não tratado. Desfecho (evento) recidiva (recaída) Tempo de sobrevida número de semanas em remissão Grupo controle: 1 1 2 2 3 4 4 5 5 8 8 8 8 11 11 12 12 15 17 22 23 Grupo tratado: 6* 6 6 6 7 9* 10* 10 11* 13 16 17* 19* 20* 22 23 25* 32* 32* 34* 35* * = follow-up incompleto (censura) Grupo tratado: Como comparar os tempos: 6* 6 6 6 7 9* 10* 10 11* 13 16 17* 19* 20* 22 23 25* 32* 32* 34* 35* 1: Controle Obs Tempo recidiva Grupo 1 1 1 1 2 1 1 1 3 2 1 1 4 2 1 1 5 3 1 1 6 4 1 1 7 4 1 1 8 5 1 1 9 5 1 1 10 8 1 1 11 8 1 1 12 8 1 1 13 8 1 1 14 11 1 1 15 11 1 1 16 12 1 1 17 12 1 1 18 15 1 1 19 17 1 1 20 22 1 1 21 23 1 1 2:Tratamento Obs Tempo recidiva Grupo 0 2 22 6 23 6 1 2 24 6 1 2 25 6 1 2 26 7 1 2 27 9 0 2 28 10 0 2 29 10 1 2 30 11 0 2 31 13 1 2 32 16 1 2 33 17 0 2 34 19 0 2 35 20 0 2 36 22 1 2 37 23 1 2 38 25 0 2 39 32 0 2 40 32 0 2 41 34 0 2 42 35 0 2 Interpretação: 6* indivíduo ainda em remissão depois de 6 semanas no estudo, e não observado após este tempo. 6 indivíduos conhecidos como em remissão por 6 semanas, mas tiveram recaída entre a 6a. e a 7a. semanas. Observar: Nenhuma censura no grupo controle (todos "falharam") Parece que o tempo de sobrevida é maior para os do grupo tratado Problema: tempos censurados podem enviesar os resultados Alternativas: 1. Excluir tempos censurados Tempo de sobrevida pelo tratamento muito baixo, por excluir os tempos de remissão mais longos (subestimar). 2. Incluir tempos censurados Ignorar a diferença entre evento e censura. Indivíduos com os tempos de sobrevida censurados tem atualmente tempos de sobrevida maiores do que as semanas representadas no estudo Stata: Stata: 2 - Declarar um banco para Análise de Sobrevida 1 – Abrir o banco File Open.. diretório Média ou mediana do tempo de remissão para cada grupo, ignorando a condição de censura ( ttrt = 17,1 e tcontrole = 8,7 ) banco . use “C:\Data\leucemia.dta" Statistics Survival analysis Setups & utilities Declare data to be survival-time data . desc Contains data from E:\Regressao\Sobrevida\AulaPratica\Bancos\leucemia.dta obs: 42 vars: 4 11 Nov 2009 10:20 size: 336 (99.9% of memory free) ----------------------------------------------------------------------------storage display value variable name type format label variable label ----------------------------------------------------------------------------obs byte %8.0g Obs tempo byte %8.0g Tempo ate a recaida recidiva byte %8.0g recidiva Retorno da doenca grupo byte %8.0g grp Grupos de comparacao ----------------------------------------------------------------------------Sorted by: Comando “stset vartempo varcensura” Declara o banco como sendo um banco com tempos de sobrevida Função de sobrevida: Stata: S(t) = P(T > t) T variável aleatória tempo de sobrevida de um indivíduo t qualquer valor de interesse para a variável aleatória T . stset tempo, failure(recidiva==1) failure event: obs. time interval: exit on or before: recidiva == 1 (0, tempo] failure -----------------------------------------------------------------------------42 total obs. 0 exclusions -----------------------------------------------------------------------------42 obs. remaining, representing 30 failures in single record/single failure data 541 total analysis time at risk, at risk from t = 0 earliest observed entry t = 0 last observed exit t = 35 Ex: Se estamos interessados em avaliar se uma pessoa sobrevive mais de 5 anos após submeter-se a tratamento para câncer S(5) = P(T > 5) A função de sobrevida dá a probabilidade de uma pessoa viver mais do que um tempo específico t = 5. Isto é, S(T) dá a probabilidade de um indivíduo sobreviver além do tempo t (probabilidade de uma variável aleatória T exceder um determinado valor especificado (t). Teoricamente, como t varia de 0 a ∞, a função de sobrevida decai. Grupo controle (nenhuma censura): Se não houver censura: 1 1 2 2 3 4 4 5 5 8 8 8 8 11 11 12 12 15 17 22 23 S (t ) = N° sobreviventes além de 10 semanas N° de indivíduos que sobreviveram mais do que t N° total de indivíduos S (10) = A função é decrescente, ou seja, os valores de S(t) decrescem à medida que t cresce. Para t = 0 S(t) = = S(0) = 1 Para t = ∞ S(t) = 0 8 = 0.381 21 Probabilidade de sobrevida além de 10 semanas N° total de indivíduos 1 N° sobreviventes além de 22 semanas Sempre decrescente S(t) 0 ≤ S(t) ≤ 1 0 S ( 22) = ∞ 1 = 0.048 21 Probabilidade de sobrevida além de 22 semanas N° total de indivíduos Probabilidade de sobrevida para o grupo controle: Probabilidade de sobrevida para o grupo controle: t: 1 1 2 2 3 4 4 5 5 8 8 8 8 11 11 12 12 15 17 22 23 mt = n° de falhas no instante t. S (t ) = P(D1)=2/21 21 N° de sobreviventes no instante t n m t a c u m u la d a S (t) 0 1 2 3 4 5 8 11 12 15 17 22 23 0 2 2 1 2 2 4 2 2 1 1 1 1 0 2 4 5 7 9 13 15 17 18 19 20 21 ( 2 1 - 0 ) /2 1 = 2 1 /2 1 = 1 .0 0 ( 2 1 - 2 ) /2 1 = 1 9 /2 1 = 0 .9 1 ( 2 1 - 4 ) /2 1 = 1 7 /2 1 = 0 .8 1 ( 2 1 - 5 ) /2 1 = 1 6 /2 1 = 0 .7 6 ( 2 1 - 7 ) /2 1 = 1 4 /2 1 = 0 .6 7 ( 2 1 - 9 ) /2 1 = 1 2 /2 1 = 0 .5 7 ( 2 1 - 1 3 ) /2 1 = 8 /2 1 = 0 .3 8 ( 2 1 - 1 5 ) /2 1 = 6 /2 1 = 0 .2 9 ( 2 1 - 1 7 ) /2 1 = 4 /2 1 = 0 .1 9 ( 2 1 - 1 8 ) /2 1 = 3 /2 1 = 0 .1 4 ( 2 1 - 1 9 ) /2 1 = 2 /2 1 = 0 .1 0 ( 2 1 - 2 0 ) /2 1 = 1 /2 1 = 0 .0 5 ( 2 1 - 2 1 ) /2 1 = 0 /2 1 = 0 .0 0 D2 (2) S1 (19) 1/17 17/19 mt D3 (1) S2 (17) P(S2| S1) 2/16 16/17 21 - 0 = 1.00 21 19 19 = 1× = = 0.91 21 21 19 17 17 = × = = 0.81 21 19 21 19 17 16 16 = × × = = 0.76 21 19 17 21 19 17 16 14 14 = × × × = = 0.67 21 21 19 17 16 S(0) = S(1) S(2) S(3) S(4) Curva de sobrevida: É a representação gráfica da Função de sobrevida S(t) no eixo vertical vs. os tempos de sobrevida (t) no eixo horizontal D4 (2) S3 (16) 14/16 t: 1 1 2 2 3 4 4 5 5 8 8 8 8 11 11 12 12 15 17 22 23 S4 (15) ••• P(S4) = P(S1)×P(S2| S1)×P(S3| S2∩ S1) ×P(S4| S1∩ S2∩ S3) Função de Hazard (risco) Densidade instantânea de incidência Risco instantâneo P[t < T < (t + ∆t ) | T > t ] ∆t → 0 ∆t h(t ) = lim Kaplan-Meier survival estimate 0.75 1.00 2/19 P(S1)=19/21 t Taxa de falha condicional 0.25 0.50 Taxa de falha instantânea (falha durante um intervalo de tempo bem pequeno de amplitude ∆t, dado que um indivíduo tenha sobrevivido até o início do intervalo) / ∆t). Função de Hazard: 0.00 S(t) D1 (2) 0 5 10 15 analysis time 20 25 (t) h(t ) = Nº de indivíduos que morreram por unidade de tempo no intervalo (t, t + ∆t) Nº sobreviventes no instante t Exemplo: Stata: h(t) para dados de leucemia (grupo tratado), com ∆t = 1 Statistics 6* 6 6 6 7 9* 10* 10 11* 13 16 17* 19* 20* 22 23 25* 32* 32* 34* 35* Survival analysis Summary statistics, test, & tables Summarize survival-time data n° de recidivas no instante de tempo 6 h ( 6) = 3 = 0.143 21 n° sob risco no início do intervalo de tempo 6 n° de recidivas no instante de tempo 7 . stsum 1 h(7) = = 0.059 17 failure _d: analysis time _t: n° sob risco no início do intervalo de tempo 7 Calcular o hazard - Risco instantâneo dos tempos . stsum, by(trtment) failure _d: analysis time _t: relapse == 1 weeks | incidence no. of |------ Survival time -----| trtment | time at risk rate subjects 25% 50% 75% ---------+--------------------------------------------------------------------0:stand | 182 .1153846 21 4 8 12 1:trt | 359 .0250696 21 13 23 . ---------+--------------------------------------------------------------------total | 541 .0554529 42 6 12 23 recidiva == 1 tempo | incidence no. of |------ Survival time -----| | time at risk rate subjects 25% 50% 75% ---------+--------------------------------------------------------------------total | 541 .0554529 42 6 12 23 Função de Hazard acumulada Graphics Survival analysis graphs Survivor & cumulative hazard functions 1.00 Kaplan-Meier survival estimate Função de Hazard acumulada Graphics Survival analysis graphs Survivor & cumulative hazard functions 0.00 0.25 0.50 0.75 . sts graph failure _d: relapse == 0 1 analysis time _t: weeks 0 10 40 0.00 0.25 0.50 0.75 failure _d: relapse == 0 1 analysis time _t: weeks 30 Kaplan-Meier survival estimates, by trtment 1.00 . sts graph, by( trtment) 20 analysis time 0 10 20 analysis time trtment = 0:stand Função de Hazard acumulada 0.00 1.00 2.00 3.00 4.00 Nelson-Aalen cumulative hazard estimates, by grupo 0 10 20 analysis time grupo = Controle 30 grupo = Tratamento . sts graph, by(grupo) na failure _d: analysis time _t: recidiva == 1 tempo 40 30 trtment = 1:trt 40 Função de sobrevida - dados censurados Função de sobrevida - dados censurados S(t) pode ser derivada de uma função h(t) para dados censurados d6 (3) 3/21 S(0) = 1 - h(0) S(1) = [1-h(0)] x [1 - h(1)] S(2) = [1-h(0)] x [1 - h(1)] x [1 - h(2)] C6 (1) 21 d7 (1) 1/17 S(t) = [1-h(0)] x [1 - h(1)] x ... x [1 - h(t)] C7 S6 (17) d10 (0) (1) Ou: 1/16 16/17 21 - 0 P(S7| S6) = 1.00 21 3 S(6) = 1 × (1 − ) = 0.86 21 3 1 S(7) = 1 × (1 − ) × (1 - ) = 0.806 21 17 S(0) = 1 - h(0) S(1) = S(0) x [1 - h(1)] S(2) = S(1) x [1 - h(2)] S(3) = S(2) x [1 - h(3)] S(0) = S7 C10 (16) (2) S10 (13) S(t) = S(t-1) x [1 - h(t)] Exemplo: Método de Kaplan-Meier Grupo tratado: 6* 6 6 6 7 9* 10* 10 11* 13 16 17* 19* 20* 22 23 25* 32* 32* 34* 35* Chama-se de tabela de vida a uma tabela de probabilidades de sobrevivência acumuladas no período estudado e de curva de sobrevida ao gráfico destas probabilidades versus o tempo de sobrevivência. nj 21 21 mj 0 0 qj 0 0 H(t) = mt 0 / 21 = .000 0 / 21 = .000 S(t) = S(t-1) x [1 – h(t)] 1.0 x [ 1 – 0] = 1.00 1.0 x [ 1 – 0] = 1.00 Kaplan-Meier survival estimate 21 17 16 16 15 3 1 0 0 1 1 0 0 1 1 3 / 21 = .143 1 / 17 = .059 0 / 16 = .000 0 / 16 = .000 1 / 15 = .067 1.0 x [ 1 – 0.143] = 0.857 .857 x [1 - .059] = .806 .806 x [1 – 0] = .806 .806 x [1 – 0] = .806 .806 x [1 – 0.067] = .752 [13-14) 12 1 0 1 / 12 = .083 .752 x [1 - .083] = .690 0.25 [16-17) 11 1 0 1 / 11 = .091 .690 x [1 - .091] = .627 0.75 [6-7) [7-8) [8-9) [9-10) [10-11) 0.00 1.00 tj [0-1) [1-2) 0.50 As probabilidades acumuladas de sobrevida nos períodos são: 0 [22-23) [23-24) [24-25) 7 6 5 1 1 0 0 0 0 1 / 7 = .143 1 / 6 = .167 0 / 5 = .000 .627 x [1 - .143] = .537 .537 x [1 - .167] = .447 .447 x [1 – 0] = .447 [35-36) 1 0 1 0 / 1 = .000 .447 x [1 – 0] 10 20 analysis time 30 P(S ao 1º ano) = P(S1) = 0,87 P(S ao 2º ano) = P(S1)*P(S2/ S1) = 0,67 P(S ao 3º ano) = P(S1)*P(S2/ S1)* P(S3/ S1∩ S2) = 0,60 40 1 1 1 1 0.92 = .447 0.9 0.9 0.87 0.87 [1-2) = 1 semana a < 2 semanas nt = sob risco; mt = recidivas; qt = censurado Somente tem-se que calcular S(t) p/ valores de t onde 1 ou + falhas ocorram (mt). 0.77 0.8 0.8 0.71 0.7 0.7 0.67 0.67 0.6 0.6 0.6 0.6 0 1 2 3 0.5 0 1 2 3 Stata: Statistics Tabelas de Vida Tempos de sobrevida agrupados em intervalos. Kaplan-Meier é uma versão modificada da tabela de vida Survival analysis Summary statistics, test, & tables Life tables for survival data KM usa tempos exatos de "falha" ou intervalos de tempo curtos KM tem poucos ou nenhum empate nos tempos de "falha" . ltable tempo recidiva, survival by(grupo) . ltable tempo recidiva, survival Interval Total Deaths Lost 1 2 42 2 0 2 3 40 2 0 3 4 38 1 0 4 5 37 2 0 5 6 35 2 0 6 7 33 3 1 7 8 29 1 0 8 9 28 4 0 9 10 24 0 1 10 11 23 1 1 11 12 21 2 1 12 13 18 2 0 13 14 16 1 0 15 16 15 1 0 16 17 14 1 0 17 18 13 1 1 19 20 11 0 1 20 21 10 0 1 22 23 9 2 0 23 24 7 2 0 25 26 5 0 1 32 33 4 0 2 34 35 2 0 1 35 36 1 0 1 Survival 0.9524 0.9048 0.8810 0.8333 0.7857 0.7132 0.6886 0.5902 0.5902 0.5640 0.5090 0.4524 0.4241 0.3959 0.3676 0.3382 0.3382 0.3382 0.2630 0.1879 0.1879 0.1879 0.1879 0.1879 Error 0.0329 0.0453 0.0500 0.0575 0.0633 0.0700 0.0717 0.0765 0.0765 0.0775 0.0791 0.0798 0.0796 0.0792 0.0784 0.0775 0.0775 0.0775 0.0763 0.0706 0.0706 0.0706 0.0706 0.0706 [95% Conf. 0.8227 0.7658 0.7373 0.6819 0.6286 0.5505 0.5247 0.4258 0.4258 0.3999 0.3464 0.2934 0.2679 0.2430 0.2187 0.1939 0.1939 0.1939 0.1294 0.0744 0.0744 0.0744 0.0744 0.0744 Int.] 0.9879 0.9631 0.9486 0.9168 0.8822 0.8258 0.8059 0.7221 0.7221 0.6991 0.6504 0.5987 0.5721 0.5450 0.5174 0.4884 0.4884 0.4884 0.4180 0.3410 0.3410 0.3410 0.3410 0.3410 Beg. Std. Interval Total Deaths Lost Survival Error [95% Conf. Int.] ------------------------------------------------------------------------------Controle 1 2 21 2 0 0.9048 0.0641 0.6700 0.9753 2 3 19 2 0 0.8095 0.0857 0.5689 0.9239 3 4 17 1 0 0.7619 0.0929 0.5194 0.8933 4 5 16 2 0 0.6667 0.1029 0.4254 0.8250 5 6 14 2 0 0.5714 0.1080 0.3380 0.7492 8 9 12 4 0 0.3810 0.1060 0.1831 0.5778 11 12 8 2 0 0.2857 0.0986 0.1166 0.4818 12 13 6 2 0 0.1905 0.0857 0.0595 0.3774 15 16 4 1 0 0.1429 0.0764 0.0357 0.3212 17 18 3 1 0 0.0952 0.0641 0.0163 0.2612 22 23 2 1 0 0.0476 0.0465 0.0033 0.1970 23 24 1 1 0 0.0000 . . . Tratamento 6 7 21 3 1 0.8537 0.0781 0.6119 0.9503 7 8 17 1 0 0.8034 0.0882 0.5573 0.9213 9 10 16 0 1 0.8034 0.0882 0.5573 0.9213 10 11 15 1 1 0.7480 0.0980 0.4952 0.8870 11 12 13 0 1 0.7480 0.0980 0.4952 0.8870 13 14 12 1 0 0.6857 0.1078 0.4257 0.8464 16 17 11 1 0 0.6234 0.1146 0.3631 0.8021 17 18 10 0 1 0.6234 0.1146 0.3631 0.8021 19 20 9 0 1 0.6234 0.1146 0.3631 0.8021 20 21 8 0 1 0.6234 0.1146 0.3631 0.8021 22 23 7 1 0 0.5343 0.1283 0.2651 0.7439 23 24 6 1 0 0.4453 0.1343 0.1864 0.6773 25 26 5 0 1 0.4453 0.1343 0.1864 0.6773 32 33 4 0 2 0.4453 0.1343 0.1864 0.6773 34 35 2 0 1 0.4453 0.1343 0.1864 0.6773 35 36 1 0 1 0.4453 0.1343 0.1864 0.6773 ------------------------------------------------------------------------------- Teste Log Rank Compara 2 ou mais curvas de sobrevida (H0 as curvas são "as mesmas") Ordena os tempo de "falhas" dos indivíduos em 2 (ou mais) grupos e atribui postos O número esperado de falhas é calculado para cada intervalo para cada grupo Calcula um χ2 entre as falhas esperadas vs falhas observadas. Assume intervalo de tempo pequeno (ex: 1 dia ou 1 "falha"). estatística do log − rank = (O2− E 2)2 Var (O 2 − E 2) ~χ Teste Log Rank Statistics Survival analysis Summary statistics, test, & tables Test equality of survivor functions 2 (G −1) Onde: (O 2 − E 2) = ∑ (m2 j − e2 j ) G = 2 grupos k j =1 k = número de tempos de falha diferentes G = número de grupos diferente Teste Log Rank Teste Log Rank Exemplo (usando o Stata): Exemplo (usando o Stata): . sts test grupo, logrank . sts test lgwbccat, logrank recidiva == 1 tempo failure _d: relapse == 1 analysis time _t: weeks | Events Events grupo | observed expected -----------+------------------------Controle | 21 10.75 Tratamento | 9 19.25 -----------+------------------------Total | 30 30.00 chi2(1) = Pr>chi2 = 16.79 0.0000 chi2(2) = Pr>chi2 = . sts test trtment, peto failure _d: relapse == 1 analysis time _t: weeks . sts test 26.39 0.0000 lgwbccat, peto Peto-Peto test for equality of survivor functions chi2(1) = Pr>chi2 = 14.08 0.0002 | Events Events Sum of lgwbccat | observed expected ranks ---------+-------------------------------------Low | 4 13.06 -5.4643843 Medium | 10 10.72 -1.2203977 :High | 16 6.21 6.6847821 ---------+-------------------------------------Total | 30 30.00 0 chi2(2) = Pr>chi2 = 1.00 0.75 0 failure _d: relapse == 1 analysis time _t: weeks Peto-Peto test for equality of survivor functions | Events Events Sum of trtment | observed expected ranks --------+-------------------------------------0:stand | 21 10.75 6.3622095 1:trt | 9 19.25 -6.3622095 --------+-------------------------------------Total | 30 30.00 0 0.50 | Events Events lgwbccat | observed expected ---------+------------------------Low | 4 13.06 Medium | 10 10.72 :High | 16 6.21 ---------+------------------------Total | 30 30.00 Log-rank test for equality of survivor functions Kaplan-Meier survival estimates, by lgwbccat 0.25 Log-rank test for equality of survivor functions 0.00 failure _d: analysis time _t: 21.37 0.0000 10 20 analysis time lgwbccat = Low lgwbccat = :High 30 lgwbccat = Medium 40 Exemplo: Sobrevida de mulheres com câncer cervical após a data do diagnóstico Tabelas de vida Função de Hazard (Método atuarial): h(t ) = Estágio I: No. de indivíduos que morrem por unidade de tempo no intervalo 1 No. sobreviventes no instante t − (No. de censuras no intervalo) 2 nt = sob risco; mt = mortes ; qt = censuras Análise de sobrevida - Modelagem Regressão de Cox Como ajustar as curvas de sobrevida do grupo de tratados (expostos) para um ou mais fatores (confundidores)? 1 confundidor: Modelo e Pressupostos Modela os dados usando o hazard ¨força de morbidade ou mortalidade instantânea¨ Pressuposto: 1. Categorizar e comparar as curvas de sobrevida. Exemplo: tratamento = 1 e idade > 55 tratamento = 1 e idade ≤ 55 tratamento = 0 e idade > 55 tratamento = 0 e idade ≤ 55 2. Categorizar e usar o teste log rank. 3. Usar um modelo matemático (existem vários) •Para qualquer tempo t, o hazard entre aqueles expostos a certo fator de risco [h1(t)] é múltiplo de algum hazard de referência [h0(t)] (o hazard entre os não expostos) h1(t) = h0(t) * B h1(t) = h0(t) * e b Mais de 1 confundidor: Modelagem matemática é a escolha mais razoável. Modelo de Hazard Proporcional de Cox HR = h1 (t ) = b e h 0 (t ) Log(HR) = b Informação geral: Seja o conjunto de variáveis explanatórias: X = (X1, X2, ..., Xp) h(t,X) = função de hazard para uma pessoa com um conjunto de X's Modelo de Cox ou de Hazard proporcional é chamado de modelo não paramétrico (ou semi-paramétrico) porque as distribuições subjacentes não são conhecidas Alternativa de modelo paramétrico é correta, quando h0(t) é conhecida. h0(t) = função de hazard base ou basal h(t , X ) = h0 (t )e ∑ β X i i Ex: exponencial, Weibull, Gompertz, etc. h0(t) = não é conhecida no modelo de Cox Modelo paramétrico é preferível se o modelo correto a ser usado é conhecido Observação: log odds basal não é conhecido na regressão logística para estudos caso controle). Modelo de Cox dá aproximadamente a mesma resposta do modelo paramétrico (robusto). Modelo de Cox é o mais comumente utilizado Variáveis no modelo de Cox: Vantagens do modelo de Cox: Variável dependente tempo (até ocorrência do evento ou censura) Variável evento 1 = evento 0 = censura X1, X2, ..., Xp Útil para avaliar o efeito das variáveis explanatórias E's exposição (ões) V's confundidores potenciais W's modificadores de efeito potenciais Variáveis explanatórias podem ser contínuas ou categóricas Pode incluir dados censurados Não é necessário conhecimento da distribuição da função de hazard subjacente (basal) Exemplo: h(t , X ) = h0 (t )e [ β ( trtment ) +γ 1 (log wbcc )+γ 2 ( idade )+δ 1 ( trt x wbc )+δ 2 ( trt x idade )] e∑ β X i i sempre ≥ 0 (apropriado para uma taxa) Fornece mais informação do que o modelo logístico, particularmente para eventos não raros e/ou longos tempos de seguimento. Obs: Não há intercepto Razão de Hazard Razão de Hazard Caso simples: 1 fator de risco Caso simples: 1 covariável trtment: age: 1 = tratamento experimental 0 = tratamento padrão h(t,X) = h0(t)eβ(trtment) X1 = 50 X2 = 50 h(t,X) = h0(t)eβ(age) trtment = 1: h(t,trtment) = h0(t)eβ(1) age = 50: h(t,age) = h0(t)eβ(50) trtment = 0: h(t,trtment) = h0(t)eβ(0) age = 60: h(t,age) = h0(t)eβ(60) h(t ,1) h0 (t )e β (1) Razão de Hazard ( HR ) = = = e β (1−0 ) = e β β (0) h(t ,0) h0 (t )e Razão de Hazard ( HR ) = h(t ,1) h0 (t )e β (60) = = e β (60 −50) = e β *10 ( 50 ) β h(t ,0) h0 (t )e Caso multivariado: (Varias variáveis independentes) X* = conjunto de X's para uma pessoa X = conjunto de X's para outra pessoa HR = h0 (t , X *) ∑ β ( X − X ) =e h0 (t , X ) HR = e i * i i [ β1 ( X 1* − X 1 ) + β 2 ( X 2* − X 2 ) +...+ β k ( X k* − X k )] Observação: análoga à regressão logística, mas possui uma razão de densidade incidência instantânea em vez de log odds Resultado da Regressão de cox dos preditores da incidência de doença coronariana, 3597 indivíduos entre 45 e 65 anos, 1987 a 1994. Washington1 Variável Sexo (masc=1, fem=0) Fumo (sim=1, não=0) Idade55 (idade≥55=1, Idade<55=0) Hipertensão (sim=1, não=0) Hipercolesterolemia (sim=1, não=0) Obesidade (sim=1, não=0) Coeficiente b1 1.2669 0.6803 0.1391 Hazard Ratio 3.55 1.97 1.15 0.5030 0.4552 1.65 1.58 0.1876 1.21 Semelhanças: CHD é uma doença relativamente rara OR ≈ HR As perdas de follow-up e a distribuição dos tempos até a ocorrência do evento são provavelmente não diferenciais entre os grupos (os vieses tendem a cancelar)