ANÁLISE DE SOBREVIVÊNCIA M Eduarda D. S. Matos Coimbra, 19 de Abril de 2010 O que é a análise de sobrevivência? A análise de sobrevivência é um conjunto de processos estatísticos, utilizados na análise dos dados, para a qual a variável de interesse é o tempo que decorre até que um acontecimento se verifique. Calcula-se o tempo de sobrevivência iniciando-o num ponto de partida natural para o estudo (ex: data da cirurgia ou diagnóstico de uma doença) até ao ponto em que o doente alcança o limite de interesse. O tempo pode ser analisado em anos, meses, semanas ou dias, desde o início do “follow-up” até que o acontecimento ocorra Por acontecimento, significamos morte, incidência da doença, recaída/ remissão, cura, ou qualquer experiência de interesse que pode acontecer a uma pessoa (por ex. regresso ao trabalho) Exemplos: • Doentes com leucemia/ tempo em remissão (semanas) • Coorte livre de doença/ tempo até ocorrer um enfarte • População idosa (60+) / tempo até à morte • Transplantes de coração/ tempo até à morte (meses) Na maioria das análises existem dados truncados ou censurados (censored), quando temos informação acerca do tempo de sobrevivência, mas não temos o tempo de sobrevivência exacto, ou seja o doente durante o estudo não alcançou o limite de interesse. EXEMPLO DE DADOS TRUNCADOS OU CENSURADOS Os doentes de um ensaio de um novo medicamento para a infecção de HIV podem permanecer sem SIDA até à conclusão do estudo. Isto pode dever-se ao facto do ensaio acabar num momento em que ainda não tinham contraído SIDA, ou porque se retiraram estes indivíduos do estudo antes de contraírem a doença, ou ainda porque morreram por causas não ligadas à SIDA, antes do final do estudo. Há geralmente três razões para isto acontecer: O acontecimento não se dá antes do fim do estudo A pessoa não é seguida até ao fim A pessoa não continua no estudo porque por exemplo morre (a morte não é o que se está a analisar). Objectivos da análise de sobrevivência Estimar e interpretar sobrevivência e/ou funções de risco (hazard) de dados de sobrevivência Comparar funções de sobrevivência e/ou de risco Avaliar a relação das variáveis explicativas (exploratórias) com o tempo de sobrevivência REPRESENTAÇÃO DE DADOS DE SOBREVIVÊNCIA Pode ser desenhada uma linha horizontal para cada doente, sendo o seu comprimento o tempo de sobrevivência. Desenham-se as linhas da esquerda para a direita e é possível distinguir-se os doentes que alcançam o limite dos que são censurados, através de diferentes símbolos no final da linha. Contudo, estes gráficos não resumem os dados e é difícil obter-se um significado da sobrevivência global. As curvas de sobrevivência são geralmente calculadas pelo método de KaplanMeier Quando se desconhece o tempo exacto de sobrevivência, calculam-se as probabilidades de sobrevivência, através do método actuarial. Muitas vezes, traduz-se a sobrevivência referindo-se às probabilidades de sobrevivência (com intervalos de confiança) em determinados pontos temporais na curva, tal como por exemplo, as taxas de sobrevivência aos 5 anos, em doentes pós tratamento ao cancro da mama. Em alternativa, pode indicar-se a mediana do tempo de sobrevivência (o tempo em que 50% dos indivíduos fizeram progressos). Pode-se pretender verificar o impacto de inúmeros factores de interesse na sobrevivência, tal como por exemplo, o tratamento e a gravidade da doença. Assim podem representar-se as curvas de sobrevivência, de forma separada, para subgrupos de doentes; estas fornecem um meio de se verificar visualmente se os diferentes grupos de doentes alcançam o limite a taxas diferentes. Exemplo: Acontecimento X: morte •O indivíduo A, por exemplo é seguido desde o início do estudo até ter ocorrido o acontecimento de interesse na 5ª semana; o tempo de sobrevivência foi de 5 semanas e não é truncado •O indivíduo B também é observado no início do estudo mas é seguido até ao fim das 12 semanas de estudo sem se ter verificado o acontecimento (morte); o tempo de sobrevivência é truncado, porque apenas podemos dizer que esteve vivo 12 semanas. •O indivíduo C entra no estudo entre a 2ª e a 3ª semana, e é seguido até ter desaparecido à 6ª semana; o tempo de sobrevivência é truncado em 3,5 semanas. •O indivíduo D entra na 4ª semana, e é seguido até ao fim do estudo sem se verificar o acontecimento; o tempo de sobrevivência truncado é de 8 semanas. •O indivíduo E entra no estudo na 3ª semana e é seguida até à 9ª semana, em que é perdido de vista; o seu tempo de sobrevivência truncado é de 6 semanas. •O indivíduo F entra na 8ª semana e é seguido até que decorre o acontecimento à semana 11,5. Tal como o indivíduo A não é truncado, o tempo de sobrevivência é de 3,5 semanas. Assim obteríamos a seguinte tabela Indivíduo Tempo de sobrevivência Morto (1) Truncado (0) A 5 1 B 12 0 C 3,5 0 D 8 0 E 6 0 F 3,5 1 Outro exemplo ID data do diagnostico 1 2 3 4 5 2005/01 2005/04 2005/03 2005/05 2005/02 morte mês da morte 1 1 0 0 0 última observação follow-up 2005/07 2005/09 2005/10 2005/10 2005/08 6 5 7 5 6 FUNÇÃO OU DISTRIBUIÇÃO DE SOBREVIVÊNCIA- É uma função cronológica habitualmente designada pela letra S(t) , que se inicia num determinado momento no tempo, com 100% da população ainda viva e com saúde e nos permite calcular qual a percentagem dessa população ainda viva e com saúde noutros momentos ao longo do tempo. DADOS COMPLETOS O tempo de sobrevivência de 10 doentes é o seguinte 1, 2, 2, 4, 5, 7, 11, 16, 20, 33 1.Construa a tabela pelo método intuitivo. ti ni di si Si (si/N) 1 10 1 9 0,9 2 9 2 7 0,7 4 7 1 6 0,6 5 6 1 5 0,5 7 5 1 4 0,4 11 4 1 3 0,3 16 3 1 2 0,2 20 2 1 1 0,1 33 1 1 0 0,0 O tempo de sobrevivência mediano é de 5 meses ou seja 50% dos doentes têm um tempo de sobrevivência de 5 meses. 2. Construa a tabela de sobrevivência pelo método produto-limite (Kaplan-Meier). n1=N n i+1= n i-d i t0=0 e S0=1 ti ni di qi pi=1- qi Si = Si-1 pi 1 10 1 1/10 9/10 1*9/10=0,9 2 9 2 2/9 7/9 9/10*7/9=7/10=0,7 4 7 1 1/7 6/7 7/10*6/7=6/10=0,6 5 6 1 1/6 5/6 0,5 7 5 1 1/5 4/5 0,4 11 4 1 1/4 3/4 0,3 16 3 1 1/3 2/3 0,2 20 2 1 1/2 1/2 0,1 33 1 1 1/1 0/1 0,0 ti - momento no tempo ni – nº de sobreviventes até ao momento ti di – nº de mortos no instante ti wi – nº de censurados no instante ti qi- probabilidade de morrer no instante ti pi – probabilidade de sobreviver no instante ti si – nº de sobreviventes no instante ti Si– Sobrevivência cumulativa (probabilidade de sobreviver ao ao instante ti ) A sobrevivência no final de cada intervalo é igual ao produto da sobrevivência cumulativa até ao final do intervalo anterior pela sobrevivência condicional nesse intervalo • As curvas de sobrevivência geralmente calculadas pelo método de Kaplan Meier, representam a probabilidade cumulativa (a probabilidade de sobrevivência) de um indivíduo permanecer livre de doença (acontecimento) em qualquer momento posterior à altura base. • A probabilidade de sobrevivência apenas se altera quando ocorre o acontecimento em estudo, sendo a curva resultante numa série de segmentos (curva em escada). •Assim o modelo de Kaplan Meier baseia-se na estimativa das probabilidades condicionais, da taxa de sobrevivência em cada ponto no tempo. • Um dos pressupostos para a realização das tabelas de sobrevivência pelo método produto-limite de Kaplan Meier é que os indivíduos em que os dados são incompletos têm o mesmo risco que os indivíduos em que o acontecimento se verificou. Exemplo 1 – dados completos O tempo de aleitamento, isto é o tempo decorrido desde o nascimento até ao desmame, pode ser considerado como uma variável tempo de sobrevivência Suponha que o tempo até ao desmame, em meses, tenha sido registado para 15 crianças: 12 10 3 5 1 6 8 1 5 2 2 5 8 1 Considerando que não se verificou censura: Represente os tempos de observação das 15 crianças Como representaria uma base de dados para analisar estes dados? Criança tempo status 1 6 1 2 12 1 3 10 1 4 3 1 5 5 1 6 1 1 7 6 1 8 8 1 9 1 1 10 5 1 11 2 1 12 2 1 13 5 1 14 8 1 15 1 1 Construa a tabela de Kaplan- Meier ti ni di qi= di/ ni pi=1- qi Si=Si-1pi 1 15 3 3/15 1-3/15=0,8 0,8 2 12 2 2/12 1-2/12=0,833 0,8*0,833=0,6667 3 10 1 1/10 1-1/10=0,9 0,6667*0,9=0,6000 5 9 3 3/9 1-3/9=0,6667 0,6000*0,6667=0,4 6 6 2 2/6 1-2/6=0,6667 0,4*0,6667=0,2667 8 4 2 2/4 1-2/4=0,5 0,2667*0,5=0,1333 10 2 1 1/2 1-1/2=0,5 0,1333*0,5=0,0667 12 1 1 1/1 1-0 0,0667*0=0,0000 Represente a curva de Kaplan Meier Com base na tabela que criou , responda Qual a probabilidade de uma criança ser amamentada pelo menos até ao sexto mês de vida? S(6) =0,2667 Qual a probabilidade de ser amamentada por mais de 3 meses? S(3)=0,6 Qual a probabilidade de ser amamentada por mais de 10 meses? S(10)=0,0667 Qual foi o tempo mediano de aleitamento? O tempo mediano de aleitamento está entre 3 e 5 meses EXEMPLO 2- Dados censurados A tabela anexa representa o tempo de sobrevivência de 10 doentes 1+, 3, 4+, 5, 5, 6+, 7, 7, 7+, 8+ (+) dados incompletos Construa a tabela de sobrevivência pelo método produto-limite (Kaplan-Meier) ti ni di wi qi pi Si 1 10 0 1 0/10 1 1 3 9 1 0 1/9 8/9 0,889 4 8 0 1 0/8 1 0,889 5 7 2 0 2/7 5/7 0,635 6 5 0 1 0/5 1 0,635 7 4 2 1 2/4 ½ 0,317 8 1 0 1 0/1 1 0,317 ti - momento no tempo ni – nº de sobreviventes até ao momento ti di – nº de mortos no instante ti wi – nº de censurados no instante ti qi- probabilidade de morrer no instante ti pi – probabilidade de sobreviver no instante ti Si– Sobrevivência cumulativa O output do software estatístico SPSS é o seguinte Kaplan-Meier Time Status Cumulative Standard Cumulative Survival Error Events 1 ,00 0 3 1,00 ,8889 ,1048 1 4 ,00 1 5 1,00 2 5 1,00 ,6349 ,1692 3 6 ,00 3 7 1,00 4 7 1,00 ,3175 ,1799 5 7 ,00 5 8 ,00 5 Number of Cases: 10 Survival Time Mean: 6 Median: 7 Censored: 5 Number Remaining 9 8 7 6 5 4 3 2 1 0 ( 50,00%) Events: 5 Standard Error 95% Confidence Interval 1 ( 5; 7 ) 1 ( 5; 9 ) CURVA DE KAPLAN-MEIER SOBREVIVÊNCIA CUMULATIVA 1,0 ,9 ,8 ,7 ,6 ,5 ,4 ,3 ,2 ,1 0,0 0 2 4 TEMPO DE SOBREVIVÊNCIA (MESES) 6 8 10 EXERCÍCIO 1 Os dados seguintes apresentados de acordo com o sexo relativos ao tempo de sobrevivência (em semanas) de 42 doentes com leucemia, retirados de um estudo clínico que pretendia comparar tratamento com placebo. Preencha os espaços vazios da tabela de sobrevivência obtida pelo método produto limite só para o sexo masculino e represente a curva de Kaplan Meier Sexo masculino: 35+, 34+, 32+, 32+, 25+, 23, 22, 20+, 16, 6, 23, 8, 5, 4, 4, 3, 2, 2, 1, 1 Sexo feminino: 19+, 17+, 13, 11, 10+, 10, 9+, 7, 6+, 6, 6, 22, 17, 15, 12, 12, 11, 11, 8, 8, 8, 5 EXERCÍCIO 1 ti ni di wi qi pi Si 1 20 2 0 2/20=0,10 0,90 0,90 2 18 2 0 0,111 0,89 3 16 1 0 0,062 0,937 4 15 2 0 0,133 0,867 0,65 13 1 0 0,077 0,923 0,60 0,89 × 0,90 = 0,80 6 12 1 0 0,083 0,917 0,55 8 11 1 0 0,091 0,909 0,50 16 10 1 0 0,100 0,900 0,45 20 9 0 1 0 1 0,45 0,394 22 8 1 0 0,125 0,875 23 7 2 0 0,286 0,714 25 5 0 1 0 1 32 4 0 2 0 1 34 2 0 1 0 1 35 1 0 1 0 1 MÉTODO ACTUARIAL (CUTLER-EDERER) Pode-se utilizar um método alternativo de cálculo das probabilidades de sobrevivência, mediante uma abordagem da tabela da vida, quando o tempo para se alcançar o limite apenas se conhece num determinado intervalo de tempo (ex: no espaço de um ano). Um dos pressupostos para a realização das tabelas de sobrevivência é que os censurados durante um dado intervalo ocorram aleatoriamente nesse intervalo. EXEMPLO 3 Os dados que se seguem representam o tempo de sobrevivência (em meses) de 63 doentes com linfoma de Hodgkin, separados em dois grupos ( Aassintomáticos; B- com febre ou sudação ou emagrecimento superior a 10%). GRUPO A 3.1+, 4.4+, 6.2, 9.0, 9.9, 14.4, 15.8, 18.5, 27.6+, 28.5, 30.1+, 31.5+, 32.2+, 41.0, 41.8+, 44.5+, 50.6+, 54.3+, 55.0, 60.0+, 60.4+, 63.6+, 63.7+, 63.8+, 66.1+, 68.0+, 68.7+, 68.8+, 70.9+, 71.5+, 74.8+, 75.3+, 75.7+ GRUPO B 2.5, 4.1, 4.6, 6.4, 6.7, 7.4, 7.6, 7.7, 8.8, 13.3, 13.4, 18.3, 19.7, 21.9, 24.7, 27.5, 29.7, 30.1+, 32.9, 33.5, 35.4+, 37.7+, 40.9+, 42.6+, 45.4+, 48.5+, 48.9+, 60.4+, 64.4+, 66.4+ Construa a tabela de sobrevivência pelo método actuarial só para o grupo A Tabela de sobrevivência dos 33 doentes com linfoma de Hodgkin assintomáticos (método actuarial) ti ni dI wi qi pi Si 0-6 33 0 2 0 1 1 6-12 31 3 0 0,097 0,903 0,903 12-18 28 2 0 0,071 0,929 0,839 20-24 26 1 0 0,038 0,962 0,806 24-30 25 1 1 0,041 0,959 0,773 30-36 23 0 3 0 1 0,773 36-42 20 1 1 0,051 0,949 0,734 42-48 18 0 1 0 1 0,734 48-54 17 0 1 0 1 0,734 54-60 16 1 1 0,064 0,936 0,687 60-66 14 0 5 0 1 0,687 66-72 9 0 6 0 1 0,687 72-78 3 0 3 0 1 0,687 78+ 0 0 0 0 1 0,683 Em que q = d n − w/2 Sendo o output Number Entering Interval ,000 30 0 30,000 3 ,10 ,90 ,90 ,05 6,000 27 0 27,000 6 ,22 ,78 ,70 ,08 12,000 21 0 21,000 2 ,10 ,90 ,63 ,09 18,000 19 0 19,000 3 ,16 ,84 ,53 ,09 24,000 16 0 16,000 3 ,19 ,81 ,43 ,09 30,000 13 2 12,000 2 ,17 ,83 ,36 ,09 36,000 9 2 8,000 0 ,00 1,00 ,36 ,09 42,000 7 2 6,000 0 ,00 1,00 ,36 ,09 48,000 5 2 4,000 0 ,00 1,00 ,36 ,09 54,000 3 0 3,000 0 ,00 1,00 ,36 ,09 60,000 3 2 2,000 0 ,00 1,00 ,36 ,09 66,000 1 1 ,500 0 ,00 1,00 ,36 ,09 Interval Start Time Number Exposed to Risk Number of Terminal Events Cumulative Proportion Surviving at End of Interval Number Withdrawing during Interval Proportion Terminating Proportion Surviving Std. Error of Cumulative Proportion Surviving at End of Interval COMPARAÇÃO DE CURVAS DE SOBREVIVÊNCIA Como se pode avaliar se duas ou mais curvas são estatisticamente equivalentes? O teste mais utilizado é designado por teste de log-rank. Quando dizemos que duas curvas de Kaplan Meier não são estatisticamente significativas, queremos dizer , baseados no teste, que compara as duas curvas na globalidade, que não temos evidência para indicar que as curvas de sobrevivência reais (população) são diferentes. No exemplo dos doentes com linfoma de Hodgkin (exemplo 2) fomos comparar as curvas de sobrevivência dos dois grupos A e B. Pelo teste de log rank (estatístico=3,18, gl=1 p=0,07), p>0,05, concluindo-se que as curvas não diferem significativamente, isto é são equivalentes. H0: não há diferença entre as curvas de sobrevivência 2 2 ( O − E ) ( O − E ) 1 1 2 + 2 Teste de Log- rank Χ2 = E1 E2 e1j = ( n1j n1j + n 2 j e2 j = ( ) * ( m1 j + m 2 j ) n2j n1j + n 2 j ) * (m1j + m 2 j ) n 1j n 1j + n No caso de apenas dois grupos Proporção em risco do grupo 1 no total 2 j m1j + m 2 j Nº de mortes nos dois grupos A estatística de Log- rank segue uma distribuição do Quiquadrado com 1 grau de liberdade segundo H0 L IN F O M A D E H O D G IN M É T O D O P R O D U T O L IM IT E D E K A P L A N M E IE R 1,0 ,9 ,8 ,7 Si ,6 ,5 ,4 B ,3 ,2 A ,1 0,0 0 6 12 18 24 30 36 42 T em po de sobre vivênc ia (m eses) 48 54 60 66 72 78 EXERCÍCIO 2 Complete a tabela de sobrevivência para os doentes com leucemia pertencentes ao grupo B, segundo o método actuarial. ti ni di wi qi pi Si 0-6 30 3 0 0,1 0,9 0,9 6-12 27 6 0 0,222 0,778 0,700 21 2 0 0,0952 0,905 0,633 18-24 19 3 0 0,158 0,842 24-30 16 3 0 0,187 0,813 0,433 30-36 13 2 2 0,167 0,833 0,361 36-42 9 0 2 0 1 42-48 7 0 2 0 1 5 0 2 0 1 54-60 3 0 0 0 1 60-66 3 0 2 0 1 66-72 1 0 1 0 1 BIBLIOGRAFIA • Basic and Clinical Biostatistics. Chap 11 Beth Dawson-Saunders and Robert G. Trapp 1990, Prentice-Hall International Inc • Survival Analysis David G. Kleinbaum 1996 Springer-Verlag New-York,Inc